首页
资讯
数码
智能车
智库
活动
MEET大会
AIGC
扫码关注量子位
陈丹琦
陈丹琦团队揭Transformer内部原理:另辟蹊径,从构建初代聊天机器人入手
数据集/架构/训练全都新来一遍
一水
2024-07-18
Transformer
陈丹琦
陈丹琦团队新作:Llama-2上下文扩展至128k,10倍吞吐量仅需1/6内存
任何仅解码器架构模型都适用
丰色
2024-02-29
大模型
陈丹琦
陈丹琦团队新作:数据量砍95%,大模型性能更强了!Less is More
数据选择算法LESS
白交
2024-02-10
大模型
陈丹琦
陈丹琦ACL学术报告来了!详解大模型「外挂」数据库7大方向3大挑战,3小时干货满满
突破大模型自身瓶颈
萧箫
2023-07-10
大模型
数据库
陈丹琦
陈丹琦带队全员女将发新论文!提出AI消除性别偏见新方法,适用于任何模型 | EMNLP 2022
方法已开源
Pine
2022-12-08
开源
陈丹琦
陈丹琦带着清华特奖学弟发布新成果:打破谷歌BERT提出的训练规律!这个庆祝方式太学神了吧
进一步挖掘NLP大模型潜力
萧箫
2022-02-17
人工智能
清华
陈丹琦
陈丹琦团队最新论文:受GPT-3启发,用小样本学习给语言模型做微调,性能最高提升30%
共同一作之一为清华特奖得主高天宇
鱼羊
2021-01-04
小样本学习
普林斯顿
陈丹琦
高天宇
加载更多
热门文章
谷歌揭秘大模型不会数r原因:嵌入维度是关键,不止分词器问题
2024-09-04
三星高管剧透GPT-5:3-5万亿参数,7000块B100训练
2024-09-05
开源大模型新王干翻GPT-4o,新技术可纠正自己幻觉,数学99.2分刷爆测试集
2024-09-06
异构计算+高性能低功耗NPU,高通正在推动终端侧生成式AI发展
2024-09-06
当心被AI“洗脑”!MIT最新研究:大模型成功给人类植入错误记忆
2024-09-06