陈丹琦

陈丹琦有了个公司邮箱，北大翁荔同款

被曝加盟Thinking Machines

白交 2025-08-28

Thinking Machines Lab 陈丹琦

打脸！GPT-4o输出长度8k都勉强，陈丹琦团队新基准测试：所有模型输出都低于标称长度

LLM生成长段回复的能力还有待加强

奇月 2025-01-15

LLM 陈丹琦

陈丹琦团队降本大法又来了：数据砍掉三分之一，性能却完全不减

一作高天宇

白交 2025-01-07

大模型陈丹琦高天宇

陈丹琦团队揭Transformer内部原理：另辟蹊径，从构建初代聊天机器人入手

数据集/架构/训练全都新来一遍

一水 2024-07-18

Transformer 陈丹琦

陈丹琦团队新作：Llama-2上下文扩展至128k，10倍吞吐量仅需1/6内存

任何仅解码器架构模型都适用

丰色 2024-02-29

大模型陈丹琦

陈丹琦团队新作：数据量砍95%，大模型性能更强了！Less is More

数据选择算法LESS

白交 2024-02-10

大模型陈丹琦

陈丹琦ACL学术报告来了！详解大模型「外挂」数据库7大方向3大挑战，3小时干货满满

突破大模型自身瓶颈

萧箫 2023-07-10

大模型数据库陈丹琦

陈丹琦带队全员女将发新论文！提出AI消除性别偏见新方法，适用于任何模型 | EMNLP 2022

方法已开源

Pine 2022-12-08

开源陈丹琦

陈丹琦带着清华特奖学弟发布新成果：打破谷歌BERT提出的训练规律！这个庆祝方式太学神了吧

进一步挖掘NLP大模型潜力

萧箫 2022-02-17

人工智能清华陈丹琦

陈丹琦团队最新论文：受GPT-3启发，用小样本学习给语言模型做微调，性能最高提升30%

共同一作之一为清华特奖得主高天宇

鱼羊 2021-01-04

小样本学习普林斯顿陈丹琦高天宇

陈丹琦有了个公司邮箱，北大翁荔同款

打脸！GPT-4o输出长度8k都勉强，陈丹琦团队新基准测试：所有模型输出都低于标称长度

陈丹琦团队降本大法又来了：数据砍掉三分之一，性能却完全不减

陈丹琦团队揭Transformer内部原理：另辟蹊径，从构建初代聊天机器人入手

陈丹琦团队新作：Llama-2上下文扩展至128k，10倍吞吐量仅需1/6内存

陈丹琦团队新作：数据量砍95%，大模型性能更强了！Less is More

陈丹琦ACL学术报告来了！详解大模型「外挂」数据库7大方向3大挑战，3小时干货满满

陈丹琦带队全员女将发新论文！提出AI消除性别偏见新方法，适用于任何模型 | EMNLP 2022

陈丹琦带着清华特奖学弟发布新成果：打破谷歌BERT提出的训练规律！这个庆祝方式太学神了吧

陈丹琦团队最新论文：受GPT-3启发，用小样本学习给语言模型做微调，性能最高提升30%

热门文章

智能体政策新闻相关背景和简要解读

合肥又押中AI独角兽：多模态赛道，3个月融了21亿

长内容创作者苦AI失忆久矣，这个新Agent漂亮填坑！门槛低到只需要会用键盘打字

国产世界模型登顶李飞飞团队榜单！适配国产昇腾算力、代码权重全开源

世界模型“六小龙”在WAIC吵起来了！行业红利就在非共识里