"LLM"最新资讯 | 量子位

LLM强化学习新框架！UCSD多智能体训练框架让LLM工具调用能力暴增5.8倍

结合树状采样与角色化奖励机制

西风 2025-11-08

LLM 强化学习

不用跟AI客气了！新研究：语气越粗鲁回答正确率越高

真不用太礼貌，骂得越狠，答得越准！

闻乐 2025-10-14

GPT LLM

李飞飞一年前究竟说了啥？怎么又火了

大模型的局限在……

闻乐 2025-09-11

LLM 李飞飞空间智能

ChatGPT后遗症来了！人类日常聊天越来越AI化

2210万数据显示用词习惯大变样

闻乐 2025-08-28

ChatGPT LLM

斯坦福大模型推理课免费了，谷歌推理团队创始人主讲

DeepMind推理专家分享如何提升大模型推理能力

闻乐 2025-07-25

DeepMind LLM 斯坦福

只因一个“：”，大模型全军覆没

LLM会被表面内容操纵，产生假阳性结果

鹭羽 2025-07-15

LLM 奖励模型

别跟LLM太交心！斯坦福新研究：AI不能完全取代人类心理治疗师

AI被爆“过度谄媚”，迎合用户妄想

闻乐 2025-07-13

LLM 斯坦福

田渊栋：连续思维链效率更高，可同时编码多个路径，“叠加态”式并行搜索

闻乐 2025-06-19

LLM 田渊栋

大模型全员0分！谢赛宁领衔华人团队，最新编程竞赛基准出炉，题目每日更新禁止刷题

闻乐 2025-06-19

LLM 谢赛宁

一句话生成任务专属LoRA！Transformer作者创业公司颠覆LLM微调

能够动态调制大模型的超网络架构

鹭羽 2025-06-13

LLM LoRA Transformer

MSRA清北推出强化预训练！取代传统自监督，14B模型媲美32B

将强化学习深度融入LLM预训练阶段

鹭羽 2025-06-11

LLM 强化学习预处理

强化学习之父：LLM主导只是暂时，扩展计算才是正解

模仿人类思维方式，只能带来短期的性能提升

鹭羽 2025-06-10

LLM 强化学习扩展计算

不是视频模型“学习”慢，而是LLM走捷径｜18万引大牛Sergey Levine

闻乐 2025-06-10

LLM

大模型能够自发形成“人类思维地图”！Nature子刊重磅研究揭示多模态大模型类脑机制

大模型内部存在着类似人类对现实世界概念的理解

西风 2025-06-10

LLM 模型思维

首次解释LLM如何推理反思！西北大学谷歌新框架：引入贝叶斯自适应强化学习，数学推理全面提升

闻乐 2025-06-02

LLM

华为攻克AI推理「想太多」问题！新方法让大模型推理提速60%，准确率还高了

闻乐 2025-05-30

LLM

阿里通义发布并行计算新策略：1.6B等效4.4B，内存消耗骤降95%

闻乐 2025-05-28

LLM 并行计算

AI遭遇灵魂拷问！这道题所有模型集体翻车，网友：我也不会啊

闻乐 2025-05-19

LLM 图像推理

首个奖励模型评分基准！清华复旦港科大联合攻克AI评委“偏科”

评估奖励模型区分微妙变化和抵抗风格偏差的能力

鹭羽 2025-05-13

LLM 基准测试奖励模型

挑战AI数学推理极限！大规模形式化数学基准FormalMATH发布，最强模型成功率仅16%

闻乐 2025-05-08

LLM 数学推理

LLM