首页
资讯
智能车
智库
活动
MEET大会
AIGC
扫码关注量子位
RLVR
这些大神在Meta的论文看一篇少一篇了
为什么RL训练明明带来巨大性能提升,却只改变了极少数参数?
梦晨
2025-11-17
RLVR
1.5B刷新数学代码SOTA!快手&清华精细化Token管理,LLM推理能力飙升
“怎么学”可能比“学了多少”更重要
不圆
2025-07-31
RLVR
开源
快手
清华
加载更多
热门文章
从Seedance 2.0到AI天团!海淀何以“生成”全球爆款——
2026-02-15
“产业出题·科技答题” 2026全球开发者先锋大会正式启动
2026-02-15
最强开源大模型除夕登场!397B参数千问3.5超越Gemini 3,百万Tokens低至8毛
2026-02-16
鲁棒RL赋能AI编程!破局企业数据噪声难题,同等算力训出更好模型
2026-02-16
春晚张杰《驭风歌》背后的马,是Seedance 2.0做的!
2026-02-17