首页
资讯
智能车
智库
活动
MEET大会
AIGC
扫码关注量子位
预处理
MSRA清北推出强化预训练!取代传统自监督,14B模型媲美32B
将强化学习深度融入LLM预训练阶段
鹭羽
2025-06-11
LLM
强化学习
预处理
加载更多
热门文章
OpenAI又曝出内讧了!IPO前夜高层大换血
2026-04-06
让离线强化学习从「局部描摹」变「全局布局」丨ICLR’26
2026-04-06
Meta员工空转AI只为浪费token!烧的多挣的多,日均消耗2万亿
2026-04-07
卡帕西没做完的,开源社区48小时搞定了!完全体知识库,token省70倍
2026-04-07
具身Scaling Law押对了!独角兽新品1小时学会新任务,重复1800次成功率99%
2026-04-06