"推理模型"最新资讯 | 量子位

Qwen又立功，全球最快开源模型诞生，超2000 tokens/秒！

仅32B大小

十三 2025-09-10

K2 Think Qwen 开源模型推理模型

Qwen紧追OpenAI开源4B端侧大模型，AIME25得分超越Claude 4 Opus

“这下没人谈论OpenAI昨天开源了啥”

衡宇 2025-08-07

Qwen 开源推理模型

刚刚，OpenAI开源2个推理模型：笔记本/手机就能跑，性能接近o4-mini

技术博客也已发布

十三 2025-08-06

OpenAI 开源模型推理模型

4B小模型数学推理首超Claude 4，700步RL训练逼近235B性能 | 港大&字节Seed&复旦

一种用在高级推理模型上Scaling RL的后训练方法

不圆 2025-07-09

Scaling RL 强化学习推理模型

数学题干带猫AI就不会了！错误率翻300%，DeepSeek、o1都不能幸免

Token消耗也暴增

克雷西 2025-07-05

推理模型

蚂蚁开源轻量级推理模型Ring-lite，多项Benchmark达到SOTA

首创 C3PO 强化学习训练方法

白交 2025-06-23

推理模型蚂蚁

新“SOTA”推理模型避战Qwen和R1？欧版OpenAI被喷麻了

闻乐 2025-06-11

Mistral AI 推理模型

苹果炮轰推理模型全是假思考！4个游戏戳破神话，o3/DeepSeek高难度全崩溃

网友：自己落后还要酸别人

西风 2025-06-08

推理模型苹果

不要思考过程，推理模型能力能够更强丨UC伯克利等最新研究

是不是有点反常识？

衡宇 2025-04-29

UC伯克利推理模型

英伟达H20不让用？全国产算力推理模型升级，4张华为卡即可部署

有三大技术创新

白交 2025-04-22

华为推理模型讯飞

最强32B中文推理大模型易主：开源免费商用，1/20 DeepSeek-R1参数量SOTA，权重代码数据集全开源

明敏 2025-04-13

推理模型昆仑万维

一句话让DeepSeek思考停不下来，北大团队：这是针对AI的DDoS攻击

过度推理攻击，会导致GPU资源大量占用

克雷西 2025-02-28

推理模型

Claude 4被曝发布在即！被DeepSeek逼得都把大招拿出来了

通用+推理二合一，手动调节思考时长

衡宇 2025-02-14

Claude 大模型推理模型

o3拿下IOI 2024金牌！新论文公布RL秘诀：AI自己设计测试时推理策略，无需人类干预

竞赛编程，推理模型新战场

衡宇 2025-02-12

o3 OpenAI 推理模型

推理模型新路线开源！与DeepSeek截然不同，抛弃思维链不用人类语言思考

能捕捉到难以用语言表达的推理类型

梦晨 2025-02-11

推理模型

成本不到150元！李飞飞等26分钟训出个推理模型，媲美o1和R1，秘诀：用蒸馏

已在GitHub开源

衡宇 2025-02-07

推理模型李飞飞模型蒸馏

国内数学最强！实测讯飞版o1：上能打奥赛卷高考，下能辅导寒假作业

“三个第一”，打出了差异化优势

白交 2025-01-15

推理模型科大讯飞

智谱版o1终于也来了：直接拿下考研数学，一句话就能做小游戏！

赶在2024年的最后一天

十三 2024-12-31

o1大模型推理模型智谱

谷歌版o1突发即屠榜！思考速度比所有模型快5倍，能解摩斯代码，数学物理秒秒钟解决

第一波实测来了

白交 2024-12-20

o1 大模型推理模型谷歌

推理模型

Qwen又立功，全球最快开源模型诞生，超2000 tokens/秒！

Qwen紧追OpenAI开源4B端侧大模型，AIME25得分超越Claude 4 Opus

刚刚，OpenAI开源2个推理模型：笔记本/手机就能跑，性能接近o4-mini

4B小模型数学推理首超Claude 4，700步RL训练逼近235B性能 | 港大&字节Seed&复旦

数学题干带猫AI就不会了！错误率翻300%，DeepSeek、o1都不能幸免

蚂蚁开源轻量级推理模型Ring-lite，多项Benchmark达到SOTA

新“SOTA”推理模型避战Qwen和R1？欧版OpenAI被喷麻了

苹果炮轰推理模型全是假思考！4个游戏戳破神话，o3/DeepSeek高难度全崩溃

不要思考过程，推理模型能力能够更强丨UC伯克利等最新研究

英伟达H20不让用？全国产算力推理模型升级，4张华为卡即可部署

最强32B中文推理大模型易主：开源免费商用，1/20 DeepSeek-R1参数量SOTA，权重代码数据集全开源

一句话让DeepSeek思考停不下来，北大团队：这是针对AI的DDoS攻击

Claude 4被曝发布在即！被DeepSeek逼得都把大招拿出来了

o3拿下IOI 2024金牌！新论文公布RL秘诀：AI自己设计测试时推理策略，无需人类干预

推理模型新路线开源！与DeepSeek截然不同，抛弃思维链不用人类语言思考

成本不到150元！李飞飞等26分钟训出个推理模型，媲美o1和R1，秘诀：用蒸馏

国内数学最强！实测讯飞版o1：上能打奥赛卷高考，下能辅导寒假作业

智谱版o1终于也来了：直接拿下考研数学，一句话就能做小游戏！

谷歌版o1突发即屠榜！思考速度比所有模型快5倍，能解摩斯代码，数学物理秒秒钟解决

热门文章

谷歌智能体发力：增强版Gemini Deep Research和专属API都来了

中国机器人比赛应急救援，美国网友Reddit破防：我们还在给机器狗化妆拍段子

马斯克霸气回怼Waymo：连对抗特斯拉的机会都没有

张亚勤院士：基础大模型最终不超过10个，十年后机器人比人多 | MEET2026

GPT-5.2果然反超谷歌Gemini 3 Pro！北大数院校友核心贡献