扫码关注量子位
超越OpenAI Deep Research、DeepSeek-V3.1
最强版本450B MoE,激活参数35B
官方:大招还在后面
兼容SFT、RL训练方法
ZeroSearch:一种无需与真实搜索引擎交互的强化学习框架
通义千问(Qwen-72B)表现抢眼,以73.6的综合得分在所有预训练模型中排名第一。