< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

蚂蚁百灵 Ring-2.6-1T 开源 Agent 执行能力全面增强

量子位的朋友们 2026-05-15 15:14:36 来源：量子位

AIME 26 得分 95.83

5 月 15 日，蚂蚁百灵宣布其旗舰级思考模型 Ring-2.6-1T 正式开源，权重文件同步上线 Hugging Face、ModelScope 平台。此前，该模型上线 OpenRouter，并开放限时免费 API 体验。

Ring-2.6-1T 的核心设计逻辑是“按需思考”，模型引入了可调节的 Reasoning Effort 机制，支持 high 与 xhigh 两种推理强度，开发者可以根据任务特性动态分配推理资源。其中，high 模式面向高频 Agent 工作流获得更高效率，适合多轮对话、工具协作与任务拆解；xhigh 模式则面向数学竞赛、科研分析等高难任务，释放能力上限。有开发者表示，这是“工程实用性”的进步。

根据权威评测，Ring-2.6-1T 的两档模式各有所长。high 模式下，PinchBench 得分 87.60，高于 GPT-5.4 xHigh和Gemini-3.1-Pro high，Tau2-Bench Telecom 达到 95.32，Agent 场景执行能力显著。xhigh 模式下，AIME 26 得分 95.83，接近多家头部模型水平；GPQA Diamond 达到 88.27，体现出稳健的科学知识理解与复杂推理能力。

在训练层面，Ring-2.6-1T 采用异步（Async）强化学习训练架构，将策略采样与参数更新解耦为独立流水线，解决了传统同步训练中 GPU 资源等待、训练吞吐不足的问题，并支持更长周期的持续训练。在此基础上，百灵将此前在 Ring-1T 中验证过的“棒冰算法”引入异步 RL 训练，解决训练不稳定问题。百灵表示，相关技术细节将在后续技术报告中公开。

近一个月内，百灵迭代发布并开源了多款模型，覆盖 Ling 语言模型和 Ring 推理模型。记者注意到，相较于追求更大的参数规模或更高的单点分数，百灵更强调“真实生产环境使用”，系列模型集体切入“Token Efficiency”，强调用更少的 token 完成高质量的任务输出。市场对此也有明确反馈，Ling-2.6-flash 的匿名测试版本“Elephant Alpha”上线 OpenRouter 后，连续多日位列 Trending 榜首，日均 tokens 调用量达到100B级别。

百灵蚂蚁

量子位的朋友们

蚂蚁百灵 Ring-2.6-1T 开源 Agent 执行能力全面增强

相关阅读

蚂蚁开源轻量级推理模型Ring-lite，多项Benchmark达到SOTA

如何让大模型感知知识图谱知识？蚂蚁联合实验室：利用多词元并行预测给它“上课”

探营云栖大会黑科技：动嘴就能做网站，给灵感就能制作海报

上线4天下载破百万，蚂蚁CTO：灵光要做AGI时代的“支付宝”

蚂蚁数科CTO王维：可信智能体已成产业规模化应用AI必需基础设施

大模型掌握人类空间思考能力！三阶段训练框架学会“边画边想”，5个基准平均提升18.4%

热门文章

云计算一哥，让小鹏、Kimi和猎豹都爽了一把

DeepSeek缺Agent人才缺疯了！负责人各种贴广告

马斯克又盯上AI基建：特斯拉要卖“算力积木”了

马斯克预测GLM明年Q1追平Fable，智谱唐杰：没那么久

科大讯飞发布企业服务Claw平台：一句话搞定需求到方案全流程