兼顾效率、成本与能力，百灵开源旗舰推理模型 Ring-2.6-1T

文章来源：企鹅号 - AI前线

作者 | 冬梅

5 月 15 日，蚂蚁百灵宣布其旗舰级思考模型 Ring-2.6-1T 正式开源，权重文件同步上线 Hugging Face、ModelScope 平台。此前，该模型上线 OpenRouter，并开放限时免费 API 体验。

Ring-2.6-1T 是一款拥有万亿个参数的旗舰级推理模型，专为现实世界的复杂任务场景而设计，可供开发人员、研究人员和企业环境进行验证、调整和进一步开发。其核心设计逻辑是“按需思考”，模型引入了可调节的 Reasoning Effort 机制，支持 high 与 xhigh 两种推理强度，开发者可以根据任务特性动态分配推理资源。

项目地址：https://huggingface.co/inclusionAI/Ring-2.6-1T

Ring-2.6-1T 的目标并非仅仅追求更大的参数规模，而是为了应对大型模型正在进入的实际生产环境：代理工作流、工程开发、科学研究分析、复杂的业务系统以及企业自动化流程。在这些场景中，模型不仅需要“回答问题”，还需要理解上下文、规划步骤、调用工具、持续执行，并在长期任务中保持稳定性。

Ring-2.6-1T 在三个方面实现了关键升级：

全面增强代理执行能力：从“能够回答”到“能够执行”，在多步骤任务、工具协作、上下文规划和推进复杂工作流程方面表现更稳定。

Reasoning Effort 机制：支持两种推理强度级别，high 和 xhigh，允许开发人员根据任务复杂性灵活调整思考深度，从而在效率、速度和成本之间取得更好的平衡。

异步强化学习训练范式：在训练层面，Ring-2.6-1T 采用异步（Async）强化学习训练架构，将策略采样与参数更新解耦为独立流水线，解决了传统同步训练中 GPU 资源等待、训练吞吐不足的问题，并支持更长周期的持续训练。在此基础上，百灵将此前在 Ring-1T 中验证过的“棒冰算法”引入异步 RL 训练，解决训练不稳定问题。

百灵表示，相关技术细节将在后续技术报告中公开。

根据权威评测，Ring-2.6-1T 的两档模式各有所长。high 模式下，PinchBench 得分 87.60，高于 GPT-5.4 xHigh 和 Gemini-3.1-Pro high，Tau2-Bench Telecom 达到 95.32，Agent 场景执行能力显著。xhigh 模式下，AIME 26 得分 95.83，接近多家头部模型水平；GPQA Diamond 达到 88.27，体现出稳健的科学知识理解与复杂推理能力。

会议推荐

Agent 从 Demo 到工程化还差什么？安全与可信这道坎怎么过？研发体系不重构，还能撑多久？

AICon 上海站 2026，13 大重磅专题已上线，诚挚邀请你登台分享实战经验。AICon 2026，期待与你同行。快来扫码锁定 8 折专属席位或提交演讲议题

发表于: 2026-05-182026-05-18 15:40:28
原文链接：https://page.om.qq.com/page/OTIt15YtaPZvtpZLTYrY57mg0
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

兼顾效率、成本与能力，百灵开源旗舰推理模型 Ring-2.6-1T

相关快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐