首页
学习
活动
专区
圈层
工具
发布

兼顾效率、成本与能力,百灵开源旗舰推理模型 Ring-2.6-1T

作者 | 冬梅

5 月 15 日,蚂蚁百灵宣布其旗舰级思考模型 Ring-2.6-1T 正式开源,权重文件同步上线 Hugging Face、ModelScope 平台。此前,该模型上线 OpenRouter,并开放限时免费 API 体验。

Ring-2.6-1T 是一款拥有万亿个参数的旗舰级推理模型,专为现实世界的复杂任务场景而设计,可供开发人员、研究人员和企业环境进行验证、调整和进一步开发。其核心设计逻辑是“按需思考”,模型引入了可调节的 Reasoning Effort 机制,支持 high 与 xhigh 两种推理强度,开发者可以根据任务特性动态分配推理资源。

项目地址:https://huggingface.co/inclusionAI/Ring-2.6-1T

Ring-2.6-1T 的目标并非仅仅追求更大的参数规模,而是为了应对大型模型正在进入的实际生产环境:代理工作流、工程开发、科学研究分析、复杂的业务系统以及企业自动化流程。在这些场景中,模型不仅需要“回答问题”,还需要理解上下文、规划步骤、调用工具、持续执行,并在长期任务中保持稳定性。

Ring-2.6-1T 在三个方面实现了关键升级:

全面增强代理执行能力:从“能够回答”到“能够执行”,在多步骤任务、工具协作、上下文规划和推进复杂工作流程方面表现更稳定。

Reasoning Effort 机制:支持两种推理强度级别,high 和 xhigh,允许开发人员根据任务复杂性灵活调整思考深度,从而在效率、速度和成本之间取得更好的平衡。

异步强化学习训练范式:在训练层面,Ring-2.6-1T 采用异步(Async)强化学习训练架构,将策略采样与参数更新解耦为独立流水线,解决了传统同步训练中 GPU 资源等待、训练吞吐不足的问题,并支持更长周期的持续训练。在此基础上,百灵将此前在 Ring-1T 中验证过的“棒冰算法”引入异步 RL 训练,解决训练不稳定问题。

百灵表示,相关技术细节将在后续技术报告中公开。

根据权威评测,Ring-2.6-1T 的两档模式各有所长。high 模式下,PinchBench 得分 87.60,高于 GPT-5.4 xHigh 和 Gemini-3.1-Pro high,Tau2-Bench Telecom 达到 95.32,Agent 场景执行能力显著。xhigh 模式下,AIME 26 得分 95.83,接近多家头部模型水平;GPQA Diamond 达到 88.27,体现出稳健的科学知识理解与复杂推理能力。

会议推荐

Agent 从 Demo 到工程化还差什么?安全与可信这道坎怎么过?研发体系不重构,还能撑多久?

AICon 上海站 2026,13 大重磅专题已上线,诚挚邀请你登台分享实战经验。AICon 2026,期待与你同行。快来扫码锁定 8 折专属席位或提交演讲议题

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OTIt15YtaPZvtpZLTYrY57mg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

领券