IT之家 4 月 30 日消息,蚂蚁集团旗下的百灵大模型今日宣布,今天将 Ling-2.6-1T 正式开源。 官方表示,Ling-2.6-1T 并不是为了单纯追求更长的思考链,或制造更强的“参数规模体感”,而是面向真实复杂任务,系统性优化模型的智效比、指令执行、工具适配、长上下文承接和工程任务处理能力。该模型重点解决三个问题: 在更低 Token 开销下保持强综合智能: 依托 MLA 与 Linear Attention 的 Hybrid 架构创新,结合抑制“过程冗余”的强化奖励策略,Ling-2.6-1T 在保持 1T 参数能力上限的同时,减少对冗长思考链的依赖,以更高效的“快思考”机制直达结果,从而压缩同等智能水平下的输出成本。 在复杂任务中实现更可靠的多步执行: 在 Agent、Coding 和工作流场景中,模型需要的不只是单点回答能力,而是对指令、工具、上下文和中间状态的持续把控,在噪声环境下的推理与精准作答。Ling-2.6-1T 加强对复合型任务的学习,在 AIME26、SWE-bench Verified、BFCL-V4 、TAU2-Bench、IFBench 等执行类基准上达到开源 SOTA 水平,展现出面向复杂任务的综合执行能力。 让万亿级模型真正进入开发者和企业的生产工作流: Ling-2.6-1T 具备从代码生成到缺陷修复的完整工程落地能力,并与主流 Agent 框架高度兼容,适用于多工具、多步骤、多约束的复杂场景。它的目标不是停留在单次演示,而是成为真实业务系统中可部署、可协同、可持续运行的模型能力底座。 ▲ Ling-2.6-1T 以 16M tokens 完成 Artificial Analysis 完整评测 官方还表示,为支持更多开发者体验与评测 Ling-2.6-1T,将 OpenRouter 平台 的免费 API 调用服务延期一周 。 IT之家附开源链接如下: Hugging Face : https://huggingface.co/inclusionAI/Ling-2.6-1T ModelScope : https://www.modelscope.cn/models/inclusionAI/Ling-2.6-1T 相关阅读: 《 蚂蚁百灵万亿旗舰模型 Ling-2.6-1T 发布:主打“快思考”,对标 GPT-5.4 非推理版 》
IT之家 4 月 29 日消息,蚂蚁集团旗下的百灵大模型今日宣布, Ling-2.6-flash 正式开源 。同步提供 BF16、FP8、INT4 等多个版本,方便开发者根据不同硬件环境、推理成本和部署需求灵活选择。 Ling-2.6-flash 是一款总参数量 104B、激活参数 7.4B 的 Instruct 模型,两周前以 Elephant Alpha 的匿名身份登陆 OpenRouter。 官方表示,过去两周里持续收集来自开发者的真实反馈,并针对 Ling-2.6-flash 的使用体验进行了多轮优化, 进一步改善了中英文自然切换能力,并提升了其在主流 Coding 框架中的适配效果 。 据介绍,Ling-2.6-flash 的核心能力体现在三个方面: 混合线性架构,释放推理效率: 通过引入混合线性架构,模型从底层优化计算效率,在 4 卡 H20 条件下推理速度最快可达到 340 tokens/s ,Prefill 吞吐达到 Nemotron-3-Super 的 2.2 倍 Token 效率优化,提升智效比: 在训练过程中对 Token 效率进行了针对性校准,力求以更精简的输出完成既定目标。在 Artificial Analysis 的完整评测中,Ling-2.6-flash 仅消耗 15M tokens ,约为 Nemotron-3-Super 等模型的 1/10 面向 Agent 场景进行定向增强: 针对当前需求最旺盛的 Agent 应用,在工具调用、多步规划与任务执行能力上持续打磨,使模型在 BFCL-V4、TAU2-bench、SWE-bench Verified、Claw-Eval、PinchBench 等评测中,即使面对激活参数更大的模型,依然能够取得相近甚至 SOTA 级别的表现 IT之家附开源链接如下: Hugging Face : https://huggingface.co/inclusionAI/Ling-2.6-flash ModelScope : https://www.modelscope.cn/models/inclusionAI/Ling-2.6-flash
IT之家 4 月 24 日消息,蚂蚁集团旗下百灵大模型团队正式发布面向即时任务执行的万亿级综合旗舰模型 ——Ling-2.6-1T。 Ling-2.6-1T 采用了 MLA(Multi-head Latent Attention)与 LinearAttention 的混合架构设计,核心思路是摒弃行业内普遍追求的“慢思考”多步推理模式,转而以“快思考”机制实现高效推断,仅凭极低的 Token 开销直达结果,从而显著压缩输出成本和推理延迟。 这一技术路线在万亿参数量级的大模型中较为罕见,也标志着蚂蚁百灵在模型效率与智能能力之间寻求了一种新的平衡。 据官方介绍,此前的旗舰模型 Ling-1T 便已在受限输出 Token 条件下于多项复杂推理榜单上达到 SOTA 水平,而 Ling-2.6-1T 则在此基础上进一步强化了效率维度的突破。 在性能表现方面,Ling-2.6-1T 的能力提升相比早期旗舰 Ling-1T 实现了全方位的跃迁。根据 Artificial Analysis 的评测数据,其综合智能水平已与 GPT-5.4(非推理模式)处于同一档次。 在具体基准测试中,该模型在高难度推理任务 AIME2026 上显著领先于其他非思考型模型,展现出强劲的瞬时复杂问题求解能力。 在 Agent 执行能力方面,Ling-2.6-1T 在 SWE‑bench Verified、TAU2‑Bench、BFCL‑V4 等多个主流榜单中位居前列,无论是从代码生成到缺陷修复的完整工程流,还是复杂 API 协同调用,均能稳定胜任。 此外,该模型支持 256K 超长上下文,并在指令遵循测试 IFBench 中表现优异,可确保在多重约束条件下的执行准确率与逻辑一致性。 Ling-2.6-1T 目前已在上线之初同步提供 API 服务,开发者可通过官方平台或 OpenRouter 直接调用,Ling-2.6-1T 与当前主流 Agent 框架保持高度兼容,适用于需要稳定执行的复杂场景。 IT之家注:百灵团队还透露该模型将于近期正式开源,届时开发者可进一步基于其进行本地部署与二次开发。 随着 Ling-2.6-1T 的发布,蚂蚁百灵的模型产品矩阵进一步清晰。除该款万亿级非推理旗舰模型外,其 Ling 系列还包含 Ling‑Lite、Ling‑Plus 等不同规模版本,并与 Ring 系列长思考模型、Ming 系列多模态模型协同布局,覆盖从轻量部署到综合旗舰的多层次需求。 蚂蚁集团宣布,为方便开发者快速体验,现已在 OpenRouter 与官方平台同步提供一周免费 API 调用。 相关阅读: 《 蚂蚁集团百灵大模型 Ling-2.6-flash 发布,匿名上线一周日均 tokens 调用达 100B 级 》
IT之家 4 月 22 日消息,蚂蚁集团旗下的百灵大模型今日宣布,推出一款 总参数量 104B 、 激活参数 7.4B 的 Instruct 模型 Ling-2.6-flash 。 一周前,代号为 Elephant Alpha 的匿名模型登陆 OpenRouter。上线以来,其调用量持续增长, 连续多日位列 Trending 榜首,日均 tokens 调用量达 100B 级别 。百灵大模型今日宣布 Elephant Alpha 正是百灵模型 Ling-2.6-flash 的匿名测试版本。 官方表示,面对持续攀升的 Token 压力,Ling-2.6-flash 选择了一条不同的技术路径:不是单纯依赖更长输出换取更高分数,而是围绕 推理效率 、Token 效率与 Agent 场景表现 进行系统性优化,在保持竞争力智能水平的同时,尽可能做到更快、更省和更适合真实业务场景。 Ling-2.6-flash 的核心能力体现在三个方面: 混合线性架构,释放推理效率: 通过引入混合线性架构,模型从底层优化计算效率,在 4 卡 H20 条件下推理速度最快可达到 340 tokens/s ,Prefill 吞吐达到 Nemotron-3-Super 的 2.2 倍 Token 效率优化,提升智效比: 在训练过程中对 Token 效率进行了针对性校准,力求以更精简的输出完成既定目标。在 Artificial Analysis 的完整评测中,Ling-2.6-flash 仅消耗 15M tokens ,约为 Nemotron-3-Super 等模型的 1/10 面向 Agent 场景进行定向增强: 针对当前需求最旺盛的 Agent 应用,在工具调用、多步规划与任务执行能力上持续打磨,使模型在 BFCL-V4、TAU2-bench、SWE-bench Verified、Claw-Eval、PinchBench 等评测中,即使面对激活参数更大的模型,依然能够取得相近甚至 SOTA 级别的表现 ▲ Ling-2.6-flash 在 Agent 相关基准上达到同尺寸 SOTA 水平 为方便更多开发者快速体验 Ling-2.6-flash,百灵大模型将在 OpenRouter 与官方平台同步提供一周免费 API 调用。 免费期结束后,将按使用量计费:输入 0.1 美元 / 百万 tokens,输出 0.3 美元 / 百万 tokens,缓存命中 0.02 美元 / 百万 tokens(按 20% 计费)。 Ling-2.6-flash 官方 API 服务也已正式开放,官方免费期结束后,平台仍将提供每日 50 万 tokens 免费额度;超出部分按量计费:输入 0.6 元 / 百万 tokens,输出 1.8 元 / 百万 tokens。 IT之家注意到,官方表示, 模型的 BF16、FP8、INT4 等版本也将于近期正式开源。
4月22日,蚂蚁百灵正式推出Ling-2.6-flash——一款总参数量104B、激活参数7.4B的Instruct模型。该模型在BFCL-V4、TAU2-bench、SWE-bench Verified、Claw-Eval、PinchBench等Agent相关基准上达到同尺寸SOTA水平。 API定价方面,Ling-2.6-flash输入每百万tokens定价0.1美元,输出 0.3 美元。目前,Ling-2.6-flash的API已正式向用户开放,并提供为期一周的限时免费试用。Ling-2.6-flash上线以来,日均tokens调用量达100B级别,周增长超5000%。