阿里开源Qwen3-Coder-Next:专为Agentic Coding而生的80B MoE的编程大模型,激活参数仅3B!
就在刚刚,阿里开源了全新一代编程大模型Qwen3-Coder-Next,该模型是基于Qwen3-Next-80B-A3B-Base模型后训练得到,总参数规模800亿,激活参数仅30亿。也就是说,这个模型的推理速度基本和3B这种小规模参数差不多,但是它的评测结果,特别是在编程方面的评测与DeepSeek V3.2的水平差不多。

从官方信息来看,本次开源的 Qwen3-Coder-Next 目标是“agentic coding”:即模型训练目标直接围绕“生成代码 → 执行 → 失败 → 修复 → 再执行”的闭环,而不是只优化单轮代码生成质量。
一、Qwen3-Coder-Next模型基本信息
从架构和规格上看,Qwen3-Coder-Next 是一个非常典型的“规模很大,但推理代价受控”的 MoE 模型。它的基座是此前2025年9月份开源的Qwen3-Next模型(参考:https://www.datalearner.com/ai-models/pretrained-models/Qwen3-Next-80B-A3B ),这是阿里为下一代大模型架构进行技术验证的新模型,最大的特点是极度稀疏。
而本次开源的Qwen3-Coder-Next模型的主要信息如下:


