阿里发布第二代图像大模型:Qwen-Image-2.0,融合文本生成图片、图片编辑为一体全球目前排名第三!中文渲染很棒!但不开源~
就在刚刚,阿里宣布发布Qwen-Image-2.O模型,该模型是Qwen Image系列的最新版本,这个模型综合了此前的文本生成图片和图片编辑的能力,在文本渲染、生成PPT图片方面大幅提升。不过相比较之前的Qwen Image系列,该版本的模型并没有开源,目前在官网可以免费使用。

Qwen-Image系列背景与演进
阿里的Qwen系列模型自2023年以来已成为开源AI社区的焦点。该系列起初以多模态大语言模型为主,逐步扩展到编码、数学、视觉等领域。
Qwen-Image系列是Qwen模型体系专注于图像处理的模型,最早在2025年8月份开源第一个版本(参数规模200亿,参考:https://www.datalearner.com/blog/1051754324540648 )。该版本强调多语言文本到图像生成,在Artificial Analysis Image Arena排行榜上位居前茅,是当时前10名中唯一的开源模型。 随后,Qwen-Image-2512(2025年12月)进一步提升了写实性和细节渲染,在AI Arena的盲测中基于超过10,000次人类评估,成为顶级开源文本到图像模型,与Google的Imagen或OpenAI的DALL-E系列竞争。 除了这类图像处理模型,阿里还开源了Qwen-Image-Edit这种专注于图像编辑的模型,如基于自然语言修改照片。






