阿里发布第二代图像大模型：Qwen-Image-2.0，融合文本生成图片、图片编辑为一体全球目前排名第三！中文渲染很棒！但不开源~

就在刚刚，阿里宣布发布Qwen-Image-2.O模型，该模型是Qwen Image系列的最新版本，这个模型综合了此前的文本生成图片和图片编辑的能力，在文本渲染、生成PPT图片方面大幅提升。不过相比较之前的Qwen Image系列，该版本的模型并没有开源，目前在官网可以免费使用。

Qwen-Image系列背景与演进

阿里的Qwen系列模型自2023年以来已成为开源AI社区的焦点。该系列起初以多模态大语言模型为主，逐步扩展到编码、数学、视觉等领域。

Qwen-Image系列是Qwen模型体系专注于图像处理的模型，最早在2025年8月份开源第一个版本（参数规模200亿，参考：https://www.datalearner.com/blog/1051754324540648 ）。该版本强调多语言文本到图像生成，在Artificial Analysis Image Arena排行榜上位居前茅，是当时前10名中唯一的开源模型。随后，Qwen-Image-2512（2025年12月）进一步提升了写实性和细节渲染，在AI Arena的盲测中基于超过10,000次人类评估，成为顶级开源文本到图像模型，与Google的Imagen或OpenAI的DALL-E系列竞争。除了这类图像处理模型，阿里还开源了Qwen-Image-Edit这种专注于图像编辑的模型，如基于自然语言修改照片。