智谱AI开源了一个可以带文字的图像的多模态大模型CogView4-6B：图片文本带有中英文混排，指定比例范围内的任意尺寸图像可生成，免费商用授权

作为首个支持原生汉字生成的开源模型，CogView4-6B有着非常不错的特点，60亿参数规模意味着仅需12G显存即可使用，量化后显存占用还会更低。