智谱AI开源了一个可以带文字的图像的多模态大模型CogView4-6B:图片文本带有中英文混排,指定比例范围内的任意尺寸图像可生成,免费商用授权
智谱AI开源了一个60亿参数规模的文生图大模型CogView4-6B,支持生成的图像中加入文字,文字效果自然融入图像中,且该模型支持支持宽高范围512px至2048px内的任意尺寸图像(也有限制,正文解释)。

CogView4-6B模型特点
作为首个支持原生汉字生成的开源模型,CogView4-6B有着非常不错的特点,60亿参数规模意味着仅需12G显存即可使用,量化后显存占用还会更低。
此外,CogView4-6B模型的优点也十分明显,主要包括:

