百度在周末发布了2个新一代文心一言大模型,分别是没有推理能力的ERNIE 4.5以及有推理能力的ERNIE X1,即日起可以免费使用
3月16日,百度宣布推出两款新一代文心大模型——ERNIE 4.5与ERNIE X1,并提前向公众免费开放其智能对话平台“文心一言”(ERNIE Bot)。官方宣称,这两款模型的能力均超过了GPT-4o,但是价格只有GPT-4o的1%,且是DeepSeek的一半。
尽管官方宣布未来几个月开源,但是目前官方只在推特发了消息,没有官方博客介绍,实在是令人费解百度的操作(今天才发现百度没有官方博客介绍自己的模型和更新情况,真是神级产品思路!)。
ERNIE 4.5:多模态大模型,没有思维链推理模式
作为百度新一代原生多模态基础模型,ERNIE 4.5的核心优势在于其跨模态的理解与生成能力。它能够无缝整合文本、图像、音频和视频内容,甚至能解读互联网文化中的梗图与讽刺漫画。例如,当用户输入一张包含流行网络梗的图片时,ERNIE 4.5不仅能识别画面元素,还能结合上下文理解其中的幽默或隐喻。
技术层面,ERNIE 4.5通过“FlashMask动态注意力遮蔽”和“异质多模态混合专家”架构,实现了多模态数据的协同优化。据百度披露,该模型在多项基准测试中已超越GPT-4o,而成本仅为后者的1%。
下图是官网给出的一个对比结果。其多模态能力和GPT-4o对比如下:

其文本能力和GPT-4o对比如下:

