截止目前为止最大的国产开源大模型发布:元象科技开源XVERSE-65B大模型,16K上下文,免费商用
国产大语言模型的开源领域一直是很多企业或者科研机构都在卷的领域。最早,智谱AI开源ChatGLM-6B之后,国产大模型的开源就开始不断发展。早期大模型开源的参数规模一直在60-70亿参数规模,随着后续阿里千问系列的140亿参数的模型开源以及智源340亿参数模型开源之后,元象科技开源650亿参数规模的大语言模型XVERSE-65B,将国产开源大模型的参数规模提高到新的台阶。

XVERSE-65B简介
XVERSE-65B是深圳元象科技公司开源的650亿参数规模的大模型。这是一个从头开始训练的大语言模型,是当前主流的Decoder-Only的Transformer架构。
根据官方的介绍,XVERSE-65B模型的主要特点如下:
- 截止国产开源领域参数规模最大的大语言模型,达到650亿参数;
- 基于2.6万亿tokens的高质量数据集进行预训练,数据集包括中、英、俄、西等 40 多种语言,在中英文上表现很好,支持部分小语种;

