5月3日，2个重磅开源的AI模型发布：Replit代码补全大模型和LLaMA复刻版OpenLLaMA发布

五一长假最后一天，AI技术的发展依然火热。今天有2个重磅的开源模型发布：一个是前几天提到的Replit的代码补全大模型Replit Code V1 3B，一个是UC Berkeley的博士生Hao Liu发起的一个开源LLaMA复刻项目。

以上数据来自DataLearner预训练模型库

这两个项目都是开源的模型，就模型的前景来说，值得大家关注。

Replit的代码补全模型Replit Code V1 3B

Replit 是一家在线代码编辑器和云IDE公司。它提供一个在线编程环境,让用户可以编写代码并直接运行和调试程序。

2023年4月26日，Replit官方宣布他们正在训练2个代码补全模型，一个是replit-code-v1-3b，一个是replit-finetuned-v1-3b。本次开源的是前者。

这两个模型都是27亿参数，但官方并未透露二者的具体差别。从名称看，前者是专注编程相关，后者则是通过某种方法微调得到。当时，官方给出了2个对比测试结果，一个是与开源的编程模型相比，27亿参数的replit-finetuned-v1-3b效果最好，清华大学的CodeGeeX第二，而replit-code-v1-3b得分第三。在非开源的模型对比中，replit-finetuned-v1-3b也取得了第二名的好成绩。关键是，replit这两个模型的参数规模相比较其它模型都很小。

OpenLLaMA 7B信息名称	OpenLLaMA 7B信息结果	参考链接
模型名称	OpenLLaMA 7B
基础模型	无，重新编写，完全复刻LLaMA架构	https://ai.facebook.com/blog/large-language-model-llama-meta-ai/
参数大小	70亿
训练参数	完全按照原始LLaMA论文设置
训练硬件	Google的TPU-v4s
训练平台	UC Berkeley的EasyLM	https://github.com/young-geng/EasyLM
训练速度	每秒每TPU-v4s训练1900个tokens
训练数据集	RedPajama	https://www.together.xyz/blog/redpajama
开源情况	完全开源

5月3日，2个重磅开源的AI模型发布：Replit代码补全大模型和LLaMA复刻版OpenLLaMA发布

Replit的代码补全模型Replit Code V1 3B

DataLearner 官方微信

LLaMA模型的复刻项目OpenLLaMA发布

热门博客