康奈尔大学发布可以在一张消费级显卡上微调650亿参数规模大模型的框架：LLMTune

尽管大模型的研究十分火热，开源模型也很丰富。但是对于很多研究团队来说，基于开源模型进行特定领域的模型微调依然是一项成本高昂的活动。因此，大模型的小型化、低成本训练等方法一直在快速演进。前天，Cornell Tech开源了LLMTune，这是一个可以在消费级显卡上微调大模型的框架，经过测试，可以在48G显存的显卡上微调4bit的650亿参数的LLaMA模型！

LLMTune简介

大语言模型虽然能力很强，目前开源生态也很丰富，但是在特定领域微调大模型依然需要大规格的显卡。例如，清华大学发布的ChatGLM-6B，参数规模60亿，在没有量化的情况下微调需要14GB显存（parameter-efficient fine-tuning，PEFT)。

库名称	简介
PyTorch	Meta开源的深度学习框架
sentencepiece	Google开源的无监督tokenizer工具
transformers	HuggingFace开源的NLP预训练模型框架
peft	HuggingFace开源的支持各种LLM高效微调的库
datasets	HuggingFace开源的数据集库

配置项	具体配置结果
操作系统	UNIX
Python	3.8以上
PyTorch	1.13.1+cu116版本测试没问题
显卡	NVIDIA系列，支持cuda

Model大小	最低GPU显存	兼容的显卡
7b-4bit	6GB	RTX 2060, 3050, 3060
13b-4bit	10GB	GTX 1080, RTX 2060, 3060, 3080
30b-4bit	20GB	RTX 3080, A5000, 3090, 4090, V100
65b-4bit	40GB	A100, 2x3090, 2x4090, A40, A6000

康奈尔大学发布可以在一张消费级显卡上微调650亿参数规模大模型的框架：LLMTune

LLMTune简介

DataLearner 官方微信

LLMTune的使用方法

1、安装LLMTune

2、下载预训练结果文件

3、下载数据集

4、微调模型

LLMTune微调总结

大模型高效微调总结

热门博客