康奈尔大学发布可以在一张消费级显卡上微调650亿参数规模大模型的框架:LLMTune
尽管大模型的研究十分火热,开源模型也很丰富。但是对于很多研究团队来说,基于开源模型进行特定领域的模型微调依然是一项成本高昂的活动。因此,大模型的小型化、低成本训练等方法一直在快速演进。前天,Cornell Tech开源了LLMTune,这是一个可以在消费级显卡上微调大模型的框架,经过测试,可以在48G显存的显卡上微调4bit的650亿参数的LLaMA模型!

LLMTune简介
大语言模型虽然能力很强,目前开源生态也很丰富,但是在特定领域微调大模型依然需要大规格的显卡。例如,清华大学发布的ChatGLM-6B,参数规模60亿,在没有量化的情况下微调需要14GB显存(parameter-efficient fine-tuning,PEFT)。
