如何提高大语言模型作为Agent的能力？清华大学与智谱AI推出AgentTuning方案

尽管开源的大语言模型发展非常迅速，但是，在以大语言模型作为核心的新一代AI Agent解决方案上，开源大语言模型比商业模型表现要明显地差。为了提高大语言模型作为AI Agent的表现和能力，清华大学和智谱AI推出了一种新的方案，AgentTuning，可以将有效增强开源大语言模型作为AI Agent的能力。

AI Agent简介

AI Agent使用一种可以感知周围环境并作出决策的一种智能系统。这种概念其实很早就提出，但是随着ChatGPT的推出，大家发现大语言模型在意图理解方面已经超越了之前的算法。因此，以大语言模型作为核心控制器来建立一个AI Agent变成一种十分具有前景的方案。

OpenAI的Safety团队的负责人Lilian Weng在2023年6月份发布的一篇博客中就介绍了AI Agent，并认为这将使LLM转为通用问题解决方案的途径之一（参考：大模型驱动的自动代理（AI Agent）：将语言模型的能力变成通用能力的一种方式——来自OpenAI安全团队负责人的解释与观点）。

任务	指令来源	指令数目	过滤轨迹数	平均过滤轨迹回合数	比例
ALFWorld	训练集	954	336	13.52	35.2%
WebShop	训练集	1,485	351	3.68	23.6%
Mind2Web	训练集	23,378	122	1.00	0.52%
知识图谱	训练集	2,501	324	6.04	13.0%
操作系统	自指导	647	195	3.85	30.1%
数据库	自指导	1,074	178	2.13	16.6%
任务推导	-	5,302	360	2.03	6.79%
AgentInstruct	-	35,341	1,866	5.24	5.29%

模型名称	DataLearner信息卡地址
AgentLM-7B	https://www.datalearner.com/ai-models/pretrained-models/AgentLM-7B
AgentLM-13B	https://www.datalearner.com/ai-models/pretrained-models/AgentLM-13B
AgentLM-70B	https://www.datalearner.com/ai-models/pretrained-models/AgentLM-70B

如何提高大语言模型作为Agent的能力？清华大学与智谱AI推出AgentTuning方案

AI Agent简介

DataLearner 官方微信

当前开源大语言模型在AI Agent领域表现很差

AgentTuning方案详解

AgentTuning效果评估

AgentTuning总结

AgentTuning开源资源

热门博客