DataLearnerAI-GPT:可以回答关于大模型评测结果的GPT
最近自定义GPTs非常火热,出现了大量的自定义GPT,可以完成各种各样的有趣的任务。DataLearnerAI目前也创建了一个DataLearnerAI-GPT,目前可以回答大模型在不同评测任务上的得分结果。这些回答是基于OpenLLMLeaderboard数据回答的。未来会考虑增加更多信息,包括DataLearner网站上所有的大模型博客和技术介绍。

DataLearnerAI-GPT体验地址:https://chat.openai.com/g/g-8eu9KgtUm-datalearnerai-gpt
DataLearnerAI-GPT简介
大模型的发展非常快,但是各家宣称自己的模型都很好,超过GPT-3.5的宣传也很多,为了更加方便大家对比和追踪评测结果,HuggingFaceH4推出了OpenLLMLeadboard,收集了全球各种大模型在不同评测任务上的评分结果。
目前OpenLLMLeaderboard收集了如下的评测结果:
- AI2 Reasoning Challenge (25-shot):一套小学科学问题。
- HellaSwag (10-shot): 对于人类而言简单(大约95%)的常识推理测试,但对于最新技术模型而言具有挑战性。



