OpenAI的GPT模型API接口新增的top_logprobs和logprobs参数是什么?有什么用处?为什么说这个参数可以帮助我们减轻大模型幻觉问题
在最新的OpenAI官方接口文档中,新增了top_logprobs和logprobs这2个参数。这2个参数是一起配合使用的。后者是一个布尔类型,表明模型的返回结果中是否增加输出每个token的概率,而top_logprobs参数是一个整数类型,取值范围是0-5之间。如果top_logprobs设置为true,那么模型会根据top_logprobs的设置结果,返回输出结果中每个token及其后续的n个单词的概率。
需要注意的是,这个参数开启理论上应该不会增加token的输出数量,也就是不会增加成本。
top_logprobs和logprobs参数的含义解释
下图是OpenAI的大模型输出测试页面的一个截图,显示了这两个参数是如何帮助我们理解和调试大模型输出的。

上图是这个参数返回结果的一个可视化截图。其中,带背景色的文本是大模型返回的补全结果,点击其中的每一个单词(token)就可以看到这个token其实是根据词汇表中每个token的概率选择得到的。在图中,大模型返回的The inner planets中的planets位置的前5个token的概率分别如下:


