你的MiniMax M2模型效果为什么不好?可能是用错了,官方建议正确使用Interleaved Thinking,模型效果最多可提升35%的效果
MiniMax M2发布2周后已经成为OpenRouter上模型tokens使用最多的模型之一。已经成为另一个DeepSeek现象的大模型了。然而,实际使用中,很多人反馈说模型效果并不好。而此时,官方也下场了,说当前大家使用MiniMax M2效果不好的一个很重要的原因是没有正确使用Interleaved Thinking。正确使用Interleaved thinking模式,可以让MiniMax M2模型的效果最多可以提升35%!本文我们主要简单聊聊这个Interleaved thinking。

大模型几种不同的思考模式
自从OpenAI推出推理大模型o系列之后,当前所有的大模型都几乎支持推理模式,也就是正式回答用户之前,模型会进行一段推理思考,思考结束之后给出正确的答案。
然而,思考模式也非几种不同的情况。如下图所示:

第一种是没有思考的时候,大模型消息的形式,基本上就是不同类型的消息交替出现。
有了思考模式之后(第二种),大模型在接收到用户请求的第一件事就是进行思考推理,显示给出思考过程和答案之后再进行工具调用等过程。但是,这种推理模式通常只是,后续的工具调用过程中都没有再做思考。而MiniMaxAI官方很早就发现,这个模式问题也很多。即使最开始模型思考是对的,但是后续工具调用过程多了之后也会逐渐丢失前期正确的逻辑变得越来越差。

