Qwen3-Max-Thinking 评测详情
Qwen3-Max-Thinking 当前已收录的代表性评测结果包括 LiveCodeBench(12 / 118,得分 85.90)、C-Eval(1 / 9,得分 93.70)、HLE(19 / 149,得分 49.80)。
评测结果
Qwen3-Max-Thinking
评测结果
综合评估
共 5 项评测评测名称 / 模式
得分
排名/总数
Qwen3-Max-Thinking 当前已收录的代表性评测结果包括 LiveCodeBench(12 / 118,得分 85.90)、C-Eval(1 / 9,得分 93.70)、HLE(19 / 149,得分 49.80)。