DeepSeek-V4-ProvsKimi K2.6

在 9 个共同 benchmark 中，Kimi K2.6 整体领先：DeepSeek-V4-Pro 领先 1 项，Kimi K2.6 领先 8 项，持平 0 项，平均分差 -19.42。

DeepSeek-AI · 2026-04-24 · 推理大模型

Moonshot AI · 2026-04-20 · 推理大模型

DeepSeek-V4-Pro1 项(11%)(89%)8 项Kimi K2.6

评测分数

按能力类目分组，每组内按分差大小排列；共 9 项。

Kimi K2.6 领先 4/4

评测项	DeepSeek-V4-Pro	Kimi K2.6	分差
LiveCodeBench	56.8073 / 118Normal (No Tools)	89.606 / 118Thinking (No Tools)	-32.80
SWE-bench Multilingual	69.8012 / 17Normal (With Tools)	76.702 / 17Thinking (With Tools)	-6.90
SWE-bench Verified	73.6036 / 103Normal (With Tools)	80.209 / 103

价格优先使用 DataLearner 配置的 API 记录；缺失项不做推测。

9 个共同 benchmark 上，Kimi K2.6 平均高出 19.42 分。

单项差距最大的 benchmark：IMO-AnswerBench — DeepSeek-V4-Pro 35.30，Kimi K2.6 86（分差 -50.70）。

本页正文由结构化模型、价格与 benchmark 数据生成，不使用实时 LLM 撰写。

评测项	DeepSeek-V4-Pro	Kimi K2.6	分差
HLE	7.70133 / 149Normal (No Tools)	547 / 149Thinking (With Tools + Internet)	-46.30
GPQA Diamond	72.9099 / 175Normal (No Tools)	90.5014 / 175Thinking (No Tools)	-17.60