Image-to-Video Arena 图生视频模型排行榜
基于 Image-to-Video Arena 用户匿名投票的最新AI图生视频模型排行榜,涵盖各模型的 Elo 得分、95% 置信区间、投票量、机构与许可证。
榜首模型
grok-imagine-video-1.5-preview-720p
最高得分
1,473
模型数量
40
数据版本
2026年05月29日
数据来源: LM Arena
关于本排行榜
本排行榜展示了当前 AI 图生视频(Image-to-Video)模型的综合实力排名。数据来源于 LMArena 的 Image-to-Video Arena 赛道,通过真实用户的匿名盲测投票来评估模型的图像动画化能力。
评测方法概要
匿名盲测:用户上传一张图片后,由两个"隐藏身份"的模型分别生成动态视频,用户投票选出更自然流畅的一方。
Elo 评分:基于 Bradley-Terry 模型计算,科学反映模型在图生视频任务中的相对实力。
覆盖多种动画场景:包括人像动画、风景运动、物体变换、艺术创作等多元化的图生视频需求。
DataLearner 在原始数据基础上提供中文解读与深度分析,并将排行榜模型关联至 DataLearner 模型库,方便您一键查看模型详情、API 定价、评测得分等完整信息。
排名总表
| 排名 | 模型名称 | 得分 | 95% CI | 投票数 | 机构 | 许可证 |
|---|---|---|---|---|---|---|
| 1,473 | +/-9 | 5,564 | xAI | Proprietary | ||
dreamina-seedance-2.0-720pBytedance | 1,467 | +/-11 | 56,710 | Bytedance | Proprietary | |
happyhorse-1.0Alibaba-ATH | 1,443 | +/-12 | 33,267 | Alibaba-ATH | Proprietary | |
| 4 | 1,421 | +/-6 | 380,580 | xAI | Proprietary | |
| 5 | Veo 3.1 Generate (Preview)Google Deep Mind | 1,397 | +/-11 | 25,113 | Google Deep Mind | Proprietary |
| 6 | Veo 3.1 Generate (Preview)Google Deep Mind | 1,393 | +/-10 | 24,381 | Google Deep Mind | Proprietary |
| 7 | Veo 3.1 Fast (Preview)Google Deep Mind | 1,384 | +/-9 | 99,851 | Google Deep Mind | Proprietary |
| 8 | 1,383 | +/-9 | 19,415 | xAI | Proprietary | |
| 9 | Veo 3.1 Fast (Preview)Google Deep Mind | 1,374 | +/-11 | 24,874 | Google Deep Mind | Proprietary |
| 10 | vidu-q3-proShengshu | 1,360 | +/-8 | 36,674 | Shengshu | Proprietary |
| 11 | kling-v3-proKlingAI | 1,358 | +/-9 | 97,028 | KlingAI | Proprietary |
| 12 | Veo 3.1 Generate (Preview)Google Deep Mind | 1,330 | +/-11 | 32,383 | Google Deep Mind | Proprietary |
| 13 | Wan2.1-T2V-14B阿里巴巴 | 1,326 | +/-11 | 13,910 | 阿里巴巴 | Proprietary |
| 14 | Veo 3.1 Fast (Preview)Google Deep Mind | 1,324 | +/-9 | 41,215 | Google Deep Mind | Proprietary |
| 15 | wan2.6-i2vAlibaba | 1,317 | +/-11 | 59,311 | Alibaba | Proprietary |
| 16 | Seedance 2.0字节跳动Seed团队 | 1,306 | +/-8 | 196,539 | 字节跳动Seed团队 | Proprietary |
| 17 | pixverse-v5.6Pixverse | 1,301 | +/-9 | 90,999 | Pixverse | Proprietary |
| 18 | Kling 2.5 Turbo昆仑万维 | 1,293 | +/-8 | 162,913 | 昆仑万维 | Proprietary |
| 19 | Kling 2.5 Turbo昆仑万维 | 1,274 | +/-12 | 3,791 | 昆仑万维 | Proprietary |
| 20 | Seedance 2.0字节跳动Seed团队 | 1,272 | +/-7 | 34,028 | 字节跳动Seed团队 | Proprietary |
| 21 | 1,258 | +/-6 | 200,973 | MiniMaxAI | Proprietary | |
| 22 | Veo 3.1 Fast (Preview)Google Deep Mind | 1,256 | +/-10 | 26,297 | Google Deep Mind | Proprietary |
| 23 | Veo 3.1 Generate (Preview)Google Deep Mind | 1,255 | +/-10 | 26,105 | Google Deep Mind | Proprietary |
| 24 | p-videoPruna | 1,243 | +/-16 | 23,372 | Pruna | Proprietary |
| 25 | vidu-q2-turboShengshu | 1,242 | +/-17 | 2,506 | Shengshu | Proprietary |
| 26 | Kling 2.5 Turbo昆仑万维 | 1,234 | +/-8 | 29,849 | 昆仑万维 | Proprietary |
| 27 | 1,227 | +/-10 | 21,751 | MiniMaxAI | Proprietary | |
| 28 | Kling 2.5 Turbo昆仑万维 | 1,227 | +/-8 | 29,952 | 昆仑万维 | Proprietary |
| 29 | ray-3Luma AI | 1,225 | +/-19 | 1,588 | Luma AI | Proprietary |
| 30 | 1,222 | +/-9 | 21,782 | MiniMaxAI | Proprietary | |
| 31 | vidu-q2-proShengshu | 1,222 | +/-17 | 2,608 | Shengshu | Proprietary |
| 32 | Hunyuan-A13B-Instruct腾讯AI实验室 | 1,195 | +/-15 | 5,475 | 腾讯AI实验室 | tencent-hunyuan-community |
| 33 | 1,192 | +/-10 | 22,549 | MiniMaxAI | Proprietary | |
| 34 | Seedance 2.0字节跳动Seed团队 | 1,184 | +/-8 | 33,754 | 字节跳动Seed团队 | Proprietary |
| 35 | Wan2.1-T2V-14B阿里巴巴 | 1,169 | +/-10 | 27,067 | 阿里巴巴 | Apache 2.0 |
| 36 | Veo 3.1 Generate (Preview)Google Deep Mind | 1,164 | +/-16 | 10,319 | Google Deep Mind | Proprietary |
| 37 | ltx-2-19blightricks | 1,141 | +/-7 | 146,473 | lightricks | ltx-2-community-license-agreement |
| 38 | ray2Luma AI | 1,106 | +/-16 | 9,527 | Luma AI | Proprietary |
| 39 | runway-gen4-turboRunway | 1,051 | +/-13 | 6,811 | Runway | Proprietary |
| 40 | pika-v2.2Pika | 995 | +/-13 | 8,655 | Pika | Proprietary |
数据仅供参考,以官方来源为准。模型名称旁的链接可跳转到 DataLearner 模型详情页。
2026年3月图生视频榜单分析
最新排名亮点
本次 LMArena Image-to-Video Arena 榜单更新至 2026 年 3 月 6 日,共收录 37 个模型。头部格局较上个版本更加清晰,xAI Grok 与 Google Veo 3.1 仍然构成第一梯队。
grok-imagine-video-720p 以 1404 分位列榜首,继续压制 Google 阵营。与此同时,grok-imagine-video-480p 也排到第 5,说明 Grok 在图生视频方向已经不只是单点领先,而是形成了成体系的高分版本。
Google 则凭借更厚的产品线维持最强整体实力。veo-3.1-audio-1080p、veo-3.1-audio、veo-3.1-fast-audio-1080p 和 veo-3.1-fast-audio 分列第 2、3、4、6 名,几乎包揽榜单前列。带音频版本继续明显强于旧版 Veo 3 / Veo 2。
国产模型表现
国产阵营中,vidu-q3-pro 以 1353 分位列第 7,是当前排名最高的国产图生视频模型。阿里 wan2.5-i2v-preview 以 1339 分排在第 8,wan2.6-i2v 则以 1297 分位列第 13,保持在第一梯队之外但仍具竞争力。
快手 kling-2.6-pro 以 1289 分位列第 14,和 kling-v2.1-master / standard、kling-2.5-turbo-1080p 一起构成中段主力。字节跳动的 seedance-v1.5-pro、seedance-v1-pro 与 seedance-v1-lite 也维持了稳定排名。MiniMax hailuo-2.3 则以 1255 分继续稳居中上游。
开源模型表现
开源模型中,wan-v2.2-a14b(Apache 2.0)依然是当前最有代表性的开源图生视频模型,分数达到 1167。相比头部闭源模型仍有明显差距,但在开源可用性上具有独特价值。
此外,ltx-2-19b 采用社区许可协议,也保持了较高讨论度和较大的投票量。整体而言,图生视频赛道的领先能力仍高度集中在闭源商业模型上,开源阵营更多处于追赶阶段。
2026年5月市场风向标
当前最佳 (SOTA)
Grok Imagine Video 720p
Elo 1404,当前图生视频榜第一名
Veo 3.1 Audio 1080p
Elo 1402,Google 当前最强图生视频模型之一
Veo 3.1 Audio
Elo 1395,Google 高质量音频版第二梯队核心
国产最佳
Vidu-Q3-Pro
Elo 1353,当前国产图生视频模型最高位次
Wan2.5-I2V-Preview
Elo 1339,阿里图生视频主力模型
Kling-2.6-Pro
Elo 1289,快手可灵系列代表作
最佳开源模型
- •Wan-V2.2-A14BApache 2.0,当前最具代表性的开源图生视频模型
- •LTX-2-19B社区许可,投票量高,生态关注度较强
- •Pika-V2.2虽非开源,但在长尾入门产品中仍有一定参考价值
排名解读(更新于 2026年05月29日)
2026年3月最好的图生视频模型是哪些?
根据 2026 年 3 月 6 日的 LMArena 图生视频榜单,Grok Imagine Video 720p、Veo 3.1 Audio 1080p 和 Veo 3.1 Audio 是当前最强的三款图生视频模型,xAI 与 Google 处于第一梯队。
2026年3月最好的国产图生视频模型是哪些?
国产阵营里,Vidu-Q3-Pro 当前排名最高,其后是 Wan2.5-I2V-Preview 和 Kling-2.6-Pro。如果考虑开源路线,则 Wan-V2.2-A14B 仍是最重要的选择。
2026年3月最好的开源图生视频模型是哪些?
从当前榜单看,Wan-V2.2-A14B 是最值得关注的开源图生视频模型;LTX-2-19B 虽然不是标准开源协议,但也是这个方向的重要社区模型。
AI 图生视频常见问题
图生视频 (Image-to-Video) 和文生视频 (Text-to-Video) 有什么区别?
Text-to-Video 是仅凭文字描述生成视频;Image-to-Video 则基于参考图片生成视频,因此更容易控制主体、构图和角色一致性。
让老照片动起来(Live Portrait)应该用哪个模型?
人像动画需要重点比较表情稳定性、运动自然度和身份保持能力。如果核心需求是对口型,则可以优先考虑专门的 lip-sync 工具。
如何保持生成视频中的人物一致性?
使用清晰的角色设定图作为首帧,并在提示词中明确限制服装、视角和风格变化。若模型支持身份条件控制,可优先启用相关选项。
什么是 First Frame Fidelity(首帧保真度)?
首帧保真度衡量生成视频开头与输入参考图的一致程度。高保真度意味着模型能准确保留原图构图、主体特征和风格,让视频像是从原图自然延伸出的运动。


