1. MiniMax Hailuo 2.3 简介和核心特点
基本信息:MiniMax Hailuo 2.3(海螺 2.3)是由通用人工智能科技公司 MiniMax 于 2025 年 10 月 28 日正式发布的旗舰级 AI 视频生成模型。作为 Hailuo 02 的继任者,它定位为“电影级”视频生成工具,旨在为专业创作者提供高保真的视觉内容。
核心目标:该模型旨在解决 AI 视频生成中常见的物理规律失真、动作僵硬以及风格一致性差等核心问题。它通过重构的运动物理引擎和指令理解系统,实现了对复杂动态场景的精准控制。
2. 架构与技术规格
- 架构特点:Hailuo 2.3 采用了升级版的 DiT(Diffusion Transformer)架构,并引入了全新的 NCR(Noise-Conditioned Refinement)技术。这种架构优化显著提升了模型对光影、纹理以及时间连贯性的处理能力。
- 上下文/时长:支持生成 6 秒或 10 秒的高清视频片段,分辨率最高支持 1080p(1920x1080)。
- 训练数据:模型在海量的高质量视频数据集中进行了训练,特别增强了对影视级运镜、人物微表情以及物理碰撞数据的学习。
3. 核心能力与支持模态
- 模态支持:支持“文生视频”(Text-to-Video)和“图生视频”(Image-to-Video)。
- 能力详述:
1. 精准的物理模拟:大幅提升了人物与环境交互的真实感,例如衣物随风摆动、流体动态以及复杂的肢体动作(如舞蹈、打斗)。
2. 微表情控制:能够生成极其细腻的人物面部表情,支持从眼神流转到细微肌肉抽动的自然过渡。
3. 多风格支持:除写实风格外,原生支持动漫、水墨画、游戏 CG 等多种艺术风格,且保持高度的帧间一致性。
4. 运镜控制:支持推、拉、摇、移等电影级运镜指令,保持主体在镜头运动中的结构稳定性。
4. 性能与基准评测
根据官方及第三方评测,Hailuo 2.3 在“语义遵循准确率”和“视频时序一致性”指标上相比前代 Hailuo 02 提升显著。在复杂的人体动作生成测试中,其肢体崩坏率大幅降低,能够生成流畅的全身舞蹈动作,被认为是当时业界第一梯队的视频模型之一。
5. 应用场景与限制
- 推荐用例:影视概念设计、广告短片制作、电商产品展示(Product Showcase)、动漫内容创作以及游戏过场动画生成。
- 已知局限:在生成包含大量细小文字或极端复杂的非欧几里得几何结构时,仍可能出现局部细节模糊;生成超长视频时需要依赖外部拼接工具。
6. 访问方式与许可
开发者可以通过 MiniMax 开放平台(Hailuo AI API)访问该模型,普通用户可通过海螺 AI 网页端或合作平台(如 Freepik、VEED)进行体验。该模型为商业闭源模型。