MiniMax Hailuo 2.3

模型解读

基本信息：MiniMax Hailuo 2.3（海螺 2.3）是由通用人工智能科技公司 MiniMax 于 2025 年 10 月 28 日正式发布的旗舰级 AI 视频生成模型。作为 Hailuo 02 的继任者，它定位为“电影级”视频生成工具，旨在为专业创作者提供高保真的视觉内容。

核心目标：该模型旨在解决 AI 视频生成中常见的物理规律失真、动作僵硬以及风格一致性差等核心问题。它通过重构的运动物理引擎和指令理解系统，实现了对复杂动态场景的精准控制。

架构特点：Hailuo 2.3 采用了升级版的 DiT（Diffusion Transformer）架构，并引入了全新的 NCR（Noise-Conditioned Refinement）技术。这种架构优化显著提升了模型对光影、纹理以及时间连贯性的处理能力。
上下文/时长：支持生成 6 秒或 10 秒的高清视频片段，分辨率最高支持 1080p（1920x1080）。
训练数据：模型在海量的高质量视频数据集中进行了训练，特别增强了对影视级运镜、人物微表情以及物理碰撞数据的学习。

模态支持：支持“文生视频”（Text-to-Video）和“图生视频”（Image-to-Video）。
能力详述：
1. 精准的物理模拟：大幅提升了人物与环境交互的真实感，例如衣物随风摆动、流体动态以及复杂的肢体动作（如舞蹈、打斗）。
2. 微表情控制：能够生成极其细腻的人物面部表情，支持从眼神流转到细微肌肉抽动的自然过渡。
3. 多风格支持：除写实风格外，原生支持动漫、水墨画、游戏 CG 等多种艺术风格，且保持高度的帧间一致性。
4. 运镜控制：支持推、拉、摇、移等电影级运镜指令，保持主体在镜头运动中的结构稳定性。

根据官方及第三方评测，Hailuo 2.3 在“语义遵循准确率”和“视频时序一致性”指标上相比前代 Hailuo 02 提升显著。在复杂的人体动作生成测试中，其肢体崩坏率大幅降低，能够生成流畅的全身舞蹈动作，被认为是当时业界第一梯队的视频模型之一。

开发者可以通过 MiniMax 开放平台（Hailuo AI API）访问该模型，普通用户可通过海螺 AI 网页端或合作平台（如 Freepik、VEED）进行体验。该模型为商业闭源模型。

Hailuo 2.3