Ha

Hailuo 2.3

视觉大模型

MiniMax Hailuo 2.3

发布时间: 2025-10-28

8
模型参数(Parameters)
未披露
最高上下文长度(Context Length)
10s
是否支持中文
支持
推理能力(Reasoning)

模型基本信息

是否支持推理过程

不支持

最高上下文输入长度

10s tokens

最长输出结果
暂无数据
模型类型

视觉大模型

发布时间

2025-10-28

模型预文件大小
暂无数据
推理模式
常规模式(Non-Thinking Mode)

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源 - 不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验

官方介绍与博客

官方论文
DataLearnerAI博客
暂无介绍博客

API接口信息

接口速度(满分5分)
接口价格
暂无公开的 API 定价信息。

Hailuo 2.3模型在各大评测榜单的评分

当前尚无可展示的评测数据。

发布机构

MiniMax Hailuo 2.3模型解读

1. MiniMax Hailuo 2.3 简介和核心特点

基本信息:MiniMax Hailuo 2.3(海螺 2.3)是由通用人工智能科技公司 MiniMax 于 2025 年 10 月 28 日正式发布的旗舰级 AI 视频生成模型。作为 Hailuo 02 的继任者,它定位为“电影级”视频生成工具,旨在为专业创作者提供高保真的视觉内容。

核心目标:该模型旨在解决 AI 视频生成中常见的物理规律失真、动作僵硬以及风格一致性差等核心问题。它通过重构的运动物理引擎和指令理解系统,实现了对复杂动态场景的精准控制。

2. 架构与技术规格

  • 架构特点:Hailuo 2.3 采用了升级版的 DiT(Diffusion Transformer)架构,并引入了全新的 NCR(Noise-Conditioned Refinement)技术。这种架构优化显著提升了模型对光影、纹理以及时间连贯性的处理能力。
  • 上下文/时长:支持生成 6 秒或 10 秒的高清视频片段,分辨率最高支持 1080p(1920x1080)。
  • 训练数据:模型在海量的高质量视频数据集中进行了训练,特别增强了对影视级运镜、人物微表情以及物理碰撞数据的学习。

3. 核心能力与支持模态

  • 模态支持:支持“文生视频”(Text-to-Video)和“图生视频”(Image-to-Video)。
  • 能力详述:
    1. 精准的物理模拟:大幅提升了人物与环境交互的真实感,例如衣物随风摆动、流体动态以及复杂的肢体动作(如舞蹈、打斗)。
    2. 微表情控制:能够生成极其细腻的人物面部表情,支持从眼神流转到细微肌肉抽动的自然过渡。
    3. 多风格支持:除写实风格外,原生支持动漫、水墨画、游戏 CG 等多种艺术风格,且保持高度的帧间一致性。
    4. 运镜控制:支持推、拉、摇、移等电影级运镜指令,保持主体在镜头运动中的结构稳定性。

4. 性能与基准评测

根据官方及第三方评测,Hailuo 2.3 在“语义遵循准确率”和“视频时序一致性”指标上相比前代 Hailuo 02 提升显著。在复杂的人体动作生成测试中,其肢体崩坏率大幅降低,能够生成流畅的全身舞蹈动作,被认为是当时业界第一梯队的视频模型之一。

5. 应用场景与限制

  • 推荐用例:影视概念设计、广告短片制作、电商产品展示(Product Showcase)、动漫内容创作以及游戏过场动画生成。
  • 已知局限:在生成包含大量细小文字或极端复杂的非欧几里得几何结构时,仍可能出现局部细节模糊;生成超长视频时需要依赖外部拼接工具。

6. 访问方式与许可

开发者可以通过 MiniMax 开放平台(Hailuo AI API)访问该模型,普通用户可通过海螺 AI 网页端或合作平台(如 Freepik、VEED)进行体验。该模型为商业闭源模型。

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat