腾讯开源Hunyuan-A13B大模型：MoE架构，混合推理（支持直接回复和带推理过程后回复），原WizardLM团队打造，评测结果超Qwen2.5-72B，接近Qwen3-A22B，但参数量只有一半

2025年6月27日，腾讯发布并开源了其混元大模型系列的新成员Hunyuan-A13B。该模型定位为一个基于细粒度专家混合（MoE）架构的大语言模型。其主要特点是高效率和可扩展性，旨在为开发者和研究人员，特别是在资源受限的环境中，提供高级推理和通用应用能力。Hunyuan-A13B是由原来的微软的WizardLM团队成员打造（二代WizardLM2在2024年开源打败了所有闭源模型，仅次于最新的GPT-4，似乎这件事在微软内部引起了很大的问题，不久后撤回了这个模型，团队成员也离职了，后面加入了腾讯）。

Hunyuan-A13B核心功能与技术特点

Hunyuan-A13B定位非常明确：一个为资源受限环境设计的高性能、高效率的通用大语言模型。它采用MoE（混合专家）架构，总参数800亿，每次推理激活130亿参数。模型最高支持256K的超长上下文推理。

这意味着，Hunyuan-A13B 在实际运行时，其计算开销和内存占用仅与一个13B规模的模型相当，但其知识储备和能力上限却是由800亿总参数决定的。

Hunyuan-A13B模型和Qwen3的混合推理架构类似，引入了一个非常人性化的设计——混合推理模式（Hybrid Inference）。用户可以根据需求，在“快思”（fast thinking）和“慢想”（slow thinking）之间灵活切换。

快思模式: 适用于常规问答、文本生成等需要快速响应的场景。

评测基准	OpenAI o1	Hunyuan-A13B-Instruct	Qwen2.5-72B	Qwen3-235B-A22B	DeepSeek-R1-0528
MMLU(知识问答)	91.80	88.17	86.10	0.00	0.00
MMLU Pro(知识问答)	91.04	67.23	58.10	68.18	85.00
GPQA Diamond(常识推理)

Topic	Bench	OpenAI-o1-1217	Qwen3-A22B	Hunyuan-A13B-Instruct
Agent	BDCL v3	67.8	70.8	78.3
	τ-Bench	60.4	44.6	54.7
Mathematics	AIME 2024	74.3	85.7	87.3
Reasoning	BBH	80.4	88.9	89.1

Bench	Hunyuan-A13B-Instruct (原始)	Hunyuan-A13B-Instruct-FP8	Hunyuan-A13B-Instruct-GPTQ-Int4
AIME 2024	87.3	86.7	86.7
Gsm8k	94.39	94.01	94.24
BBH	89.1	88.34	87.91

腾讯开源Hunyuan-A13B大模型：MoE架构，混合推理（支持直接回复和带推理过程后回复），原WizardLM团队打造，评测结果超Qwen2.5-72B，接近Qwen3-A22B，但参数量只有一半

Hunyuan-A13B核心功能与技术特点

DataLearner 官方微信

Hunyuan-A13B评测结果：接近Qwen-235B-A22B水平

Hunyuan-A13B量化压缩：模型规模下降3/4，性能几乎不影响

Hunyuan-A13B模型的开源情况和其它信息