QW

Qwen3-Embedding-4B

embedding模型

Qwen3-Embedding-4B

发布时间: 2025-06-05更新于: 2025-06-06 08:18:561,556

在线体验GitHubHugging Face Compare

模型参数

40亿

上下文长度

32K

中文支持

支持

推理能力

Qwen3-Embedding-4B 是由阿里巴巴发布的 AI 模型，发布时间为 2025-06-05，定位为 embedding模型，参数规模约为 40.0B，上下文长度为 32K，模型文件大小约 8GB，采用 Apache 2.0 许可。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

Qwen3-Embedding-4B

模型基本信息

推理过程

不支持

思考模式

不支持思考模式

上下文长度

32K tokens

最大输出长度

4096 tokens

模型类型

embedding模型

发布时间

2025-06-05

模型文件大小

8GB

MoE架构

否

总参数 / 激活参数

40 亿 / 不涉及

知识截止

暂无数据

Qwen3-Embedding-4B

开源和体验地址

代码开源状态

预训练权重开源

Apache 2.0- 免费商用授权

GitHub 源码

暂无GitHub开源地址

Hugging Face

https://huggingface.co/Qwen/Qwen3-Embedding-8B

在线体验

暂无在线体验地址

Qwen3-Embedding-4B

官方介绍与博客

官方论文

Qwen3 Embedding: Advancing Text Embedding and Reranking Through Foundation Models

DataLearnerAI博客

暂无介绍博客

Qwen3-Embedding-4B

API接口信息

接口速度

4/5

暂无公开的 API 定价信息。

Qwen3-Embedding-4B

评测结果

Qwen3-Embedding-4B 当前已收录的代表性评测结果包括 MTEB（2 / 5，得分 69.45）。本页还汇总了参数规模、上下文长度与 API 价格，便于结合评测结果与部署约束一起判断模型适配度。

文本向量检索

共 1 项评测

评测名称 / 模式

得分

排名/总数

常规模式

69.45

2 / 5

查看评测深度分析与其他模型对比

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合？打开对比工具

Qwen3-Embedding-4B

发布机构

阿里巴巴

查看发布机构详情

Qwen3-Embedding-4B

模型解读

Qwen3-Embedding-4B是阿里开源的40亿参数规模的向量大模型，支持100+多种语言。它是Qwen3 Embedding系列开源模型的一员，该系列基于Qwen3基础模型开发，专为文本嵌入、检索和排序任务而设计。

Qwen3-Embedding-4B模型同样继承了其基础模型的多语言理解与长文本处理能力。该模型拥有40亿参数，支持32k的上下文长度，其嵌入维度为2560，并允许用户自定义输出维度。

核心特性

模型架构与训练

Qwen3-Embedding-4B基于Qwen3基础模型，采用双编码器（dual-encoder）架构设计，并通过LoRA进行微调，以保留和增强基础模型的文本理解能力。该模型通过处理单个文本段落作为输入，并利用最后一个[EOS]标记对应的隐藏状态向量来提取语义表示。

其训练过程遵循一个三阶段范式：首先是使用大量弱监督数据进行对比预训练；第二阶段使用高质量的标记数据进行监督训练；最后阶段则通过合并策略整合多个候选模型以提升整体性能。

性能表现

Qwen3-Embedding-4B在多个行业标准基准测试中取得了有竞争力的分数：

这些数据表明，Qwen3-Embedding-4B模型在多语言、英语和中文的各类嵌入任务中均表现稳健，为用户在性能和资源消耗之间提供了一个平衡的选择。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送

DataLearner 官方微信二维码