MMEB-v2-Image
MMEB(Massive Multimodal Embedding Benchmark)是一个用于评估多模态嵌入模型的基准测试框架。该基准最初聚焦于图像-文本嵌入,并在后续版本中扩展到文本、图像、视频和视觉文档输入。MMEB通过收集多样化数据集,提供一个统一的评估平台,用于测试模型在分类、检索和其他任务上的性能。
更新于 2026年1月9日·836 次浏览
- 问题数量
- 36
- 发布机构
- TIGER-Lab
- 评测类别
- 图像向量嵌入
- 评测指标
- Accuracy
- 支持语言
- 英文
- 难度等级
- 中等难度
简介
用于评测大模型图像向量嵌入能力的评测基准
MMEB-v2-Image评测最新大模型排名与完整榜单数据
查看 MMEB-v2-Image 的最新得分、模型模式、发布时间与参数规模,快速了解当前完整榜单表现。
数据来源:DataLearnerAI
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
模型模式说明
MMEB-v2-Image 排名
| 排名 | 模型 | 开源情况 | |||
|---|---|---|---|---|---|
80.12 | 2026-01-08 | 80亿 | 免费商用 | ||
77.99 | 2025-12-15 | 未知 | 闭源 | ||
77.78 | 2025-06-28 | 未知 | 闭源 | ||
4 | 74.96 | 2026-01-08 | 20亿 | 免费商用 | |
5 | ![]() GME-Qwen2-VL-7B 常规模式 | 55.95 | 2024-12-24 | 70亿 | 免费商用 |
6 | ![]() GME-Qwen2-VL-2B 常规模式 | 51.89 | 2024-12-24 | 20亿 | 免费商用 |

