赞
踩
MTEB(Massive Text Embedding Benchmark)是目前评测文本向量很重要的一个参考,其榜单也是各大文本向量模型用来展示与其他向量模型强弱的一个竞技台。
C-MTEB则是专门针对中文文本向量的评测基准。
MTEB的目的是为了评估向量模型在不同向量任务上的表现,希望作为寻找适用于不同任务的通用文本向量的入口。在论文里说包括涵盖112种语言的58个数据集,针对如下8种任务:
在记录的此刻,MTEB的榜单上写的支持的数据集是150个、语言是113种
在论文里作者们说在评测了30多个模型后,发现没有任何一个模型能够在全部任务上占据优势,即使在记录的2024年3月榜单上也没有一个模型能在所有任务上都排名第一。
MTEB基于如下需求构建:
上图展示了基准中包括的8类任务对应的数据集。任务描述详情如下:
MTEB中的数据集可以归为三类:
C-MTEB是为了评估中文文本向量,共收集了如上图所示的35个公共数据集,一共分为6类的评估任务:
向量在每个任务上的表现是对应任务下所有数据集的平均指标来决定,而向量整体性能是所有数据集的平均值决定的。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。