赞
踩
最近发现了一个医疗行业的数据集任务榜单: 中文医疗信息处理挑战榜,本着利己利他的原则简单记录下这个数据集榜单,方便后续学习使用。
从名字来看,CBLUE又是一个*LUE榜单,大家都知道近年来NLP领域随着预训练语言模型(下面简称PTLM)的兴起又迎来了一波迅猛发展,得益于PTLM技术的推动,催生出一批多任务的benchmark榜单,代表性的工作是GLUE,在中文领域也有CLUE。CBLUE的全名是Chinese Biomedical Language Understanding Evaluation,是目前国内首个医疗AI方向的多任务榜单,相信这个榜单的推出会促进医疗语言模型的发展和医疗NLP领域的发展。榜单的官网介绍如下:
中文医疗信息处理挑战榜CBLUE(Chinese Biomedical Language Understanding Evaluation)是中国中文信息学会医疗健康与生物信息处理专业委员会在合法开放共享的理念下发起,由阿里云天池平台承办,并由医渡云(北京)技术有限公司、北京大学等开展智慧医疗研究的单位共同协办,旨在推动中文医学NLP技术和社区的发展。
官网介绍榜单一共包含了4大类8细类任务,下面分别介绍:
榜单设置基本覆盖了*LUE的问题大类,数据集来源分布广,包括了医学教科书、指南、临床试验文本以及互联网用户真实Query,是一个非常好的医疗NLP榜单。希望这个榜单能促进行业数据标准化并进一步推进医疗AI的快速落地。
最后附上CBLUE榜单的相关链接:
CBLUE官方网站:
https://tianchi.aliyun.com/cblue
CBLUE数据集具体介绍&下载页面:
CBLUE Paper: https://arxiv.org/abs/2106.08087
CBLUE Github:CBLUEbenchmark/CBLUE
觉得有用的筒子们帮忙点赞和关注哈~
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。