赞
踩
中文医学NLP评测基准CBLUE
中文医学信息处理评测基准CBLUE的全称是Chinese Biomedical Language Understanding Evaluation,CBLUE由中国中文信息学会医疗健康与生物信息处理专业委员发起,由阿里云天池平台承办,目标是推动国内医疗处理领域的技术发展和人才培养。
CBLUE于2011.4月份推出了1.0版本,由医渡云(北京)技术有限公司、平安医疗科技、阿里夸克、鹏城实验室、北京大学、哈尔滨工业大学(深圳)、同济大学、郑州大学等开展智慧医疗研究的单位共同协办。 榜单涵盖了医学文本信息抽取(实体识别、关系抽取)、医学术语归一化、医学文本分类、医学句子语义相关性判定4大类常见的医疗信息处理任务,共包含8个子任务,数据集是由CHIP会议往届的学术评测比赛和夸克医疗搜索业务数据集组成,是业界首个中文医学NLP领域的公开benchmark。
CHIP的全称是China Health Information Processing Conference,是中国中文信息学会医疗健康与生物信息处理专业委员会主办的关于医疗、健康和生物信息处理和数据挖掘等技术的年度会议,是中国健康信息处理领域最重要的学术会议之一。截止到2022年CHIP已经连续举办了七届,每年都有很多医界、学界、业界的专家参与,从事医疗健康赛道的同学们可以关注下这个会议: http://cips-chip.org.cn/
CBLUE1.0经过9个月的发展,截止2022.1月份已累计超过1,200组数据集申请,有接近400支队伍在CBLUE1.0榜单上提交模型评估结果,打榜机构来自于知名互联网大厂、医疗AI企业、医学院&医学研究院和高校,受到了政产学研界的广泛关注[1,2,3,4]。CBLUE工作组还推出了配套的baseline代码[5],对于医学AI或者NLP的初学者比较友好,目前已经被浙江大学软件学院《自然语言处理》课程作为课程配套实践项目,累计培养研究生100余人。初步达到了CBLUE的建设目标:推动国内医疗处理领域的技术发展和人才培养。
在CBLUE发起之初,我们就计划将其建设成一个不断更新的评测基准,CBLUE要代表先进的技术方向,要贴近实际临床,对医疗AI应用落地要起到引导作用。因此在1.0时期,我们就同步开启了2.0的建设工作。CHIP2021大会的CBLUE发布会上,专委会秘书长汤步洲教授也对2.0规划做了简单介绍:
CBLUE2.0发布会
CBLUE2.0的共建单位新增了“复旦大学”、“腾讯天衍实验室”和“中山大学”几家单位,任务种类由1.0的4大类扩充为5大类,子任务由8个增加到15个。总体来说,相比1.0版本CBLUE2.0有如下几个主要变化:
随着“互联网+医疗”的迅速发展,在线问诊平台逐渐兴起,在政策和疫情的影响之下,在线问诊需求增长迅速。然而医生资源是稀缺的,由此促使了自动化医疗问诊的发展,以人机对话来辅助问诊过程,我们判断未来基于基于对话的医学自然语言处理必然会受到更多学者的关注和投入,因此将对话类任务列成一个大类。
CBLUE2.0任务概图
CBLUE2.0的发布要特别感谢中国中文信息学会医疗健康与生物信息处理专业委员的认可和支持,感谢专委会秘书长汤步洲老师的大力支持。欢迎国内开展医疗AI的同行们对榜单多提建议并参与到榜单的建设中,一起推进我国医疗AI社区的发展和创新。
[1] https://mp.weixin.qq.com/s/wIqPaa7WBgkxUGLku0RBEw
[2] http://cips-chip.org.cn/2021/CBLUE
[3] https://baijiahao.baidu.com/s?id=1717484132439444143&wfr=spider&for=pc
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。