赞
踩
评测通知 | NLPCC2024评测任务:名词短语指代链抽取
评测任务介绍: https://ncce-site.pages.dev/registration
数据和基线模型: https://ncce-site.pages.dev/dataset
预测结果提交: https://www.codabench.org/competitions/3179
本次挑战赛聚焦名词短语链抽取,通过对文档中名词短语的识别和聚类,实现对提及相同话题或语义相关的名词短语的准确抽取和聚类。挑战赛旨在促进相关领域学者的交流合作,推动汉语篇章理解技术的发展。
“2024 名词短语链抽取(Nominal Compound Chain Extraction, NCCE)挑战赛”已经开启报名。竞赛最终排名靠前的参赛者将收到NLPCC提供的获奖证明,并有机会撰写技术论文投稿发表至NLPCC 2024 Shared Task Track。
评测任务基于篇章级名词短语链数据集,此数据集文档的主题为突发事件、时政消息等,共包括2450篇中文文档,约2.6万个名词短语和5千条共指代链。
词汇链是指篇章中的名词通过共指、上下位等关系组合成若干条链,可以有效增强对于篇章语义和线索的理解。传统的词汇链涉及的词汇较短,由此形成的词汇链无法准确描述相关的名词在篇章中的演化规律。为此,我们提出了篇章级的名词短语链抽取任务,旨在识别出篇章中的最长名词短语及其组成的链条。
如下所示:图中标注为同一颜色的名词短语可以组成同一条链。本次评测任务鼓励参赛者识别出名词短语,并且判断其依赖关系,最终组成若干条名词短语链。
本任务可以分为两个阶段执行:
第一阶段:名词短语识别
给定一篇文章,需要模型从中识别出所有最长名词短语。
第二阶段:名词短语链识别
根据给定的文档和抽取出的名词短语,识别出具有语义相关关系的名词短语,进而组成若干条链。
从形式上看,本任务类似于指代消解;从内涵上看,与指代消解有所不同,后者倾向于识别唯一指代的名词实体组成一条链,本任务中链的确定是基于名词语义相关关系,且本任务涉及的是最长名词短语而非较短的名词实体,因而更具有挑战性。
2024年3月25日:训练集发布
2024年6月11日:注册截止
2024年6月11日:测试集发布,开放提交预测结果
2024年6月20日:提交预测结果截止
2024年6月30日:测试集标签发布,开放投稿
2024年7月20日:投稿截止
任务网站注册
填写报名表:https://ncce-site.pages.dev/registration
获取数据
数据和基线模型:https://ncce-site.pages.dev/dataset
评测系统提交
提交预测结果:https://www.codabench.org/competitions/3179
费豪,新加坡国立大学
李波波,武汉大学
姬东鸿,武汉大学
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。