赞
踩
ACE 2005多语种训练语料库
项目名: ACE 2005多语种训练语料库
介绍
ACE 2005多语言培训语料库包含用于2005年自动内容提取(ACE)技术评估的全套英语,阿拉伯语和中文培训数据。语料库由语言数据协会(LDC)在ACE计划的支持下以及LDC的额外协助下,为实体,关系和事件标注的各种类型的数据组成。
ACE程序的目标是开发自动内容提取技术,以支持文本形式的人类语言的自动处理。
2005年11月,对站点的五个主要方面的系统性能进行了评估:实体,价值,时间表达,关系和事件的识别。实体,关系和事件提及检测也作为诊断任务提供。除事件任务外,所有任务均以英语,中文和阿拉伯语三种语言执行。活动任务仅以英文和中文进行评估。此版本包含这些评估任务的官方培训数据。
有关ACE计划语言资源的更多信息,包括注释准则,任务定义和其他文档,请访问LDC的ACE网站。
数据
以下是有关此版本中的数据量及其注释状态的信息。
1P:数据需经过第一遍(完整)注释
DUAL:数据还必须经过双重首次通过(完整)注释
ADJ:数据也会受到差异解决/裁决的影响
NORM:数据也要经过TIMEX2规范化
详见链接: link.
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。