当前位置:   article > 正文

ACE 2005多语种训练语料库_ace2005语料集数据量

ace2005语料集数据量

ACE 2005多语种训练语料库
项目名: ACE 2005多语种训练语料库

介绍
ACE 2005多语言培训语料库包含用于2005年自动内容提取(ACE)技术评估的全套英语,阿拉伯语和中文培训数据。语料库由语言数据协会(LDC)在ACE计划的支持下以及LDC的额外协助下,为实体,关系和事件标注的各种类型的数据组成。

ACE程序的目标是开发自动内容提取技术,以支持文本形式的人类语言的自动处理。

2005年11月,对站点的五个主要方面的系统性能进行了评估:实体,价值,时间表达,关系和事件的识别。实体,关系和事件提及检测也作为诊断任务提供。除事件任务外,所有任务均以英语,中文和阿拉伯语三种语言执行。活动任务仅以英文和中文进行评估。此版本包含这些评估任务的官方培训数据。

有关ACE计划语言资源的更多信息,包括注释准则,任务定义和其他文档,请访问LDC的ACE网站。

数据
以下是有关此版本中的数据量及其注释状态的信息。

1P:数据需经过第一遍(完整)注释
DUAL:数据还必须经过双重首次通过(完整)注释
ADJ:数据也会受到差异解决/裁决的影响
NORM:数据也要经过TIMEX2规范化
详见链接: link.

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Gausst松鼠会/article/detail/358454
推荐阅读
相关标签
  

闽ICP备14008679号