当前位置:   article > 正文

NLP-机器翻译:数据集介绍及预处理_nlp 翻译 数据集

nlp 翻译 数据集
  • 1.8 million的文章
  • 超过650k手动编写的文章摘要
  • 超过1.5 million 的人工标记的文章,标记包括 人物,地点,组织,标题,主题
  • 超过275k使用算法生成标记的文章
  • 用于解析xml文件的java工具

语料库中有650k个手动编写的文章摘要,这个可以用于文档摘要生成算法的评估,




参考资料:
New York Times Corpus 介绍 (未完待续)
The New York Times Annotated Corpus

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Monodyee/article/detail/492251
推荐阅读
相关标签
  

闽ICP备14008679号