当前位置:   article > 正文

文本摘要(Text Summarization)_text summary算法

text summary算法

文本摘要(Text Summarization)

Text Summarization.

随着近几年文本信息的爆发式增长,从大量文本信息中提取重要的内容,已成为一个迫切需求,而自动文本摘要(automatic text summarization)则提供了一个高效的解决方案。

文本摘要是利用计算机按照某类应用自动地将文本(或文本集合)转换生成简短摘要的一种信息压缩技术。

要求:

  • 足够的信息量
  • 较低的冗余度
  • 较高的可读性

本文目录:

  1. 数据集和评价指标
  2. 抽取式摘要
  3. 生成式摘要

1. 数据集和评价指标

Benchmarks

文本生成摘要技术最常用的公开数据集是CNN/DailyMail

该数据集是2016年IBM Watson公开的,用于多句文本摘要任务,为此后大量的相关工作提供了数据保障。

论文:Abstractive text summarization using sequence-to-sequence rnns and beyond

Evaluation

目前文本摘要生成领域应用最广泛的自动评价指标是ROUGE(Recall-Oriented Understudy for Gisting Evaluation)

ROUGE是Lin提出的一个指标集合,包括一些衍生的指标

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/532502
推荐阅读
相关标签
  

闽ICP备14008679号