当前位置:   article > 正文

[nlp] 抽取式摘要&生成式摘要&抽取生成式摘要_抽取式摘要和生成式摘要

抽取式摘要和生成式摘要

文本摘要简述 | 机器之心

一、抽取式摘要

传统 的抽取式摘要方法使用 图方法、聚类 等方式完成无监督摘要。

基于神经网络的抽取式摘要往往将问题建模为 序列标注句子排序 两类任务。

1.1 传统方法

1.1.1 Lead-3

一般来说,作者常常会在标题和文章开始就表明主题,因此最简单的方法就是抽取文章中的前几句作为摘要。常用的方法为 Lead-3,即抽取文章的前三句作为文章的摘要。Lead-3 方法虽然简单直接,但却是非常有效的方法。

1.1.2 TextRank

TextRank 算法仿照 PageRank,将 句子 作为节点,使用句子间相似度,构造 无向有权边。使用边上的权值迭代更新节点值,最后选取 N 个得分最高的节点,作为摘要。

1.1.3 聚类

将文章中的句子视为一个点,按照聚类的方式完成摘要。例如 Padmakumar and Saran [11] 将文章中的句子使用 Skip thought vectors 和 Paragram embeddings 两种方式进行编

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Cpp五条/article/detail/255782
推荐阅读
相关标签
  

闽ICP备14008679号