[nlp] 抽取式摘要&生成式摘要&抽取生成式摘要_抽取式摘要和生成式摘要

作者：Cpp五条 | 2024-03-17 11:29:30

踩

抽取式摘要和生成式摘要

一、抽取式摘要

传统的抽取式摘要方法使用图方法、聚类等方式完成无监督摘要。

基于神经网络的抽取式摘要往往将问题建模为序列标注和句子排序两类任务。

一般来说，作者常常会在标题和文章开始就表明主题，因此最简单的方法就是抽取文章中的前几句作为摘要。常用的方法为 Lead-3，即抽取文章的前三句作为文章的摘要。Lead-3 方法虽然简单直接，但却是非常有效的方法。

TextRank 算法仿照 PageRank，将句子作为节点，使用句子间相似度，构造无向有权边。使用边上的权值迭代更新节点值，最后选取 N 个得分最高的节点，作为摘要。

将文章中的句子视为一个点，按照聚类的方式完成摘要。例如 Padmakumar and Saran [11] 将文章中的句子使用 Skip thought vectors 和 Paragram embeddings 两种方式进行编

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/Cpp五条/article/detail/255782