赞
踩
传统 的抽取式摘要方法使用 图方法、聚类 等方式完成无监督摘要。
基于神经网络的抽取式摘要往往将问题建模为 序列标注 和 句子排序 两类任务。
一般来说,作者常常会在标题和文章开始就表明主题,因此最简单的方法就是抽取文章中的前几句作为摘要。常用的方法为 Lead-3,即抽取文章的前三句作为文章的摘要。Lead-3 方法虽然简单直接,但却是非常有效的方法。
TextRank 算法仿照 PageRank,将 句子 作为节点,使用句子间相似度,构造 无向有权边。使用边上的权值迭代更新节点值,最后选取 N 个得分最高的节点,作为摘要。
将文章中的句子视为一个点,按照聚类的方式完成摘要。例如 Padmakumar and Saran [11] 将文章中的句子使用 Skip thought vectors 和 Paragram embeddings 两种方式进行编
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。