当前位置:   article > 正文

司法摘要方案总结

司法摘要方案总结

0. 文本摘要简介

  文本摘要:通过自动分析给定的文档或文档集,摘取其中的要点信息,最终输出一篇短小的摘要(通常包含几句话或上百字),该摘要中的句子可直接出自原文,也可重新撰写所得。摘要的目的是通过对原文本进行压缩、 提炼,为用户提供简明扼要的内容描述。

  文本摘要的两种生成方法:

  1. 抽取式摘要:抽取式方法则相对比较简单,通常利用不同方法对文档结构单元(句子、段落等)进行评价,对每个结构单元赋予一定权重,然后选择最重要的结构单元组成摘要。抽取式方法应用较为广泛,通常采用的结构单元为句子;
  2. 生成式摘要: 生成式方法通常需要利用自然语言理解技术对文本进行语法、语义分析,对信息进行融合,利用自然语言生成技术生成新的摘要句子。

1. 方案一

  题目为“抽取-生成”式长文本摘要的新技巧。

  主要内容分为方法概述、抽取模型、生成模型。该模型为“SPACES”模型的主要组成部分,并且会分享一些提升性能的新方法。

1.1 方法概述

1.1.1 数据分析

  对训练数据进行数据统计是极其重要的,包括对训练集数据量、序列长度。如果是分类任务,则需要进行类别分布的统计判断。

  下面是赛题训练数据的一些基本情况:

  1. 总量:9484
  2. 输入:平均字数2568,字数标准差1122,最大字数13064,最小字数866。
  3. 输出
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/神奇cpp/article/detail/780147
推荐阅读
相关标签
  

闽ICP备14008679号