基于AI的自然语言处理_科大讯飞ai语言模型怎么控制字数和字数

作者：我家自动化 | 2024-07-09 01:33:41

踩

科大讯飞ai语言模型怎么控制字数和字数

自然语言处理( Natural Language Processing, NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。

一、文本分类

技术思想及原理分析

文本分类就是对一段话进行区分是哪个类别，比如一篇新闻所属的行业类别、一段文字的情感分析、一段评论的结果倾向等，都属于对文本的分类。文本分类是先对同一类别的文本打上相同的标签，然后让模型去学习针对不同类别的文本特征。当模型学习到了每个类别的特征后，在使用过程当中，就可以对不同类别的文本进行分类了。在对文本进行分类训练之前，先要对文本进行分词处理，然后让模型学习各个词之间的关系，最后根据每个词的词向量组合形成句向量，段向量，最后是一篇文章的向量，这篇文章的向量经过转化就是最终所属的类别。

应用场景及商业价值

文本分类模型应用有很多细分领域，比如情感倾向分析、情绪类别判断、文章类型分类、评论区留言分类判断等。有了文本分类模型，很多原来需要人工分类判断的文本信息就可以由AI来完成了，不但大大节约了人力成本，还降低了使用门槛，让原来只有专业人士才能做的工作，有了AI文本分类模型的辅助，普通人也能够做了。

二、文章摘要

技术思想及原理分析

文章摘要就是输入一篇文章，然后让模型去理解这篇文章的内容含义，最后根据整体内容提炼出关键的信息做为这篇文章的摘要信息。很明显，模型的输入是一篇字数较多的文章，而模型的输出则是一段字数简短的摘要信息。也就是输入端和输出端的的字数长度都是不确定的。使用神经网络的方法就需要创建一个输入和输出长度都不一样的模型来实现。而语言模型的输入语料前后之间都是有关联的。基于循环神经网络RNN的复合变种模型SEQ2SEQ是比较适合来解决此类问题的。在SEQ2SEQ的模型中，主干网络可以是RNN，也可以是GRU、SRU等模型。下面是输入和输出长度都不一样的SEQ2SEQ模型，输入为4个值，输出为3个值。

应用场景及商业价值

文本摘要的主要应用在新闻行业较广泛，可快速对一些新闻提取重要观点内容，根据提取的观点内容进行分门别类，或者利用对新闻提取到的新闻观点，做为新闻概要展示或者做为读者快速阅读部分。对于其他类型的文章，也可以根据提取到的文章摘要来判断文章的观点等内容。

三、阅读理解

技术思想及原理分析

阅读理解和前面所讲的文章摘要刚好相反，文章摘要是把长篇文章内容压缩成简短的概要，以供读者快速阅读或者分辨；而阅读理解是根据文章中的某段话，提出自己的理解。一篇文章中的一句话很短，但是在阅读理解中却要花费较长的语句来描述，比如文章中说了一句话，要理解这句话的引申义，就需要更多的文字来描述，所以阅读理解输入是较短的语句，输出则是较长的语句。阅读理解对于模型的难度往往比文章摘要高的多，其主要原因就是一句话的语境不同，其要表达的含义也不同，所以要理解文章中某句具有特殊含义的话，需要进入文章中的相关前后文去理解才行，甚至很多模型需要加入注意力机制来更好的理解语句的含义。阅读理解的深度学习模型有BIDAF、R-Net、QANet以及目前在语言模型较火的transformer、Bert、GPT系列等。下面展示的是QANet模型的结构。

应用场景及商业价值

阅读理解的应用范围非常之广，可以说如果AI真正的掌握了阅读理解，也就实现了真正意义上的认知智能。目前AI在阅读理解方面学到的知识非常有限，只能做一些基本的理解，无法做到像人类一样，能够理解到同样的语言子啊不同的语境下的含义，不过随着AI的发展，尤其是以深度学习为主的模型的快速发展，相信不久就能够看到和人类阅读理解能力相当的智能产品了。

四、智能对话

技术思想及原理分析

智能对话就是人类和机器对话，可以是问答形式，也可以是聊天的形式，常用的技术主要有以RNN为基础的SEQ2SEQ模型，其原理是通过对提问者发的的语言词向量进行学习，输出对应的答案为标签。通过大量语料库的学习，让模型具备一定的对话能力。目前的对话模型基本都能够回答某特定领域的问题，比如行业客服机器人、生活聊天机器人等。下图是一个简单SEQ2SEQ的对话模型。

应用场景及商业价值

对话模型的应用产品最为常见，比如电商的客服机器人、地图AI助手、微软小娜等，都属于对话模型的产品，对话可以是文字形式的，也可以是语音形式的，如果是语音的形式的对话，就不仅仅是自然语言领域了，还要涵盖语音识别方向了。电商平台的智能客服的主要作用是帮助平台提高服务效率，降低人工成本。其他平台的产品大多也都是为了提高服务体验。所以目前的智能对话模型基本都是工具类的应用，生活类的对话模型难度比较大，因为生活中的语料数据是非常庞大的，不像工具类的语料数据较小，很容易学习。一个真正意义上的对话机器人是要将阅读理解学习到位的模型才可以的。

五、机器翻译

技术思想及原理分析

机器翻译原理上和对话模型一样，只不过对话模型要提取的特征是一句话的逻辑语义信息，用来预测后面语句的输出概率。翻译模型是在提取一句话的语义信息后，对应的不是后面的语句，对应的另一种表达形式，也就是新的一种语言的表达形式。比如英文翻译成中文，就是先将一句话的英语表达提取成中间向量特征，然后再将中间的向量特征翻译成对应的中文。其应用较为广泛的模型以带了注意力机制的编解码模型SEQ2SEQ为主。下图就是SEQ2SEQ的语言翻译模型。

应用场景及商业价值

翻译模型的应用在生活和工作中都很常见，其主要价值就是对一些要求不是非常高的翻译，使用机器来翻译，能够提高翻译效率，降低人工成本。比如谷歌网站上的自动翻译、以及国内的很多自动翻译的工具都是机器翻译，很多时候直接使用机器翻译，会有一些误差。尤其是对某些专业领域的专业词的翻译偏差还是较大的。和对话模型一样，想要让机器翻译做的和人工翻译一样，必须要达到让模型理解语境才可以。

六、文本生成

技术思想及原理分析

文本生成是一种创造性的工作，比如让神经网络写一篇文章，写一首诗词等，都算是文本生成类的任务。文本生成模型通过学习大量的某类型的语料数据就可以生成这一类别的文章，目前流行的文本生成类模型还是以transformer、Bert、GPT以及他们的一些变种模型为主。其难度是由于模型通过不断的堆叠编码器和解码器导致其参数越来越多，对算力要求也越来越大，不利于小型设备训练和使用。下图是transformer模型的结构图，一个较小的模型就有6个编码器和6个解码器堆叠而成，而每个编码器和解码器并不是卷积模型，全都是全连接模型，这导致了参数量进一步的增大。

应用场景及商业价值

文本生成主要可以用来写文章，自动生成新闻，自媒体软文等，其应用范围非常广泛，但是想要达到好的效果，还是要更大的模型才能完成的。如果受限于设备的算力，无法使用较大的模型来训练，可以考虑云算力来提高训练效率。下面是训练了十几首唐诗，来自动生成诗词的GPT2的模型，可以看到，由于数据量较小，模型学习到的字数也不多，只能从很小的可学习的字库中拼凑，诗词效果也就一般。

关注微信公众号：深度人工智能学院，获取更多人工智能方面的知识！

官方公众号官方微信号

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/我家自动化/article/detail/801024