当前位置:   article > 正文

自然语言理解(nlp)中的一些基本概念_nlp任务中的符号有哪些

nlp任务中的符号有哪些

1、标记(Token):

具有已知含义的字符串,标记可以是单词、数字或只是像标点符号的字符。“你好”、“123”和“-”是标记的一些示例。

2、句子(Sentence):

是一组意义完整的记号。“天气看起来不错” 是一个句子的例子,句子的标记是【“天气”, “看起来”, “不错“】。

3、段落(Paragraph):

句子或短语的集合,也可以将句子视为段落的标记。
文档(Documents): 可能是一个句子、一个段落或一组段落。发送给个人的文本消息是文档的一个示例。

4、语料(Corpus):

通常是作为词袋的原始文档集合。语料库包括每个记录中每个单词的 id 和频率计数。语料库的一个例子是发送给特定人的电子邮件或文本消息的集合。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/很楠不爱3/article/detail/297890
推荐阅读
相关标签
  

闽ICP备14008679号