当前位置:   article > 正文

自然语言与编程语言_自然语言伪代码 程序语言区别

自然语言伪代码 程序语言区别

自然语言与编程语言

  1. 自然语言中词汇比编程语言中词汇丰富。
  2. 自然语言是非结构化,编程语言是结构化的。结构化:信息具有明确的结构关系。
  3. 自然语言含有大量歧义。
  4. 容错性。
  5. 易变性。
  6. 简略性。

自然语言处理层次

  1. 语音、图像、文本,其中文本是重中之重。
  2. 词法分析:将文本分割为有意义的词语(中文分词),确定每个词语的类别和浅层的歧义消除(词性标注),识别出专有名词(命名实体识别)。
  3. 信息抽取。
  4. 文本分类、文本聚类。
  5. 句法分析。
  6. 语义分析:确定一个词在语境中的含义,而不是词性(词义消除),标注句子中的谓语和其他成分的关系(语义角色标注),分析句子中词语之间的语义关系(语义依存分析)。

自然语言处理的流派

  1. 基于规则的专家系统
  2. 基于统计的学习方法
  3. 传统方法与深度学习

机器学习

  1. 模型:被学习的算法。
  2. 特征。
  3. 数据集/语料库。
  4. 监督学习。
  5. 无监督学习。
  6. 半监督学习。

语料库

  1. 中文分词语料库
  2. 词性标注语料库
  3. 命名实体识别语料库
  4. 词法分析语料库
  5. 文本分类语料库
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Cpp五条/article/detail/437523
推荐阅读
相关标签
  

闽ICP备14008679号