当前位置:   article > 正文

数据挖掘4:自然语言处理(NLP)信息提取技术_根据自然语言提取数据库字段

根据自然语言提取数据库字段

 

目录

第1步:基础知识

第2步:确定宏观与微观理解

第3步:确定您想要的是什么(在合理的成本内)

第4步:理解整个文档(宏观理解)

第5步:提取事实,实体和关系(微观理解)

第6步:保持原产地/可追溯性

第7步:人工辅助过程


 

 

一旦识别提取清理了用例所需的内容,下一步就是要了解该内容。在许多用例中,具有最重要信息的内容以自然语言(例如英语,德语,西班牙语,中文等)写下,并且不方便地标记。要从此内容中提取信息,您需要依赖某些级别的文本挖掘,文本提取或可能的全自然语言处理(NLP)技术。

互联网内容的典型全文提取包括:

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/酷酷是懒虫/article/detail/826371
推荐阅读
相关标签
  

闽ICP备14008679号