赞
踩
这篇主要讲一下如何将微博转化成特征向量。
先从自然语言说起吧,自然语言包括自然语言理解和自然语言生成,前者是要使计算机能够理解自然语言文本的意义,而后者是要让计算机以自然语言文本来表达给定的意图。
但是,完成这些是非常困难的,困难之处在于自然语言文本和对话的各个层次上广泛存在各种各样的歧义性或多义性。同时,自然语言的形式与意义之间多对多的关系也增加了一定的难度,也就是说,一个单词可能有多个意义,反过来,一个意义也可以由很多个单词来表示。
因此,自然语言处理的任务就是把带有潜在歧义的自然语言输入转化成某种无歧义的计算机内部表示。
自然语言处理数据的基础就是语料库。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。