赞
踩
书中定义的统计自然语言处理由所有的自动语言处理的定量方法组成,包括概率模型,信息论,线性代数。代表自然语言处理中非符号化和非逻辑的工作。
语言的非绝对性,需要利用统计观察来考察问题。
因为生活中充满了不确定和不完整的信息,为了能和世界有效的相互作
用,我们需要处理这类信息,所以概率论和随机过程给我么一个可以处理不确定和不完整信息架构的量化框架
这里只是因为想到认知是随机的,所以推广到语言,但是我认为问题是需要针对特定问题的,在这里我认为语言处理的第一步就是需要让机器知道我们的某些想法,并且完成某些事情。如果阶段性的去划分这样一个过程,我觉得应该是这样。
下命令->执行命令
1.给出具体某一条命令,电脑执行某一条命令:开机/关机
2.给出命令,电脑反馈所有能执行的命令:明天天气真好->各个游玩地点信息,日程安排等。。。
3.给出任意命令,准确知道我要干什么。
那么以上的问题首先就是机器要能做某些事情。
语言就是信息,信息就是一定要传达某种内容,目标就是解析内容嘛!
其实我还没有觉得有什么歧义的问题,首先你必须知道这个句子中的每个词语和字,如果这个都不知道肯定分析不出来嘛,我还是那个观点,每个人心中对词都有一个词网,“南京市长江大桥”如果我知道这个地方,OK,那么这个词就是一个固定词,如果不知道,那么我就要用已知的方式去猜测,长江大桥我有概念,南京市我也知道。如果能精确的让我去划分这个短语
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。