赞
踩
在阅读本章之前,我个人觉得需要自己先去了解一下贝叶斯和全概率公式和贝叶斯网络的知识,这样子读起来会比较容易。
这里推荐两个B站的视频作为入门:
1、贝叶斯和全概率公式介绍(极力推荐、特别好理解)
2、贝叶斯网络
贝叶斯网络实际上可以看成是马尔科夫链的升级版。
马尔科夫链描述了一种状态序列,其每个状态值取决于前面有限个状态。
而在实际生活中,各个事物之间是很难只用一条链串接起来的,是错综复杂的,如下图就是一个贝叶斯网络:
在贝叶斯网络中,有的状态是直接相连的,说明是存在因果关系的。对于没有直接相连但是间接相连的状态,只能说它们是间接相关的。
并且在这些因果关系中,是可以有一个量化的可信度的,也就是说贝叶斯网络的弧上是可以有附加权重的。
下面举一个贝叶斯网络实际的例子,如下图所示:
在贝叶斯网络中,联合概率公式可以表示为
因此,通过这个我们就可以轻而易举地计算出如下:
并且通过贝叶斯公式,如下
又可以方便地计算出如下数据:
从上面地例子中可以看到,在计算数值的时候,也只考虑了前面一个状态,这一点和马尔科夫链相同。
前几章的时候介绍过利用余弦定理对新闻进行归类,但是对于一个类别中通常包含哪些词,这些词又是属于什么概念的没有细说。
对此,Google采用的就是基于贝叶斯网络的方法。如下图所示:
通过计算,就可以寻找到每个概念和每个词之间的相关系以及词和词之间的相关性。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。