当前位置:   article > 正文

朴素贝叶斯案例2:拼写纠错(python实现)

朴素贝叶斯模型进行文本纠错

拼写纠错案例思想:

    当用户输入了一个不在字典中的单词,我们需要去猜测:“这个家伙到底真正想输入的单词是什么呢?”用形式化的语言来叙述,就是我们需要求得:

    P(我们猜测他想输入的单词 | 他实际输入的单词)

    比如用户输入thew,那么猜测他到底想输入the,还是thaw,还是其他的单词?到底哪一个单词的可能性比较大?这时候我们就可以用贝叶斯去求出每个词语的可能性。

    不妨把我们的猜测记为h1、h2、...hn,他们都属于一个有限且离散的猜测空间H(单词总共就只有那么多,H代表hypothesis),将用户实际输入的单词记为D(D代表data,即观测数据),于是问题转为:  

     P(我们的猜测1 | 他实际输入的单词)可以表示为P(h1|D),依次对于猜测2,则表示为P(h2|D),我们需要计算这些概率值,取最大的。

    把所有的猜测先统一记为P(H|D),运用一次贝叶斯公式,我们得到&#x

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/知新_RL/article/detail/347813
推荐阅读
相关标签
  

闽ICP备14008679号