赞
踩
一.朴素贝叶斯
1.概述
(1)概念:
"贝叶斯分类"(Bayes Classification)是以贝叶斯定理为基础的分类算法的总称.而"朴素贝叶斯"(Naive Bayes)则是其中最简单,最常见
的1种分类方法,常用于文本分类/欺诈检测/人脸识别."朴素"是指该算法的2个假设:
①特征独立性:每个特征的概率分布都与其他特征独立
②特征均衡性:每个特征都同等重要
(2)步骤:
设全部类别为c1,c2...cm,特征向量为x=(x1,x2...xn)
①计算P(x|ci),P(c),P(x)
②根据贝叶斯公式计算P(ci|x)
③如果P(ci|x)=max{
P(c1|x),P(c2|x)...P(cm|x)},则x∈ci
(3)实例:
假设已经有1000封被标记好了( c 1 c_1 c1表示垃圾邮件, c 2 c_2 c2表示非垃圾邮件)的邮件,要求识别第1001封邮件是否为垃圾邮件.首先构建词汇表,设其中的单词数为 N = n N=n N=n.将邮件 m m m映射到 n n n维向量 x x x m → x = ( x 1 , x 2 . . . x n ) x i = { 1 i f 单 词 w i 在 m 中 出 现 过 0 o t h e r w i s e m→x=(x_{1},x_{2}...x_{n})\\x_{i}=
m→x=(x1,x2</{1if单词wi在m中出现过0otherwise
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。