赞
踩
id | 刮北风 | 闷热 | 多云 | 预报有雨 | 真下雨? |
---|---|---|---|---|---|
1 | 0 | 1 | 0 | 1 | 0 |
2 | 1 | 1 | 1 | 0 | 1 |
3 | 0 | 1 | 1 | 0 | 1 |
4 | 0 | 0 | 0 | 1 | 0 |
5 | 0 | 1 | 1 | 0 | 1 |
6 | 0 | 1 | 0 | 1 | 0 |
7 | 1 | 0 | 0 | 1 | 0 |
注意:0代表否,1代表是。
我们可以使用上述公式依次计算出真下雨的概率,这里不再计算。我们可以通过代码使用贝努利、高斯、多项式来完成计算。
为了方便继续使用上述数据进行预测,数据截图如下:
代码实现:
from sklearn.model_selection import train_test_split import pandas as pd from sklearn.naive_bayes import BernoulliNB def naviebayes(): # 读取数据 data = pd.read_csv("train_2.csv") # 取出数据当中的特征值和目标值 y = data['真下雨?'] #目标值 x = data[['刮北风', '闷热','多云','天气预报有雨']] #特征值 # 进行数据分割 x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2) #贝努力朴素贝叶斯 clf = BernoulliNB() clf.fit(x_train, y_train) y_predict = clf.predict(x_test) print(x_test) print(y_predict) print("预测的概率为",clf.score(x_test, y_test)) print("--------------------") Next_Day = [[0, 0, 1, 0]] pre = clf.predict(Next_Day) pre2 = clf.predict_proba(Next_Day) print("预测结果为:", pre) # 输出模型预测的分类概率 print("预测的概率为:", pre2) if __name__ == '__main__': naviebayes()
截图:
代码实现:
from sklearn.model_selection import train_test_split import pandas as pd from sklearn.naive_bayes import GaussianNB def naviebayes(): # 读取数据 data = pd.read_csv("train_2.csv") # 取出数据当中的特征值和目标值 y = data['真下雨?'] #目标值 x = data[['刮北风', '闷热','多云','天气预报有雨']] #特征值 # 进行数据分割 x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2) #高斯朴素贝叶斯 gnb = GaussianNB() gnb.fit(x_train, y_train) y_predict = gnb.predict(x_test) print(x_test) print(y_predict) print("预测的概率为",gnb.score(x_test, y_test)) print("--------------------") Next_Day = [[0, 0, 1, 0]] pre = gnb.predict(Next_Day) pre2 = gnb.predict_proba(Next_Day) print("预测结果为:", pre) # 输出模型预测的分类概率 print("预测的概率为:", pre2) if __name__ == '__main__': naviebayes()
截图:
代码如下:
from sklearn.model_selection import train_test_split from sklearn.naive_bayes import MultinomialNB import pandas as pd def naviebayes(): # 读取数据 data = pd.read_csv("train_2.csv") # 取出数据当中的特征值和目标值 y = data['真下雨?'] #目标值 x = data[['刮北风', '闷热','多云','天气预报有雨']] #特征值 # 进行数据分割 x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2) # 多项式朴素贝叶斯 mlt = MultinomialNB(alpha=1.0) mlt.fit(x_train, y_train) y_predict = mlt.predict(x_test) print(x_test) print(y_predict) print("准确率为:", mlt.score(x_test, y_test)) print("--------------------") Next_Day = [[0, 0, 1, 0]] pre = mlt.predict(Next_Day) pre2 = mlt.predict_proba(Next_Day) print("预测结果为:", pre) # 输出模型预测的分类概率 print("预测的概率为:", pre2) if __name__ == '__main__': naviebayes()
截图:
通过对比贝努力、高斯、多项式的结果,预测的准确率不一样,所以我们在开发使用的时候,一定要注意区分这几类。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。