赞
踩
Pima Indians数据集为糖尿病患者医疗记录数据,是一个二分类问题。本代码采用80%数据训练,20%数据测试的方法。若数据不做归一化处理,最终模型的分类精度为 79.17%;而数据进行归一化以后,最终模型的分类精度为81.38%。
""" 数据集中的feature解释: Number of times pregnent: 怀孕次数 Plasma glucose concentration a 2 hours in an oral glucose tolerance test: 2小时口服葡萄糖耐量试验中血浆葡萄糖浓度 Diastolic blood pressure(mm Hg): 舒张压 Triceps skin fold thickness(mm): 三头肌皮褶皱厚度 2-hour serum insulin(mu U/ml): 2小时血清胰岛素 Body mass index(weight in kg/(height in m)^2): 身体质量指数 Diabetes pedigree function: 糖尿病谱系功能 Age(years): 年龄 Class variable(0 or 1): 是否是糖尿病 """ from keras.models import Sequential from keras.layers import Dense import numpy as np import pandas as pd from sklearn import preprocessing from sklearn.model_selection import train_test_split # 选用初始化随机数种子,确保输出结果的可重复 seed = 4 np.random.seed(seed) # 避免第一行变为列名 dataset = pd.read_csv('../data/pima-indians-diabetes.csv', header=None, names=list(np.arange(9)))
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。