赞
踩
列举一个模型:实现判别男女的功能,也即表示模型对样本所表示的人的性别做出判断。
一个模型接受3个收入,1个输出。作为输入的数值,称为特征,它们描述现实世界的一个事物。作为输出的数值,称为标签,它们描述判断一个样本结果是否计算正确。
3个输入分别是一个人的身高、体重和体脂率。
1个输出是0或1,0代表女性,1代表男性。
用这3个特征代表一个人,它们构成一个样本(sample)。
这3个特征经过某些计算(模型),最后输出一个数值0或1。
格式:(身高,体重,体脂率)(Height, weight, body fat percentage)(H,W,BFP)
女性:
(162,49,0.22)
男性:
(182,72,0.17)
f
(
x
)
=
1.0
∗
H
+
1.0
∗
W
−
100.0
∗
B
F
P
(1.0)
f(x)=1.0*H+1.0*W-100.0*BFP\tag{1.0}
f(x)=1.0∗H+1.0∗W−100.0∗BFP(1.0)
y
=
{
1
,
f
(
x
)
≥
200
;
0
,
f
(
x
)
<
200
,
(1.1)
y={1,f(x)≥200;0,f(x)<200,\tag{1.1}
y={1,0,f(x)≥200;f(x)<200,(1.1)
为什么身高和体重的权重为1.0 ,而体脂率的权重为100.0?
普遍性,男性身高和体重大于女性,用权重1.0乘以身高和体重,男性相比女性得到较大的值。另外,女性在体脂率这块,大于男性,将权重-100.0赋予体脂率,女性会得到更小(绝对值更大)的负值。
体脂率在量级上是身高或体重的百分之一(例如,0.17对182或72),所以权重的绝对值较大(100.0),这使体脂率的作用不至于被其他特征淹没。
为什么以200为分界点?
因为目前就两个样本来说,男性样本计算出来的值是237,女性样本计算出来的值是189,恰好以200为分界点能分开这仅有的两个样本。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。