赞
踩
Logistic函数(或称为Sigmoid函数),函数形式为: |
Sigmoid 函数在有个很漂亮的“S”形,如下图所示: |
给定n个特征x=(x1,x2,…,xn),设条件概率P(y=1|x)为观测样本y相对于事件因素x发生的概率,用sigmoid函数表示为: |
那么在x条件下y不发生的概率为: |
假设现在有m个相互独立的观测事件y=(y1,y2,…,ym),则一个事件yi发生的概率为(yi= 1) |
当y=1的时候,后面那一项是不是没有了,那就只剩下x属于1类的概率,当y=0的时候,第一项是不是没有了,那就只剩下后面那个x属于0的概率(1减去x属于1的概率)。所以不管y是0还是1,上面得到的数,都是(x, y)出现的概率。那我们的整个样本集,也就是n个独立的样本出现的似然函数为(因为每个样本都是独立的,所以n个样本出现的概率就是他们各自出现的概率相乘): |
然后我们的目标是求出使这一似然函数的值最大的参数估计,最大似然估计就是求出参数,使得 |
取得最大值,对函数取对数得到 |
这时候,用L(θ)对θ求导,得到: |
θ更新过程可以写成: |
向量化Vectorization Vectorization是使用矩阵计算来代替for循环,以简化计算过程,提高效率。 如上式,Σ(...)是一个求和的过程,显然需要一个for语句循环m次,所以根本没有完全的实现vectorization。 下面介绍向量化的过程: 约定训练数据的矩阵形式如下,x的每一行为一条训练样本,而每一列为不同的特称取值: |
g(A)的参数A为一列向量,所以实现g函数时要支持列向量作为参数,并返回列向量。由上式可知 |
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。