基于weka手工实现逻辑斯谛回归（Logistic回归）_weka 回归数据

作者：不正经 | 2024-04-24 03:41:58

踩

weka 回归数据

一、logistic回归模型

逻辑斯谛回归模型其实是一种分类模型，这里实现的是参考李航的《统计机器学习》以及周志华的《机器学习》两本教材来整理实现的。

假定我们的输入为 $x$ ， $x$ 可以是多个维度的，我们想要根据 $x$ 去预测 $y$ ， $y\in \{0,1\}$ 。逻辑斯谛的模型如下：

$p(Y=1|x)=\frac{exp(w\cdot x)}{1+exp(w\cdot x)}\tag{1}$

其中的参数 $w$ 就是我们要进行学习的，注意：它是包含了权重系数和偏置（bias）b的。在书写程序时，这样表示更加简洁。

二、极大似然法参数估计

参数 $w$ 是我们需要学习的，我们采用极大似然法估计模型参数。

设：

$P(Y=1|x)=\pi(x),\quad P(Y=0|x)=1-\pi(x)\tag{2}$

似然函数为：

$\prod_{i=1}^N[\pi(x_i)]^{y_i}[1-\pi(x_i)]^{1-y_i} \tag{3}$

因为这种指数的形式不利于求导我们需要将它们转化为对数的形式，如下：

\begin{aligned} L (w) = & \sum_{i = 1}^{N} [y_{i} l o g π (x_{i}) + (1 - y_{i}) l o g (1 - π (x_{i}))] \\ = & \sum_{i = 1}^{N} [y_{i} l o g (\frac{π (x_{i})}{1 - π (x_{i})}) + l o g (1 - π (x_{i}))] \\ = & \sum_{i = 1}^{N} [y_{i} (w \cdot x_{i}) - l o g (1 + e x p (w \cdot x_{i}))] \end{aligned}

$\begin{aligned} L(w)=&\sum_{i=1}^N[y_ilog\pi(x_i)+(1-y_i)log(1-\pi(x_i))] \\ =&\sum_{i=1}^N [y_ilog(\frac{\pi(x_i)}{1-\pi(x_i)})+log(1-\pi(x_i))]\\ =&\sum_{i=1}^{N}[y_i(w\cdot x_i)-log(1+exp(w\cdot x_i))] \end{aligned}$ \tag{4}

L (w) = = = i = 1 \sum N [y_{i} l o g π (x_{i}) + (1 - y_{i}) l o g (1 - π (x_{i}))] i = 1 \sum N [y_{i} l o g (\frac{π ( x _{i} )}{1 - π ( x _{i} )}) + l o g (1 - π (x_{i}))] i = 1 \sum N [y_{i} (w \cdot x_{i}) - l o g (1 + e x p (w \cdot x_{i}))] (4)

对 $L (w)$ 求极大值，得到 $w$ 的估计值。

三、梯度下降法求解似然函数

梯度下降法是求极小值的，而我们想要得到的是 $L (w)$ 的最大值，因此，我们取 $L (w)$ 的相反数，即：

$\argmin_{w}-L(w) \tag{5}$

对 $L (w)$ 关于 $w$ 求导，如下：

\begin{aligned} (- L (w))^{'} = & - \sum_{i = 1}^{N} [(y_{i} \cdot x_{i}) - \frac{e x p (w \cdot x_{i})}{1 + e x p (w \cdot x)} \cdot x_{i}] \\ = & - \sum_{i = 1}^{N} [(y_{i} - \frac{e x p (w \cdot x_{i})}{1 + e x p (w \cdot x)}) \cdot x_{i}] \\ = & \sum_{i = 1}^{N} [(\frac{e x p (w \cdot x_{i})}{1 + e x p (w \cdot x)} - y_{i}) \cdot x_{i}] \end{aligned}

$\begin{aligned} (-L(w))'=&-\sum_{i=1}^N[(y_i\cdot x_i)-\frac{exp(w\cdot x_i)}{1+exp(w\cdot x)}\cdot x_i]\\ =&-\sum_{i=1}^N[(y_i-\frac{exp(w\cdot x_i)}{1+exp(w\cdot x)})\cdot x_i]\\ =&\sum_{i=1}^N[(\frac{exp(w\cdot x_i)}{1+exp(w\cdot x)}-y_i)\cdot x_i] \end{aligned}$ \tag{6}

(- L (w))^{'} = = = - i = 1 \sum N [(y_{i} \cdot x_{i}) - \frac{e x p ( w \cdot x _{i} )}{1 + e x p ( w \cdot x )} \cdot x_{i}] - i = 1 \sum N [(y_{i} - \frac{e x p ( w \cdot x _{i} )}{1 + e x p ( w \cdot x )}) \cdot x_{i}] i = 1 \sum N [(\frac{e x p ( w \cdot x _{i} )}{1 + e x p ( w \cdot x )} - y_{i}) \cdot x_{i}] (6)

然后我们就得到了参数 $w$ 的更新公式，如下：

\begin{aligned} w^{'} = & w - l r \cdot (- L (w)^{'}) \\ = & w - l r \cdot (\sum_{i = 1}^{N} [(\frac{e x p (w \cdot x_{i})}{1 + e x p (w \cdot x)} - y_{i}) \cdot x_{i}]) \end{aligned}

$\begin{aligned} w'=&w-lr\cdot(-L(w)')\\ =&w-lr\cdot(\sum_{i=1}^N[(\frac{exp(w\cdot x_i)}{1+exp(w\cdot x)}-y_i)\cdot x_i]) \end{aligned}$ \tag{7}

w^{'} = = w - l r \cdot (- L (w)^{'}) w - l r \cdot (i = 1 \sum N [(\frac{e x p ( w \cdot x _{i} )}{1 + e x p ( w \cdot x )} - y_{i}) \cdot x_{i}]) (7)

关于优化方法的选择，最开始是选择西瓜书上提供的牛顿法来实现的，牛顿法的好处是，可以获得较快的收敛速度，但是坏处是，当海森矩阵为奇异矩阵时，会出现无法求解的情况。

因此，可以采用拟牛顿法进行优化，在解决这个问题的同时，也可以很快的收敛。

但是，自己对拟牛顿法并不熟悉，而梯度下降法虽然收敛可能较慢，但是实现起来较为简单，因此这里采用了梯度下降法来优化似然函数。

四、基于weka的代码实现

package weka.classifiers.myf;

import weka.classifiers.Classifier;
import weka.core.Instance;
import weka.core.Instances;
import weka.core.matrix.Matrix;
import weka.filters.Filter;
import weka.filters.unsupervised.attribute.NominalToBinary;
import weka.filters.unsupervised.attribute.Standardize;

import java.util.Arrays;

/**
 * @author YFMan
 * @Description 自定义的 Logistic 回归分类器
 * @Date 2023/6/13 11:02
 */
public class myLogistic extends Classifier {
    // 用于存储 线性回归 系数 的数组
    private double[] m_Coefficients;

    // 类别索引
    private int m_ClassIndex;

    // 牛顿法的迭代次数
    private int m_MaxIterations = 1000;

    // 属性数量
    private int m_numAttributes;

    // 系数数量
    private int m_numCoefficients;

    // 梯度下降步长
    private double m_lr = 1e-4;

    // 标准化数据的过滤器
    public static final int FILTER_STANDARDIZE = 1;

    // 用于标准化数据的过滤器
    protected Filter m_StandardizeFilter = null;

    // 用于将 normal 转为 binary 的过滤器
    protected Filter m_NormalToBinaryFilter = null;


    /*
     * @Author YFMan
     * @Description 采用牛顿法来训练 logistic 回归模型
     * @Date 2023/5/9 22:08
     * @Param [data] 训练数据
     * @return void
     **/
    public void buildClassifier(Instances data) throws Exception {
        // 设置类别索引
        m_ClassIndex = data.classIndex();

        // 设置属性数量
        m_numAttributes = data.numAttributes();

        // 系数数量 = 输入属性数量 + 1（截距参数b）
        m_numCoefficients = m_numAttributes;

        // 初始化 系数数组
        m_Coefficients = new double[m_numCoefficients];
        Arrays.fill(m_Coefficients, 0);

        // 将输入数据进行标准化
        m_StandardizeFilter = new Standardize();
        m_StandardizeFilter.setInputFormat(data);
        data = Filter.useFilter(data, m_StandardizeFilter);

        // 将类别属性转为二值属性
        m_NormalToBinaryFilter = new NominalToBinary();
        m_NormalToBinaryFilter.setInputFormat(data);
        data = Filter.useFilter(data, m_NormalToBinaryFilter);

        // 梯度下降法
        for(int curPerformIteration = 0; curPerformIteration < m_MaxIterations;curPerformIteration++){

            double[] deltaM_Coefficients = new double[m_numCoefficients];
            // 计算 l(w) 的一阶导数
            for(int i = 0;i<data.numInstances();i++){

                double yi = data.instance(i).value(m_ClassIndex);
                double wxi = 0;
                int column = 0;
                for(int j=0;j<m_numAttributes;j++){
                    if(j!=m_ClassIndex){
                        wxi += m_Coefficients[column] * data.instance(i).value(j);
                        column++;
                    }
                }
                // 加上截距参数 b
                wxi += m_Coefficients[column];
                double pi1 = Math.exp(wxi) / (1 + Math.exp(wxi));
                for(int k=0;k<m_numCoefficients - 1;k++){
                    deltaM_Coefficients[k] += m_lr * (pi1 - yi) * data.instance(i).value(k);
                }
                // 这里计算 bias b 对应的更新量
                deltaM_Coefficients[m_numCoefficients - 1] += m_lr * (pi1 - yi);
            }

            // 进行参数更新
            for(int k=0;k<m_numCoefficients;k++){
                m_Coefficients[k] -= deltaM_Coefficients[k];
            }

            // 如果参数更新量小于阈值，则停止迭代
            double delta = 0;
            for(int k=0;k<m_numCoefficients;k++){
                delta += deltaM_Coefficients[k] * deltaM_Coefficients[k];
            }
            if(delta < 1e-6){
                break;
            }

        }
    }


    /*
     * @Author YFMan
     * @Description // 分类实例
     * @Date 2023/6/16 11:17
     * @Param [instance]
     * @return double[]
     **/
    public double[] distributionForInstance(Instance instance) throws Exception {

        // 将输入数据进行标准化
        m_StandardizeFilter.input(instance);
        instance = m_StandardizeFilter.output();

        // 将输入属性二值化
        m_NormalToBinaryFilter.input(instance);
        instance = m_NormalToBinaryFilter.output();

        double[] result = new double[2];
        result[0] = 0;
        result[1] = 0;
        int column = 0;
        for(int i=0;i<m_numAttributes;i++){
            if(m_ClassIndex != i){
                result[0] += instance.value(i) * m_Coefficients[column];
                column++;
            }
        }
        result[0] += m_Coefficients[column];
        result[0] = 1 / (1 + Math.exp(result[0]));

        result[1] = 1 - result[0];

        return result;
    }

    /*
     * @Author YFMan
     * @Description 主函数 生成一个线性回归函数预测器
     * @Date 2023/5/9 22:35
     * @Param [argv]
     * @return void
     **/
    public static void main(String[] argv) {
        runClassifier(new myLogistic(), argv);
    }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/不正经/article/detail/477422

基于weka手工实现逻辑斯谛回归（Logistic回归）_weka 回归 数据

一、logistic回归模型

二、极大似然法参数估计

三、梯度下降法求解似然函数

四、基于weka的代码实现

基于weka手工实现逻辑斯谛回归（Logistic回归）_weka 回归数据