当前位置:   article > 正文

熵权法模型(评价类问题)

熵权法模型(评价类问题)

目录

本文章内容参考:

一. 概念

二. 特点

三. 实现步骤

四. 代码实现


本文章内容参考:

熵权法模型讲解(附matlab和python代码) 【数学建模快速入门】数模加油站 江北_哔哩哔哩_bilibili

一. 概念

利用信息熵计算各个指标的权重,从而为多指标的评价类问题提供依据。

根据信息熵的定义,对于某项指标,可以用熵值来判断某个指标的离散程度,其信息熵值越小,指标的离散程度越大, 该指标对综合评价的影响(即权重)就越大,如果某项指标的值全部相等,则该指标在综合评价中不起作用。

指标的变异程度越小,所反映的信息量也越少,所以其对应的权值也应该越低。

指标的变异程度(或称为变异性、波动性):描述了一个指标在不同观测值之间的差异程度或分散程度。简单来说,它反映了数据的分布宽度和离散情况。

也即如果一个指标的波动性越小,说明该指标对最终结果的影响理应越小,也即其对应权值更低。

信息熵公式:

H(X) = -\sum p(x_i) \log_2 p(x_i)

  • H(X) :表示随机变量 X 的熵。熵衡量了随机变量的不确定性或信息量。熵越大,随机变量的不确定性越高。
  • x_i :随机变量 X 的一种取值情况。
  • p(x_i) :随机变量 X 取值为 x_i​ 的概率。每个 x_i​ 都有一个与之对应的概率 p(x_i)
  • log_2 p(x_i) : p(x_i) 的二进制对数。对数的底数为 2,因此它表示的是以比特为单位的信息量。具体来说,log_2 p(x_i) 衡量了事件 x_i​ 发生时的信息量。

         由于概率 p(x_i) 总是介于 0 和 1 之间,log_2 p(x_i) 会是一个负数。负号保证了整个熵的值为正数。

        这个公式通过对所有可能取值的信息量加权求和,衡量了随机变量 X 的不确定性。熵值越大,说明随机变量 X 的不确定性越高。

二. 特点

熵权法是一种客观的赋权方法,它可以靠数据本身得出权重,避免了主观因素的介入。

三. 实现步骤

一开始的两步也即原始矩阵正向化,标准化同Topsis法,看过了可以跳过前两步。

1. 原始矩阵正向化

矩阵正向化的过程就是把后三种指标类型通过数值转换,转化极大型指标的指标特点,也即其值越大越好。

转化方式如下公式:

{x}_i上面带个~的值的是原始矩阵正向化后指标转换后对应的值,极大型指标无需转换。

一个转换过程的例子如下(其中颜值是极大型指标无需转换,脾气是极小型指标,身高是中间型指标,体重是区间型指标):

2. 正向化矩阵标准化

标准化的目的是为了消除不同指标的量纲影响,仅保留指标的基本特征,使得所有特征具有相同的权重。这样在计算距离(如欧氏距离)或相似性时,不会因为某个特征的数值范围过大而主导计算结果。

对其标准化的矩阵记为 R ,则 R 中的每一个元素为:

R_{ij} = \frac{x_{ij}}{\sqrt{\sum_{k=1}^{m} x_{kj}^2}}

 上文提到标准化的目的是为了让所有特征先具有相同的权重。

在Topsis法中我们提到,在实际情况中,不同的指标对结果的影响程度必然是有所差异的,所有要建立更加符合现实情况的模型,我们还需要将标准化后的矩阵再给不同指标加上不同的权重,后面的熵权法步骤就是用来计算不同指标的权重的过程。

下图是正向化矩阵标准化的过程:

3. 计算概率矩阵 P
计算标准化矩阵第 j 项指标下第 i 个样本所占的比重 p_{ij}

p_{ij} = \frac{R_{ij}}{\sum_{i=1}^{m} R_{ij}}

过程如下:

4. 计算熵权

信息熵的计算公式

信息熵 e_{j} 用于衡量第 j 个指标的不确定性。它的计算公式为:

e_j = -\frac{1}{\ln n} \sum_{i=1}^{n} p_{ij} \ln(p_{ij}) \quad (j=1,2,\dots,m)

  •  p_{ij} 表示第 j 个指标在第 i 个样本中的比例(标准化值)。
  •  n 表示样本数量。

因为当 p_{1j} = p_{2j} = \dots = p_{nj} = \frac{1}{n} ​ 时,信息熵 e_{j}​ 达到最大值 e_{j}= 1,此时信息熵最大,但该指标几乎不波动,代表其信息效用值最小。

信息效用值的定义

信息效用值 d_{j} 定义为信息熵的补值,用于衡量该指标的有用信息量。它的计算公式为:

d_j = 1 - e_j

当信息熵 e_{j}​ 越小,信息效用值 d_{j}​ 越大,说明该指标提供的信息越有用,所以其对结果的影响越大。

熵权的归一化

最终,通过对信息效用值 d_{j}​ 进行归一化,得到每个指标的权重 W_{j}​:

W_j = \frac{d_j}{\sum_{j=1}^{m} d_j}

  •  m 是指标的总数量。
  •  W_{j}​ 是第 j 个指标的权重。

四. 代码实现

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/繁依Fanyi0/article/detail/967213
推荐阅读
相关标签
  

闽ICP备14008679号