赞
踩
我们都知道线性回归例程非常简单易懂。如果它明确指出自变量的值增加1点,则因变量增加b个单位。
但是,在预测离散变量时 - 例如,客户是否会与服务提供商保持联系,或者是否会下雨 - 逻辑回归将会发挥作用。没有很多不同的值,结果只能是1或0。
在本文中,我们将学习如何在Excel中构建一个简单的客户流失模型,我们将使用Solver通过减少交叉熵误差来优化此模型。
在我们深入了解逻辑回归的细节之前,让我们理解为什么当我们必须基于线性回归的以下限制来预测离散结果时,线性回归不起作用:
线性回归假设每个变量之间存在线性关系。但是,如果与竞争对手相比,客户为特定服务支付的费用较低,则客户离开服务提供商的机会将呈指数级变化。
线性回归假设随着自变量的增加,概率成比例地增加。
如上所述,线性回归的主要问题是它假设变量之间存在线性关系,这在实践中非常罕见。
为了解决这个(以及其他一些)限制问题,我们将探索S形曲线。在外行人的语言中,我们可以说sigmoid函数(曲线)有助于返回概率值,然后可以将概率值映射到两个或更多个离散类。然而,一般来说,线性回归并不能告诉我们在某个范围之后事件发生的概率。
基于以上解释,我们可以说S形曲线可以比线性回归更好地解释离散现象。
为了简单起见&
赞
踩
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。