MF（推荐系统的矩阵分解技术）论文笔记

作者：小丑西瓜9 | 2024-04-29 00:32:04

踩

MF（推荐系统的矩阵分解技术）论文笔记

论文概述

推荐系统的矩阵分解技术可以为用户提供更为准确的个性化推荐，对比传统的近邻技术，矩阵分解技术可以纳入更多信息，如隐式反馈、时间效应和置信度

近邻技术：基于用户或物品之间的相似性进行推荐，当用户之间已有评价计算出两个用户爱好类似，就将a用户的其他物品推荐给b

矩阵分解技术：把原来的大矩阵，近似分解成两个小矩阵的乘积，在实际推荐计算时不再使用大矩阵，而是使用分解得到的两个小矩阵。

将上述二维坐标扩展，将用户和项目映射到维数f的联合潜在因子空间，用户和项目的交互可以建模为空间的内积，捕获了用户和项目之间的交互，公式1表示预测的用户和项目之间的交互

该模型的主要挑战就是系统需要找到每个项目和用户映射的向量qi和pu，这个模型和SVD技术密切相关

奇异值分解SVD技术：

将一个大矩阵分解为三个部分，第一个部分告诉我们数据的主要方向，第二个部分告诉我们每个方向的重要性有多大，第三个部分则是另一个角度的数据主要方向。，但是当数据稀疏性很高，会导致过拟合状态

早期为了解决稀疏性问题采用填补空缺值，但是往往不准确的估计值会扭曲数据，我们只对已有的评分建模，该系统通过拟合先前观察到的评级来学习模型。

公式2为SVD的损失函数，系统会最小化已知评分集合上的正则化平方误差，在加号左边是最小化预测评分与实际评分之间的差异，加号右侧是正则化项（也叫惩罚项）用于控制模型的复杂度；可以防止出现过拟合状态

最小化该上述方程有两个方法：随机梯度下降法和交替最小二乘法

随机梯度下降（SGD）就像是在一座大山的地图上寻找最低点，但你不能看到整个地形，只能通过不断随机挑选一些地方来感受坡度，然后沿着坡度最大的方向小步向下走，希望最终能找到那个最低点。

随机梯度下降是一种迭代的优化算法，它在每次迭代中只使用一个或一小批训练样本来更新模型参数。这种方法的优点是在大规模数据集上效率较高，因为不需要在每次迭代时处理整个训练集。

公式3表示给出训练集（u，i），系统会给出预测值qiTpu，然后用真是的计算值r减去预测值，得到误差预测值

接着我们要优化更新参数q和p，见公式4

首先，我们有一个误差项 e，它表示模型对第

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/小丑西瓜9/article/detail/505092