Cpp五条

这个屌丝很懒，什么也没留下！

热门标签

推荐系统之矩阵分解（MF）没废话，有代码_mf 梯度

作者：Cpp五条 | 2024-02-16 15:34:06

踩

mf 梯度

前言

本文章，适合零基础学习MF（个人认为）数据集很小，只是简单但详细的讲解了矩阵分解，并给出了一个简单的代码

推荐系统中最为主流与经典的技术之一是协同过滤技术（Collaborative Filtering），它是基于这样的假设：用户如果在过去对某些项目产生过兴趣，那么将来他很可能依然对其保持热忱。其中协同过滤技术又可根据是否采用了机器学习思想建模的不同划分为基于内存的协同过滤（Memory-based CF）与基于模型的协同过滤技术（Model-based CF）。其中基于模型的协同过滤技术中尤为矩阵分解（Matrix Factorization）技术最为普遍和流行，因为它的可扩展性极好并且易于实现，接下来我们将讨论矩阵分解，即其代码实现

矩阵分解

我们都熟知在一些软件中常常有评分系统，但并不是所有的用户user人都会对项目item进行评分，因此评分系统所收集到的用户评分信息必然是不完整的矩阵。那如何跟据这个不完整矩阵中已有的评分来预测未知评分呢。使用矩阵分解的思想很好地解决了这一问题。

假如我们现在有一个用户-项目的评分矩阵R（n，m）是n行m列的矩阵，n表示user个数，m行表示item的个数

我们可以看出R矩阵是一个稀疏矩阵，在实际场景中，对于庞大的评分系统来说，每一歌用户所对用的项目是极小的。而R在实际场景中是一个极大地矩阵。

我们如何根据目前的矩阵R(5,4)对未打分的商品进行评分的预测呢（如何得到分钟为-或0的用户的分值？）

矩阵分解的思想很好的解决了这个问题，矩阵分解可以看做有监督的机器学习问题（回归问题）

矩阵R可以近似的表示为P和Q矩阵的乘积。

R可以分解为如下两个矩阵P（即nP）Q（即nQ），

预测矩阵

将矩阵P，Q进行矩阵的乘运算得到一个新的矩阵R1，R1就是基于R的预测矩阵

我们可以看出，矩阵R1和矩阵R是非常相似的

现在的问题是，如何求出矩阵Q和P呢

一个很简单的办法是通过迭代的方式逐步求得与R1=QP.T之间的距离变小。设置loss函数，然后使用梯度下降法。

矩阵分解算法推导

1.首先令

2. 2. 损失函数：使用原始的评分矩阵与重新构建的评分矩阵之间的误差的平方作为损失函数，即：

如果R(i,j)已知，则R(i,j)的误差平方和为：

最终，需要求解所有的非“-”项的损失之和的最小值：

3. 使用梯度下降法获得修正的p和q分量：

　　求解损失函数的负梯度：

根据负梯度的方向更新变量：

4. 不停迭代直到算法最终收敛（直到sum(e^2) <=阈值）

加入正则化项

【加入正则项的损失函数求解】

1. 首先令

2. 通常在求解的过程中，为了能够有较好的泛化能力，会在损失函数中加入正则项，以对参数进行约束，加入正则的损失函数为：

也即：