赞
踩
8. 相似度计算的改进:对于大多数人都喜欢的作品的喜爱可能不具有很大参考性,应该对具有比较大争议的增加权重;计算相似度的时候考虑共同观看的剧的集数;设置条件过滤掉不是很相似的用户,设置阈值和最大相似用户数(邻居数)
9. 协同过滤的优劣:好处,好计算、可解释;坏处,需要大的内存、数据稀疏导致预测不准。
Intuition:表达更高级的属性
对每个用户和物品嵌入embeddings(隐含了很多特殊信息的向量)
将交互矩阵分解成为两个低秩矩阵获得embeddings。左边矩阵可以分解为右边两个矩阵的点积。矩阵分解的过程为最小化右下角的目标函数:第一项为使embeddings重构交互矩阵的误差尽可能小,第二项为正则项。优化问题可以通过梯度下降的方法来完成。
有了embeddings后可以加入不同的元素,即在模型里面加入不同的偏置。
矩阵分解的优劣:优势,有一定泛化能力,存储空间小(只需存储低维的embeddings向量);劣势:比起协同过滤来说更难解释,以及稀疏性问题。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。