赞
踩
plsa,也就是概率隐语义分析,是主题模型的一种。主题模型是什么呢?先从文档说起,每篇文档用bag-of-words模型表示,也就是每篇文档只与所包含的词有关,而不考虑这些词的先后顺序。假设文档集
所以,如果我们有文档集
主题模型的用处还是很多的,在推荐系统,舆情监控等等,都有广泛的用途。
介绍完主题模型的基本概念,就要回到本文的重点,给定一个文档集
首先介绍一下图中参数:
plsa是一个生成模型,它假设了
1. 以概率
2. 以概率
3. 以概率
我们需要估计的参数就是
再写出log似然函数
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。