赞
踩
可以用来评估aspect的质量,在下面这篇论文中被证明与人类的判断有很强的相关性。
(David Mimno, Hanna M. Wallach, Edmund Talley,Miriam Leenders, and Andrew McCallum. 2011Optimizing semantic coherence in topic models. InProceedings of the 2011 Conference on Empirical Methods in Natural Language Processing)
例如,如下公式
给定一个aspect z 和前N个z中的单词集合,D1(w)是单词w的文档频率,并且D2(w1,w2)是单词w1,w2的共现文档频率。更高的一致性分数表示更好的aspect可解释性,意味着更有意义,还有语义上更连贯。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。