赞
踩
使用pyLDAvis进行可视化的时候,发现鼠标移到气泡上,右边显示的关键词与我之前得到的主题关键词对应不起来,在必应转了一圈发现好像没有人谈到这个问题,大多是教代码,教如何可视化,并且代码差不多都长这样:
- import pyLDAvis.gensim
-
- d=pyLDAvis.gensim.prepare(lda, corpus, dictionary)
-
- pyLDAvis.show(d)
有的会加个保存到网页的代码,以方便查看:
pyLDAvis.save_html(d, 'lda_pass10.html')
我就寻思,我这跟人家代码也一样啊,我看人家也没再继续说会有啥问题,人家的结果应该是正确的,我的咋不对呢?这不科学啊!
又去Github上找了几个LDA的代码,研究了他们的可视化那部分,豁然开朗,原来prepare()函数里还有个可选参数没给他赋值:
d=pyLDAvis.gensim_models.prepare(lda, bow_corpus, dictionary,sort_topics = False)
也就是把sort_topics = False加上后,生成的气泡图就对应上了,查了一下这个参数的含义(API documentation — pyLDAvis 2.1.2
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。