当前位置:   article > 正文

gensim的主题模型LSI_models.lsimodel

models.lsimodel
<span style="font-size:24px;">将上问的输入文档归为两个主题</span>
  1. from gensim import corpora,models,similarities
  2. dictionary=corpora.Dictionary.load('/tmp/deerwester.dict')
  3. corpus=corpora.MmCorpus('/tmp/deerwester.mm')
  4. print(corpus)
  5. tfidf=models.TfidfModel(corpus)
  6. doc_bow=[(0,1),(1,1)]
  7. print(tfidf[doc_bow]) #计算最相关的文档
  8. corpus_tfidf=tfidf[corpus]
  9. #initialize an LSI transformation
  10. lsi=models.LsiModel(corpus_tfidf,id2word=dictionary,num_topics=3)
  11. #transformed tf-idf corpus via lsi into a laten 2-D space
  12. corpus_lsi=lsi[corpus_tfidf]
  13. lsi.print_topics(3)
  14. for doc in corpus_lsi:
  15. print(doc)
  16. lsi.save('/tmp/model.lsi')#same for tfidf,lda

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/IT小白/article/detail/778334
推荐阅读
相关标签
  

闽ICP备14008679号