当前位置:   article > 正文

自然语言处理面试题_自然语言处理面试题库

自然语言处理面试题库

tfidf

tf是啥?词频

idf是啥?逆词频

 

max_df 选择词频的上界

min_df  选择词频的下界

max_features 选择的最大特征数

利用sklearn tfidf实例

导包

from sklearn.feature_extraction.text import TfidfVectorizer

实例化 

  1. word_vec = TfidfVectorizer(analyzer='word',
  2. ngram_range=(1,2),#(1,3)
  3. min_df=3, # 4 5
  4. max_df=0.9, # 0.95 1.0
  5. use_idf=True,
  6. smooth_idf=True,
  7. sublinear_tf=True)

用fit_transform训练

用transform预测<

声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号