当前位置:   article > 正文

TF-IDF_ti-idf

ti-idf

tf-idf的主要思想是:如果某个词或者某个短语再一篇文章中出现的概率高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。

ti-idf 的作用:用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度

Tf term frequency 词的频率 出现的次数

idf 逆文档频率。inverse document frequency。 log(总文档数量/该词出现的文档数量)

tf*idf 重要性程度。值越大 越重要 越重要越能反应文章的主题

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小丑西瓜9/article/detail/361165
推荐阅读
相关标签
  

闽ICP备14008679号