当前位置:   article > 正文

tf-idf简介_每个关键词只有一个tf-idf值吗

每个关键词只有一个tf-idf值吗

维基百科TF-IDF

1. tf (term frequency):

比如说有n个文本tn, 文中有很多词,所有文本构成了语料库。 tf(t,d)表示t中出现d词的一个程度量。有多种选择,最简单的可以为这个词在这个文本出现次数,或直接出现则设为1,或除以这个文本总词数以归一化

2. idf (inverse document frequency):

每个词的idf值在整个语料库中一样(每个词的tf值在不同文本中不同),公式也简单:idf(t, D) = log(总词数 / (该词出现文本的次数 + 1))

声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop】
推荐阅读
相关标签
  

闽ICP备14008679号