赞
踩
文本向量化表示就是用数值向量来表示文本的语义。我们人类在读一段文本后立刻就能明白它要表达的内容,如何让机器也能拥有这样的能力呢?文本分类领域使用了信息检索领域的词袋模型,词袋模型在部分保留文本语义的前提下对文本进行向量化表示。
One-Hot表示法
TF表示法
TF-IDF表示法
Word2vec
BERT
下面根据一个案例分别讲解各向量化方法的思想:
说明:id:表示文章的数量;假设文档已经分词
思想:
思想:
思想:
思想:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。