赞
踩
特征工程
目录
一、自动分词
1.词根提取与词形还原
2.词性标注
3.句法分析
二、向量空间模型及文本相似度计算
1.文档的向量化表示
2.停用词
3.N-gram模型
4.文档之间的欧式距离
5.文档之间的余弦相似度
6.TF-iDF词条权重计算?????