当前位置:   article > 正文

自然语言处理(NLP)-机器学习情感分析(未完.....)_自然语言处理期末大作业

自然语言处理期末大作业

目录

一、数据清洗

1.导入必要的库

 2.创建停用词

3.  对句子进行中文分词

4. 给出文档路径

5.将结果输出保存并且打印处理过程

二、转换数据格式

1.将处理完毕的数据读取查看

2.创建data

3. 将评论数据按行写入data中的“评论”一列

4.读取评分数据

5.将评分数据以逗号形式分割

6.将评分数据作为label按行写入data中的“评分”一列

7.查看数据,并将数据保存为CSV格式

三、机器学习部分

1.导入必要的第三方库

2.读取数据

3.划分数据集

4.可选操作,引入停用词,当作参数传入特征提取器

5.TfidfVectorizer()和 CountVectorizer()分别进行特征提取

6.使用TF_IDF提取的向量当作特征传入逻辑回归模型

7.使用ConutVector转化的向量作为特征传入逻辑回归模型

 四、使用其他的机器学习模型进行拟合数据进行测试

1.KNN模型

2.Random Forest Classifier(随机森林)模型

 3.Decision Tree Classifier(决策树)模型

4.贝叶斯模型

5.SVM(支持向量机)模型

总结 
 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Cpp五条/article/detail/629716
推荐阅读
相关标签
  

闽ICP备14008679号