赞
踩
这个作业属于那个课程 | 自然语言处理 |
---|---|
这个作业要求在哪里 | https://bbs.csdn.net/topics/615949583 |
我在这个课程的目标是 | 学习自然语言处理技术的基础理论和实现方法 |
这个作业在那个具体方面帮助我实现目标 | 学会调用模型,熟悉代码框架 |
参考文献 | http://t.csdn.cn/c6mBb |
基于文本内容实现垃圾短信识别,完成代码编写并撰写实验报告。
1.1 保护用户权益:垃圾短信可能会泄露用户的个人信息,或者诱骗用户进行虚假交易,给用户造成经济损失和隐私泄露等问题。识别垃圾短信可以有效地保护用户的权益和利益。
1.2 提高工作效率:垃圾短信的数量庞大,如果没有识别机制,用户需要手动筛选和删除,浪费时间和精力。有了垃圾短信识别技术,可以自动过滤掉大部分垃圾短信,提高用户工作效率。
1.3 推动技术发展:垃圾短信识别需要自然语言处理等技术的支持,推动了这些技术的发展和应用,同时也为其他领域的应用提供了经验和思路。
总之,垃圾短信识别在现代社会中具有重要的意义,它可以保护用户权益,提高工作效率,促进营销发展,推动技术发展。
基于文本内容的垃圾短信识别主要是利用算法从短信文本中提取特征,并训练一个分类模型,对新的短信进行分类判断,以达到过滤垃圾短信的目的。
(1)数据抽取:抽取所需数据集;
(2)数据预处理:对数据进行文本去重、中文分词、停用词过滤处理;
(3)建模准备:将分词结果分别转换成文档-词条矩阵并划分测试集与训练集;(4)模型构建:构建贝叶斯、支持向量机、神经网络模型;
(5)模型评价:用精确率、召回率、Fl值对模型分类效果进行评价;
(6)模型优化与分析结果。
4.1 简易流程图
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。