赞
踩
最近探索了用MATLAB进行文本分类,没有涉及高级和复杂的算法公式,仅发出来和大家分享下。
数据集
数据是关于新闻分类的,总共包括财经、房产、家居、教育、科技、时尚、时政、体育、游戏、娱乐10种类型的新闻。训练集共10000行数据。
目标
使用MATLAB训练分类器,实现对新闻文本的分类。
步骤
1、使用数据导入功能将训练集导入workspace,导入类型为tabel类型,整个table命名为train,第一列为response(分类目标,categorical类型),第二列为新闻描述文本(string类型)。
2、基于第二列新闻描述文本,按单字拆开,并去重,生成字典/字库。
<Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。