赞
踩
文本分类的目的:知道这个文档是做什么的!
训练数据使用sklearn提供的新闻媒体的数据
步骤:
先使用向量空间模型将文本表示为向量,之后TF—IDF特征计算,然后使用朴素贝叶斯作为文本分类器,并在sklearn数据集上进行测试。最后使用常用评估方法来评估分类器的结果。
# -*- coding: gb2312 -*-
from sklearn.datasets import fetch_20newsgroups
categories=['alt.atheism','soc.religion.christian','comp.graphics','sci.med'
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。