当前位置:   article > 正文

自然语言处理课程作业 代码说明及源文件_自然语言处理大作业代码

自然语言处理大作业代码

这是在自然语言课程时的大作业--中文文本情感的分类。整个实验的相关算法利用C++在Windows平台下完成,使用ICTCLAS中文分词开源程序、LibSVM以及开源的XML文件处理程序Markup完成。具体实验代码详见附件。这年头光说不给代码的都是假的,我也是有点鄙视的。。。故给出可运行的完全源代码,使用vs2010写的代码。

目录结构如下:


各文件夹作用说明:
    FreeICTCLAS: 中科院中文分词处理系统接口(修改,添加字母数字剔除,停用词去除)
    LibSVM: SVM分类器开源库
    Data: 分词处理数据字典
    Dataset: 处理文本测试集与训练集
    Feature: 对训练集提取的特征文件
    Model: 利用SVM生成的模型文件
    Result: 分类结果文件
其他文件说明:
    Markup.h与Markup.cpp: 开源的xml文件处理接口
    CommentText.h与CommentText.cpp: 评论文本类,文本的主要处理对象,用于分词处理,计算权重等
    Processing.h与Processing.cpp: 通用处理接口,包括S

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/你好赵伟/article/detail/629753
推荐阅读
相关标签
  

闽ICP备14008679号