当前位置:   article > 正文

skmultiflow使用自己的csv文件训练模型并保存实验结果

skmultiflow

skmultiflow使用

skmultiflow是基于scikit-multiflow包的,scikit-multiflow官方文档官方文档中有写里面API的具体使用方法,但是本人经过阅读发现并没有自己所需的类型,本人所需有的是自己提供训练数据集,而不是官方文档中调用相关数据生成包生成的训练数据集,并且我们还希望可以将实验结果保存下来。接下来我将告诉大家如何实现的:
1.先给大家展示一下代码和运行后的实验结果:

from skmultiflow.meta import AdaptiveRandomForestClassifier
from skmultiflow.evaluation import EvaluatePrequential
from skmultiflow.data.file_stream import FileStream
'''
Heitor Murilo Gomes, Albert Bifet, Jesse Read, Jean Paul Barddal, Fabricio Enembreck, Bernhard Pfharinger, Geoff Holmes, Talel Abdessalem. Adaptive random forests for evolving data stream classification. In Machine Learning, DOI: 10.1007/s10994-017-5642-8, Springer, 2017.
'''
stream = FileStream(r'.\sea_stream.csv')
stream.prepare_for_use()
classifier = AdaptiveRandomForestClassifier()
evaluator = EvaluatePrequential(pretrain_size=200, max_samples=6220, batch_size=1,
                                n_wait=200, max_time=1000, output_file=r'.\11.csv',
                                show_plot=True, metrics=['accuracy', 'precision','recall', 'f1'])
evaluator.evaluate(stream=stream, model=classifier)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13

说明一下,使用的训练数据集是sea_stream.csv,实验结果存于11.csv。度量这里展示了最长用的’accuracy’, ‘precision’,‘recall’, ‘f1’。pycharm运行后控制台展示的实验结果。除此之外还会实时的生成一个一个实验结果图如下所示:
在这里插入图片描述
最后,我们来看一下生成的11.csv里面存放着那些实验结果数据:
在这里插入图片描述
如果小伙伴们的需求是和我一样的,欢迎采用。另外,这只是给出了一个样例,如果 是实现不同的方法,其实总体代码实现是一样的。
2.知道小白同学们还是希望能够打个样例,以下是实现不同算法实现的代码:
在这里插入图片描述
我将主要的区别用红方框括起来了,大家可以根据官网上API使用说明更换不同的方法
好了,就这个样子了,是不是很简单。最最最重要的,大家可能会需要样例中的训练数据集,给大家看一下数据集的内容与注意事项:
在这里插入图片描述
第一行要写成字符内容!!!

声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号