赞
踩
在批量学习中,系统无法进行增量学习——即必须使用所有可用数据进行训练。这需要大量时间和计算资源,所以通常都是离线完成的。离线学习就是先训练系统,然后将其投入生产环境,这时学习过程停止,它只是将其所学到的应用出来。如果希望批量学习系统学习新数据(例如新型垃圾邮件),需要在完整数据集(包括新数据和旧数据)的基础上重新训练系统的新版本,然后停用旧系统,用新系统取而代之。幸运的是,整个训练、评估和启动机器学习系统的过程可以很轻易地实现自动化(如图所示),所以即使是批量学习系统也能够适应变化。只是需要不断地更新数据,并根据需要频繁地训练系统的新版本。
在在线学习中,你可以循序渐进地给系统提供训练数据,逐步积累学习成果。这种提供数据的方式可以是单独的,也可以采用小批量的小组数据来进行训练。每一步学习都很快速并且便宜,这样系统就可以根据飞速写入的最新数据进行学习
参考书籍:
机器学习实战:基于Scikit-Learn、Keras和TensorFlow:原书第2版
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。