赞
踩
人工智能 (Artificial Intelligence):人工智能研究的各个分支包括计划调度、专家系统、多智能体系统、进化计算、模糊逻辑、机器学习、知识表示、计算机视觉、自然语言处理、推荐系统、机器感知等等。
机器学习(Maching Learning):是实现人工智能的一种手段
深度学习(Deep Learning):是一种机器学习的技术。通过大量的数据训练,发现数据的规律,从而实现基于监督学习的数据预测,需要有监督的方式训练模型,训练的结果严重的依赖于标签的质量。
强化学习(Reinforcement Learning):是一种机器学习的技术。区别于监督学习,强化学习具有很强的决策优化能力。机器处在一个环境中,每个状态为机器对当前环境的感知;机器只能通过动作来影响环境,当机器执行一个动作后,会使得环境按某种概率转移到另一个状态;同时,环境会根据潜在的奖赏函数反馈给机器一个奖赏。综合而言,强化学习主要包含四个要素:状态、动作、转移概率以及奖赏函数。
实例:关于强化学习和深度学习的实例,最典型的莫过于谷歌的AlphaGo和AlphaZero两位了,前者通过深度学习中的深度卷积神经网络,在训练了大约三千万组人类的下棋数据,无数度电的情况下才搞出来的模型,而后者使用强化学习的方式,通过自己和自己下棋的方式搞出来的模型。而最终的实验结果也很让人震撼。AlphaGo干败了人类围棋顶尖高手,而AlphaZero干败了AlphaGo.
深度强化学习(Deep Reinforcement Learning):深度学习与强化学习的结合,可以自主挖掘问题特征。
例:2013和2015年DeepMind的Deep Q Network(DQN)可谓是将两者成功结合的开端,它用一个深度网络代表价值函数,依据强化学习中的Q-Learning,为深度网络提供目标值,对网络不断更新直至收敛。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。