当前位置:   article > 正文

图解深度强化学习(简单的)_深度强化学习概念图

深度强化学习概念图

在这里插入图片描述
其实理解起来就是环境是一个根据输入输出响应信息的一个标注器
其他的就是一个神经网络,
只不过输入和输出是环境的输入和输出,神经网络就是智能体。代替和模拟其他左右动作,就人类环境而言,我们是和环境学习的一切,环境的变化和智能体的响应就构成了学习,那么在过去的人工智能深度神经网络为什么没有出现人类智慧呢,其实有智没有会,原因不得而知,原因有可能是输出过于单一,输入和输出不是真正的逻辑对应关系,或者说对应的逻辑关系比较单一,如果多模态输出,就极有可能让神经网络可以实现智能,实现人类的意识输出,比如 输入一个图输出,不仅仅是分类,而是多样的比如环境什么,还有输入也是单一的,一个图不同时间代表的意义也是不同的,所以输入也要多模态输出也要多模态,才会是一个智能体。
如今研究界研究的也只是单一的输入输出多模态而已,但是以及能提高之前单一神经网络的智能了,如果能多对多的输入,输出。就能建立一个真正的智能,其实也没有那么多输入,大致人脑的输入,是图 声 等
其他的可以人类自定义一些数据输入就可以,不必太真实。
如果为了真实可以模拟一个虚拟的世界让,人工智能学习。
比如游戏世界,中可以体会到风,体会到重量,这都是可以模拟的
其实为什么要输入那么多,原因很简单,你要模拟 x 和y的关系 不说明x是什么,那么机器永远要猜你要输入是什么,这就是神经网络需要大量数据输入的原因,如果是多模态的可能不需要那么多数据就学会了
输出也是一样的一个图输入,对于现在单一的y来说,信息太多还都是么有的,首先神经网络要剔除那些么有用的信息,才会开始找对应关系
可以这样理解输入的图是10个数,每个数的状态有十个,而你要建立的是其中一个数的某几个状态和y的关系,那么神经网络要剔除 9*10状态信息,如果是一张图,会更多多余的信息系对于y来说。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/133077
推荐阅读
相关标签
  

闽ICP备14008679号