赞
踩
赶时间请直接看加粗的四种算法,它们占据不同的生态位,请根据实际任务需要去选择他们,在强化学习的子领域(多智能体、分层强化学习、逆向强化学习也会以它们为基础开发新的算法):
没入门深度强化学习的人请按顺序学习以下算法:
用于入门的算法只能用来入门,实际做项目不要使用,至少也要用加粗的算法,尽管它们不是 2021 的 SotA(State of the Art 最高水准的算法),但已经足够好用且不至于太复杂**。**一些性能卓越但是复杂的算法,我会写在下面。为了方便你们了解强化学习的子领域,我会列举突出研究成果,并写上短介绍。若
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。