小翔强化学习总结_csrt算法

作者：酷酷是懒虫 | 2024-07-22 10:33:00

踩

csrt算法

小翔强化学习总结:

题目：基于深度强化学习的无人驾驶决策算法研究

项目简介：
随着汽车的普及以及工业互联网、5G等技术飞速的发展,自动驾驶技术的研究越来越炙手可热,。
在以无人驾驶为代表的高维复杂动态的决策环境中，传统的基于规则的决策规划算法或启发式的决策规划算法，面临维度爆炸，计算复杂度高，难以收敛等问题。
深度强化学习在处理高维状态空间和连续动作空间的序贯决策问题上极具优势,现已在自动驾驶领域得到了广泛研究与应用。
深度强化学习需要实时与环境交互，大量探索与试错，在无人驾驶领域中应用时面临安全和学习效率问题。

本项目将离线强化学习引入无人驾驶决策规划算法研究，首先通过收集具有标签的车辆行驶轨迹数据训练扩散模型网络，再通过扩散模型生成训练数据，利用生成数据对深度确定性策略梯度网络进行训练。
深度确定性策略梯度网络采用图像与点云结合构建的状态作为输入向量，构建双缓冲区提高学习效率，输出为车辆加速、转向和刹车控制命令，实现了端到端的无人驾驶决策控制。

预期成果：
（1）B类赛(计算机设计大赛、安徽省大数据与人工智能应用赛等)获奖1项以上；
（2）申请发明专利，进入实审（排名前2）或发表四类以上论文一篇(本科生第一作者)1篇。

以下给出了学习路线和资料查询：

离线强化学习

声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：【wpsshop博客】