赞
踩
目录
60分钟左右,聊得最开心的一位面试官,感觉二面没有挂掉应该是他给的评价比较好吧。
谈一下论文主要思想
介绍论文里不平衡分类马尔科夫决策过程的状态、动作、回报函数设计以及状态转移过程
针对状态转移的有效性、合理性和严谨性讨论了很久
讨论强化学习解决分类问题和监督学习下的神经网通分类器的异同
谈谈传统不平衡分类算法(上采样、下采样、混合采样、代价敏感矩阵、调整分类器阈值)以及最新深度学习不平衡分类算法
分析论文所提算法对比其他方法的优劣点
谈一下外汇自动交易项目的主要工作
介绍外汇自动交易项目里马尔科夫决策过程的状态、动作、回报函数设计以及状态转移过程
Q-网络的结构如何设计
LSTM和CNN提取时序价格数据特征的异同点
模型性能如何评价
在真正外汇环境里算法表现得怎么样(训练数据上效果很好,在未知的现实数据中还是难以捕捉市场规律)
讲一下DQN算法以及几种改进版本(Rainbow)
DQN算法与策略梯度算法的差别
REINFORCE算法存在问题,如何改进
Actor-Critic算法实现的细节
PPO算法的思想及其损失函数
on-policy与off-policy的区别
最后一道简单编程题结束,在旋转数组(5 5 6 7 1 2 3 4 4)中查找一个数(log N),几分钟写完后问了一下他所在的部门,实习生主要的工作,base杭州和深圳的区别,总共几面
25号中午终于接到二面电话&#x
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。