赞
踩
文章链接:
Reinforcement learning in Economics and Finance
强化学习
和有/无监督学习
最最显著的区别:leaning follows from feedback and experience, not from some fixed sample of data.ethology
:(a). The scientific study of animal behavior, especially as it occurs in a natural environment. (b). The study of human ethos(性格气质) and its formation.ethology
这个词和etymology(词源学)
的区分,ethology
可以和ethos
(民族精神)联系记忆,而ethos盲猜和ethics同源,这样这几个词就全部记住啦~exploration
)+已有的经验(exploitation
)进行学习, 这里联系经验回放算法credit assignment
监督学习
的语境下,机器学习是一个静态的过程,给定数据集,我们学出一个可能的模型, 对于判别模型,典型的就是binary的输出(各位只要有点点基础知识的,可以和我一起在脑子里放一遍minst数据集的区分,GNN对抗神经网络等等等等的小电影…)action_space = ["买当前商品","不买但继续购物","stop shopping and check out"]
Ideas No.1
(realized?)As we will see in the article,models in sequential decision making as long history in economics, even if rarely mentioned in the computational science literature。
- “在了解Online learning之前需要了解regret 分析这个概率,regret指的是,Online learning中每次学习的误差减去使用用当前为止的最优函数而产生的误差的平均值,当然我们希望regret越小越好。”
—— 摘自https://www.cnblogs.com/llphhl/p/5808431.html
在机器学习当中,我们的目标是找到这样的一个函数 f ∈ F f\in\mathscr{F} f∈
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。