赞
踩
人工智能,特别是机器学习,在最近几年大出风头,无人驾驶汽车,阿尔法狗战胜人类最强棋手,演唱会人脸识别抓捕逃犯,手机多国语言在线翻译,这一切一切无不给我们带来深深的震撼,可以说人工智能将在不久的未来引来巨大的爆发式增长,对我们每个人的生活带来深刻的影响。
既然机器学习这么厉害,那么是不是可以让机器帮我们预测市场、选股票,买卖股票,我们只需要坐着看收益就好了,为什么现实不是这样的呢?
这一节就简单总结一下量化投资中的我们对机器学习需要了解的基本概念。后面再逐个研究算法的实际应用。
一句话总结:
机器学习是当前量化投资的一个重要的方向,但是它的效果并不比其他方向的策略更好。
为什么机器学习在投资领域并无明显优势?
这个现象在国内国外都是一样,相比之下,国外用机器学习做量化的会比国内多一些。我认为有两个方面原因:
2、人工智能、机器学习、深度学习什么关系?
补充:
什么是机器学习?
机器学习是人工智能的一个分支。它的核心就是学习能力。用逻辑化的语言来描述就是:
通过n个样本数据(训练样本),预测出未知数据(测试样本)的属性。
它和传统算法的主要差别就是:学习能力,也叫做泛化能力。
比如:预测股价这个问题,在传统算法中,基本认为是不可行的。但是在机器学习算法中,确是有较大成功概率的。
从大体上,我们将机器学习分为监督学习和无监督学习。
**监督学习:**训练样本中的“特性”feature对应目标的“标签”labels,通常用来解决以下两类问题:
分类问题,样本标签属于两类或多类。这通常是离散的数据。
回归问题,样本标签包括一个或多个连续变量。这通常是连续的数据。
**无监督学习:**训练样本的属性不包含对应的“标签”,通常是聚类问题。
**说明:**从量化投资的角度,我们用得较多的都是监督学习。
更详细的模型分类如下图:
说明:
就如同人类学习某种技能需要持续练习一样,机器学习某种规律也需要大量的数据进行训练。从开始获取数据、训练机器学习模型到最终模型投入应用,通常需要遵循一些固定的流程。
下图展示了机器学习的基本框架,主要步骤包括:数据获取、特征提取、数据转换、模型训练、模型选择和模型预测。
在模型训练中,针对不同的问题,我们选择什么样的机器学习方法呢,这里列举一些简单的例子:
- 如果数据中包含特征和标签,希望学习特征和标签之间的对应关系,那么可以采用监督学习的方法;
- 如果没有标签,希望探索特征自身的规律,那么可以采用非监督学习;
如果学习任务由一系列行动和对应的奖赏组成,那么可以采用强化学习。- 如果需要预测的标签是分类变量,比如预测股票上涨还是下跌,那么可以采用分类方法;
- 如果标签是连续的数值变量,比如预测股票具体涨多少,那么可以采用回归方法;
- 另外,样本和特征的个数,数据本身的特点,这些都决定了最终选择哪一种机器学习方法。
在进行模型建立的时候,我们有三种数据集:训练集、验证集、测试集
在评价模型效果的时候,有欠拟合、正常拟合和过拟合三种情况:
有人觉得这个问题很奇怪,一点都不。我们要做的是交易系统,要做的是量化投资,不论机器学习还是技术分析都只是工具。那么很自然就会有这样几种用法:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。