赞
踩
补充:
纳什均衡是指博弈中这样的局面,对于每个参与者来说,只要其他人不改变策略,他就无法改善自己的状况。纳什证明了在每个参与者都只有有限种策略选择并允许混合策略的前提下,纳什均衡定存在。以两家公司的价格大战为例,价格大战存在着两败俱伤的可能,在对方不改变价格的条件下既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案。相互作用的经济主体假定其他主体所选择的战略为既定时,选择自己的最优战略的状态,也就是纳什均衡。
补充:
所谓高斯白噪声(White Gaussian Noise)中的高斯是指概率分布是正态函数,而白噪声是指它的二阶矩不相关,一阶矩为常数,是指先后信号在时间上的相关性。这是考查一个信号的两个不同方面的问题。
正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution)。
补充:
1. Relu:
数学表达式:a = max(0, z)
函数图像为:
优点:由上图可以看出,Relu得到的SGD的收敛速度较快
缺点:训练的时候很容易‘die'了,对于小于0的值,这个神经元的梯度永远都会是0,在实际操错中,如果learning rate很大,很可能网络中较多的神经元都'dead'了,即使是较小的learning rate,这种情况也很有可能发生。
为了解决以上的问题,提出了leakyRelu激活函数:
2. leakyRelu:
数学表达式:y = max(0, x) + leak*min(0,x) (leak是一个很小的常数,这样保留了一些负轴的值,使得负轴的信息不会全部丢失)
leakyRelu的图像:
3. 在tf中的实现:
Relu在tf中有官方的实现,可以直接调用函数 tf.nn.relu( features, name= None )
leakyRelu的简单实现可以这么写: tf.maximum(leak * x, x),
比较高效的写法为:
补充:
鲁棒是Robust的音译,也就是健壮和强壮的意思。它是在异常和危险情况下系统生存的关键。比如说,计算机软件在输入错误、磁盘故障、网络过载或有意攻击情况下,能否不死机、不崩溃,就是该软件的鲁棒性。所谓"鲁棒性",是指控制系统在一定(结构,大小)的参数摄动下,维持其它某些性能的特性。根据对性能的不同定义,可分为稳定鲁棒性和性能鲁棒性。以闭环系统的鲁棒性作为目标设计得到的固定控制器称为鲁棒控制器。
补充:
奥坎姆剃刀律是一个定律,出自于英国,解释了事物发展的一个定律。
科学上普遍适用的所谓"节俭律"的简单说明。这条定律的意义,就在于说明,最可能的解释就是最好的解释,有时这条定律又被称为奥坎姆剃刀,是根据14世纪时一位英国哲学家兼神学家威廉·奥坎姆命名的。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。