赞
踩
在强化学习中会反复用到概率质量函数(Probability Mass Function,PMF)或者概率密度函数(Probability Density Function,PDF)。
∑ x ∈ X p ( x ) = 1 \sum_{x \in \mathcal{X}} p(x)=1 x∈X∑p(x)=1
p ( x ) = 1 2 π σ ⋅ exp ( − ( x − μ ) 2 2 σ 2 ) p(x)=\frac{1}{\sqrt{2 \pi} \sigma} \cdot \exp \left(-\frac{(x-\mu)^{2}}{2 \sigma^{2}}\right) p(x)=2π σ1⋅exp(−2σ2(x−μ)2)
μ \mu μ和 σ \sigma σ分别代表均值和标准差。说明在均值附近的取值的可能性大。
设 X \mathcal{X} X为变量 X X X的取值范围。那概率密度函数就有以下性质:
∫ X p ( x ) d x = 1 \int_{\mathcal{X}}^{} p(x)dx = 1 ∫
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。