正态分布
正态分布(normal distribution),又称高斯分布(Gaussian distribution),是正态概率分布的简称,一个非常重要的连续概率分布。若随机变量[math]\displaystyle{ X }[/math]服从均值或期望为[math]\displaystyle{ \mu }[/math],标准差为[math]\displaystyle{ \sigma }[/math]的正态分布,记为[math]\displaystyle{ X \sim N(\mu,\sigma^2) }[/math]。很多现象都近似服从正态概率分布,如人的身高和体重、红细胞数、测量误差等。
时间轴
- 1718年,法国数学家棣莫弗(Abraham de Moivre)在其著作《The Doctrine of Chances》提及。
- 1734年,棣莫弗发表的一篇关于二项分布文章中提出的,当二项随机变量的位置参数n很大及形状参数p为1/2时,则所推导出二项分布的近似分布函数就是正态分布。
基本
正态分布定义
若随机变量[math]\displaystyle{ X }[/math]的概率密度函数( probability density function,简称pdf)为
正态概率密度函数 | [math]\displaystyle{ f(x) = \frac1{\sigma\sqrt{2\pi}}\; e^{-\frac{\left(x-\mu\right)^2}{2\sigma^2} } }[/math] | |
其中,[math]\displaystyle{ \mu }[/math]为均值,[math]\displaystyle{ \sigma }[/math]为标准差,[math]\displaystyle{ \pi }[/math]为3.14159...,e为2.71828... |
就称[math]\displaystyle{ X }[/math]服从参数为[math]\displaystyle{ \mu, \sigma }[/math]的正态分布,记为[math]\displaystyle{ X \sim N(\mu,\sigma^2) }[/math]。
标准正态分布定义
通常使用字母z来表示这个特殊的正态分布的随机变量。若随机变量[math]\displaystyle{ Z }[/math]服从均值[math]\displaystyle{ \mu=0 }[/math], 标准差[math]\displaystyle{ \sigma=1 }[/math]的正态分布,则称该随机变量服从标准正态分布(standard normal distribution),记为[math]\displaystyle{ Z \sim N(0,1) }[/math]。 将参数[math]\displaystyle{ \mu, \sigma }[/math]值传入正态概率密度函数计算,简化得出标准正态概率密度函数:
标准正态密度函数 | [math]\displaystyle{ f(z) = \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} }[/math] | |
其中,[math]\displaystyle{ \pi }[/math]为3.14159...,e为2.71828... |
累积分布函数
累积分布函数(Cumulative Distribution Function,简称cdf),又叫分布函数,是概率密度函数的积分。是指随机变量[math]\displaystyle{ X }[/math]小于或等于[math]\displaystyle{ x }[/math]的概率,通常记作[math]\displaystyle{ F(x) }[/math]或[math]\displaystyle{ F(x; \mu,\sigma) }[/math]。
标准正态密度函数 | [math]\displaystyle{ F(x)= P(X \le x) = \frac{1}{\sigma\sqrt{2\pi}} \int_{-\infty}^x e^{-\frac{(t - \mu)^2}{2\sigma^2}} dt. }[/math] | |