正态分布

正态分布(normal distribution),又称高斯分布(Gaussian distribution),是正态概率分布的简称,一个非常重要的连续概率分布。若随机变量[math]\displaystyle{ X }[/math]服从均值或期望为[math]\displaystyle{ \mu }[/math],标准差为[math]\displaystyle{ \sigma }[/math]的正态分布,记为[math]\displaystyle{ X \sim N(\mu,\sigma^2) }[/math]。很多现象都近似服从正态概率分布,如人的身高和体重、红细胞数、测量误差等。

时间轴

  • 1718年,法国数学家棣莫弗(Abraham de Moivre)在其著作《The Doctrine of Chances》提及。
  • 1734年,棣莫弗发表的一篇关于二项分布文章中提出的,当二项随机变量的位置参数n很大及形状参数p为1/2时,则所推导出二项分布的近似分布函数就是正态分布。

基本

正态分布定义

若随机变量[math]\displaystyle{ X }[/math]的概率密度函数( probability density function,简称pdf)为

正态概率密度函数 [math]\displaystyle{ f(x) = \frac1{\sigma\sqrt{2\pi}}\; e^{-\frac{\left(x-\mu\right)^2}{2\sigma^2} } }[/math]
其中,[math]\displaystyle{ \mu }[/math]为均值,[math]\displaystyle{ \sigma }[/math]为标准差,[math]\displaystyle{ \pi }[/math]为3.14159...,e为2.71828...

就称[math]\displaystyle{ X }[/math]服从参数为[math]\displaystyle{ \mu, \sigma }[/math]的正态分布,记为[math]\displaystyle{ X \sim N(\mu,\sigma^2) }[/math]

标准正态分布定义

通常使用字母z来表示这个特殊的正态分布的随机变量。若随机变量[math]\displaystyle{ Z }[/math]服从均值[math]\displaystyle{ \mu=0 }[/math], 标准差[math]\displaystyle{ \sigma=1 }[/math]的正态分布,则称该随机变量服从标准正态分布(standard normal distribution),记为[math]\displaystyle{ Z \sim N(0,1) }[/math]。 将参数[math]\displaystyle{ \mu, \sigma }[/math]值传入正态概率密度函数计算,简化得出标准正态概率密度函数:

标准正态密度函数 [math]\displaystyle{ f(z) = \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} }[/math]
其中,[math]\displaystyle{ \pi }[/math]为3.14159...,e为2.71828...

累积分布函数

累积分布函数(Cumulative Distribution Function,简称cdf),又叫分布函数,是概率密度函数的积分。是指随机变量[math]\displaystyle{ X }[/math]小于或等于[math]\displaystyle{ x }[/math]的概率,通常记作[math]\displaystyle{ F(x) }[/math][math]\displaystyle{ F(x; \mu,\sigma) }[/math]

标准正态密度函数 [math]\displaystyle{ F(x)= P(X \le x) = \frac{1}{\sigma\sqrt{2\pi}} \int_{-\infty}^x e^{-\frac{(t - \mu)^2}{2\sigma^2}} dt. }[/math]


抽样分布

抽样分布是特定的随机样本统计量的概率分布。如样本均值[math]\displaystyle{ \bar{x} }[/math]的抽样分布,是。

样本均值[math]\displaystyle{ \bar{x} }[/math]的抽样分布

样本比率的抽样分布

标准正态分布表

资源

参考