知行迭代
导航
首页
最近更改
随机页面
常用
分类目录
Linux命令
Mediawiki常用
电脑技巧
工具
链入页面
相关更改
特殊页面
页面信息
登录
查看“统计学”的源代码
←
统计学
页面
讨论
阅读
查看源代码
查看历史
因为以下原因,您没有权限编辑本页:
您请求的操作仅限属于该用户组的用户执行:[
[1]
]
您可以查看和复制此页面的源代码。
统计学是一门有关收集、处理、分析、解释和展示数据的学科。统计分析数据所用的方法大体上可分为两大类: *'''描述统计'''(descriptive statistics)是研究如何收集、处理、展示数据的统计学方法。 *'''推断统计'''(inferential statistics)是研究如何利用样本数据来推断总体特征的统计学方法。 ==简介== ===时间轴=== ==数据== ==描述统计== ===位置度量=== {| class="wikitable" style="width: 100%; ! 名称 ! 描述 ! 常用表示方法 ! 公式 |- | 平均数<br \>mean | 也叫算数平均数,是一组数据的数值之和除以个数。 | 样本平均数:<math>\overline{x}</math> <br \>样本个数:n<br \><br \>总体平均数:<math>\mu</math><br \>总体个数:N<br \> |<math>\overline{x} = \frac{\sum{x}_{i}}{n} = \tfrac{x_1 + x_2 + x_3 \ldots + x_n}{n} </math> <br \><br \> <math>\mu = \frac{\sum{x}_{i}}{N} = \tfrac{x_1 + x_2 + x_3 \ldots + x_N}{N} </math> |- | 加权平均数<br \>weighted mean | 类似算术平均数,算数平均每个数据的权重都为<math>\frac{1}{n}</math>,但加权平均数会根据每个数据的重要性分配权重。 | 样本平均数:<math>\overline{x}</math> <br \>样本个数:n<br \><br \>总体平均数:<math>\mu</math><br \>总体个数:N<br \> | 假设一组数据:<math>x_1, x_2, \dots , x_n</math> 权重为<math>w_1, w_2, \dots, w_n</math> <br \> <math>\bar{x} = \frac{ \sum_{i=1}^n w_i x_i}{\sum_{i=1}^n w_i} = \frac{w_1 x_1 + w_2 x_2 + \cdots + w_n x_n}{w_1 + w_2 + \cdots + w_n}</math> |- | 几何平均数<br \>geometric mean | 是n个数据乘积的n次方根。几何平均数比算术平均数更适合用于指数增长和变化的增长值;在商业中,几何平均数的增长率被称为复合年均增长率(CAGR)。 | 样本几何平均数:<math>\overline{x}_g</math> <br \>样本个数:n<br \><br \>总体几何平均数:<math>\mu_g</math><br \>总体个数:N<br \> | <math>\overline{x}_g = \sqrt[n]{x_1 x_2 \cdots x_n}=({x_1 x_2 \cdots x_n})^{\frac{1}{n}}</math> <br \><br \>简洁记法:<math>\overline{x}_g = \left(\prod_{i=1}^n x_i\right)^\frac{1}{n}</math> |- | 调和平均数<br \>harmonic mean | 是将所有数值取倒数并求其算术平均数后,再将此算术平均数取倒数。一般是在计算平均速率时使用。 | <math>H</math> | <math>H = \left(\frac{x_1^{-1} + x_2^{-1} + ... + x_n^{-1}}{n}\right)^{-1} = \frac{n}{\frac{1}{x_1} + \frac{1}{x_2} + ... + \frac{1}{x_n}} </math> <br \><br \>简记:<math>H = \frac{n}{\sum_{i=1}^n \frac{1}{x_i}}</math> |- | 调整平均数<br \>trimmed mean <br \>或truncated mean | 是删除数据的最高和最低端的一部分数值后,再计算平均值。如丢弃最高5%和最低5%的数据再计算平均值。 | | |- | 中位数<br \>median | 也叫中值,是一组数据按数值大小排序后,位于正中间的数,如果正中间有2个数,取这2个数的平均值。 |<math>M_e</math> <br \> |设一组数据:<math>x_1, x_2, \dots , x_n</math>。按大小顺序(升序或降序)排列后为:<math>x'_1, x'_2, \dots , x'_n</math><br \><math> \mathrm{M_e} = \begin{cases} x'_\frac{n + 1}{2}, & \mbox{n为奇数} \\ \frac{1}{2}( x'_\frac{n}{2} + x'_{\frac{n}{2} + 1}), & \mbox{n为偶数} \end{cases} </math> |- | 众数 <br \>mode |指一组数据中出现次数最多的数据值。 | | |- | 百分位数<br \>percentile | 将一组数据从小到大排序,并计算相应的累计百分位,某一百分位所对应数据的值就称为这一百分位的百分位数。 | <math>P_k</math> <br \>表示第k百分位数 | |- | 四分位数<br \>quartiles | 是把所有数值按大小排序并分成四等份,处于三个分割点位置的数值就是四分位数。<br \>*<math>Q_1</math>为第一四分位数(即第25百分位数)<br \>*<math>Q_2</math>为第二四分位数(即第50百分位数或中位数)<br \>*<math>Q_3</math>为第三四分位数(即第75百分位数) |<math>Q_1</math><br \><math>Q_2</math><br \><math>Q_3</math><br \> | |} ===离散程度=== {| class="wikitable" style="width: 100%; ! 名称 ! 描述 ! 常用表示方法 ! 公式 |- |极差<br \>range |是最大值减最小值后所得数值。 | | |- |四分位数间距<br \>interquartile range |是第三四分位数<math>Q_3</math>减第一四分位数<math>Q_1</math>所得的数值。也就是一组数据排序后中间50%的数据的极差。 |<math>IQR</math> |<math>IQR = Q_3-Q_1</math> |- |方差 <br \> variance |是每个值与平均值之间差的平方和,再除以个数N,对于样本除以n-1。 | 样本方差:<math>s^2</math> <br \>样本平均数:<math>\overline{x}</math> <br \>样本个数:n<br \><br \>总体方差:<math>\sigma^2</math><br \>总体平均数:<math>\mu</math><br \>总体个数:N<br \> |<math>\sigma^2 = \frac{\sum{(x_i - \mu)^2} }{N}</math> <br \><br \> <math>s^2 = \frac{\sum{(x_i - \overline{x})^2} }{n-1}</math> |- | 标准差 <br \> standard deviation | 是方差的平方根。 | 样本标准差:<math>s</math> <br \><br \>总体标准差:<math>\sigma</math> | <math>s = \sqrt{s^2} </math><br \><br \> <math>\sigma = \sqrt{\sigma^2} </math> |- | 变异系数 <br \> coefficient of variation | 又称标准差系数,是标准差归一化度量,通常表示为百分比。它是标准差<math> \sigma </math>与平均值<math> \mu </math>之比。 | | |} ===分布形态=== {| class="wikitable" style="width: 100%; ! 名称 ! 描述 ! 常用表示方法 ! 公式 |- |偏度 <br \>skewness | | | |- |峰度 <br \>kurtosis | | | |- |z-分数 <br \>z-score |也叫标准分数(standard score),是用来计算一个数据点的相对位置,即该值与平均值距离多少个标准差。 |z |<math> z_i = {x_i - \mu \over \sigma}</math> <br \><br \> <math>z_i = \frac{x_i-\bar{x}}{s}</math> |} ===图形=== ==概率与概率分布== ===概率基础=== ===离散型概率分布=== ===连续型概率分布=== ==参数估计== ==抽样与抽样分布== ==假设检验== ==方差分析== ==回归分析== ==时间序列分析== ==非参数统计== ==指数== ==资源== ===相关网站=== *[https://cosx.org/ 统计之都] ===相关文章=== *[https://www.sohu.com/a/358716327_120233365 搜狐:统计学的实质是什么?--写给所有将要或者正在学习统计学的朋友们] *[https://cosx.org/2008/11/domain-of-statistics-by-yihui/ 统计之都:谢益辉-统计学的领域(写给在统计学院学习的学弟学妹之一)] *[https://www.jiqizhixin.com/articles/2017-01-09-9 机器之心:自学数据科学与机器学习,19个数学和统计学公开课推荐] *[http://www.woshipm.com/data-analysis/4195180.html 人人都是产品经理:数据分析必备——统计学入门基础知识] ===书籍=== *《商务与经济统计》- 戴维.安德森 *《统计学(第三版)》-贾俊平 ==参考== * [https://zh.wikipedia.org/wiki/统计学 维基百科:统计学] * [https://en.wikipedia.org/wiki/Statistics 维基百科:统计学(英)] * [https://zh.wikipedia.org/wiki/集中趋势 维基百科:集中趋势] * [https://zh.wikipedia.org/wiki/概率分布 维基百科:概率分布] [[分类:统计学]]
返回至“
统计学
”。