描述性统计常用数据指标


一、指标测量类型

分类指标

  • 定类:用于分类,如性别、地区等。
  • 定序:用于分类和排序,如年级、学历、年龄等。

连续指标

  • 定距:用于分类、排序和加减,如0-10评分、温度等。
  • 定比:用于分类、排序、加减和乘除,如收入、成绩等。

二、集中趋势指标

  • 均值:算术平均、几何平均、调和平均、调整平均(trim平均)四种。
    • 算术平均:数据的合计除以数据的个数。
    • 几何平均:常用于计算销售增长率、价格变动率等。
    • 调和平均:常用于计算速度的平均。
    • 调整平均:常用于数据的上限和下限相差较大时。
  • 中位数:将数据由小到大排列时,居于中间(50%)的数值。
  • 众数:在频数分布中出现次数最多的数值。

三、离散趋势指标

  • 频数分布:主要用于分类指标的统计,表达样本或总体数据的分布情况。
  • 标准差/方差:表示各个数据相对于平均值的离散程度。
  • 四/百分位差:将数据分成四等份,处于三个分割点位置的数值。
  • 极差:数据的最大值和最小值的距离。
  • 离散系数:变异系数,标准差的归一化操作。

四、具体计算方法

标准差的计算

  • 公式:[ = ]
  • 示例:计算1、5、9三个数据的标准差。

四分位差的计算

  • 公式:[ Q = Q3 - Q1 ]
  • 示例:计算数列1 2 2 5 6 9 9的四分位差。

极差的计算

  • 公式:[ = - ]

离散系数的计算

  • 公式:[ C.V = ]
  • 优点:无量纲,可以直接比较不同项目。
  • 缺点:均值接近0时,标准差的微小变动会造成系数较大波动。

五、不同测量类型如何选择集中和离散趋势指标

  • 分类指标
    • 集中趋势:中位数、众数
    • 离散趋势:频数分布
  • 连续指标
    • 集中趋势:均值、中位数、众数
    • 离散趋势:标准差、方差、四分位差、百分位数、极差、离散系数

六、总结

  • 理解不同指标类型及其适用场景。
  • 掌握集中趋势和离散趋势指标的计算方法。
  • 根据数据类型选择合适的统计指标进行分析。

文章作者: darebeat
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 darebeat !
 上一篇
抽样的概念与应用场景 抽样的概念与应用场景
系统地掌握统计学基础中的指标测量类型、集中趋势和离散趋势指标及其计算方法。这将有助于在数据分析中选择合适的统计方法,进行有效的数据解读和决策。
2025-03-17
下一篇 
ECS磁盘挂载脚本 ECS磁盘挂载脚本
在阿里云ECS实例中,挂载磁盘通常需要编写一个Shell脚本来自动化分区、格式化和挂载过程。
2025-01-17
  目录