四分位数
四分位数(英语:Quartile)是统计学中分位数的一种,即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数。
概念
- 第一四分位数( ),又称较小四分位数,等于该样本中所有数值由小到大排列后第25%的数字。
- 第二四分位数( ),又称中位数,等于该样本中所有数值由小到大排列后第50%的数字。
- 第三四分位数( ),又称较大四分位数,等于该样本中所有数值由小到大排列后第75%的数字。
第三四分位数与第一四分位数的差距又称四分位距(InterQuartile Range, IQR)。
运算过程
关于四分位数值的选择尚存争议[1]。
主要选择四分位的百分比值 ,及样本总量 有以下数学公式可以表示:[2]
- 情况1:如果 是一个整数,则取第 和第 的平均值
- 情况2:如果 不是一个整数,则取下一个最近的整数。(比如 , 则取 )
举例
一个算法如下(可以兼用TI-83计算器):
- 利用中位数使数据分成两列(不要把中位数放入已分好的数列)。
- 第一四分位数为第一组数列的中位数;第三四分位数为第二组数列的中位数。
以下例子可以用来参考。
- 例1
数据总量:
由小到大排列的结果:
- 例2
数据总量:
- 例3
数据总量:
应用
参考文献
- ^ Hyndman, Rob J; Fan, Yanan. Sample quantiles in statistical packages. American Statistician. November 1996, 50 (4): 361–365 [2020-01-19]. JSTOR 2684934. doi:10.2307/2684934. (原始内容存档于2017-01-25).
- ^ http://books.google.com/books?id=1LH6tNn6CYkC&printsec=frontcover&source=bl&ots=lOg76JIira&sig=Jp_OJYojlBs0LszvhIKuWkEjBuM&hl=en&ei=U4NdSszRLoqGsgPywYCxCg&sa=X&oi=book_result&ct=result&resnum=1