中位數

數值集合中,不大於一半元素,也不小於另一半元素的數

統計學上,中位數(英語:Median),又稱中央值[1]中值,是一個樣本、種群或概率分佈中之一個數值,其可將數值集合劃分爲数量相等的上下兩部分。對於有限的數集,可以通過把所有觀察值高低排序後找出正中間的一個作爲中位數。如果觀察值有偶數個,則中位數不唯一,通常取最中間的兩個數值的平均數作爲中位數。

一個數集中最多有一半的數值小於中位數,也最多有一半的數值大於中位數。如果大於和小於中位數的數值個數均少於一半,那麽數集中必有若干值等同於中位數。

连续随机变量X的分布函数为F(X),那么满足条件P(X≤m)=F(m)=1/2的数称为X或分布F的中位数。

对于一组有限个数的数据来说,其中位数是这样的一种数:这群数据的一半的数据比它大,而另外一半数据比它小。

计算有限个数的数据的中位数的方法是:把所有的同类数据按照大小的顺序排列。如果数据的个数是奇数,则中间那个数据就是这群数据的中位数;如果数据的个数是偶数,则中间那2个数据的算术平均值就是这群数据的中位数。

公式

實數 按大小順序(順序,降序皆可)排列為 

實數數列 的中位數  

 

其中 odd number 表示奇數,even number 表示偶數。


中位數特性

中位數在敘述統計學上和平均数、众数並列為數據的集中趨勢。三者的位置排序亦對應著偏度的正負偏態意義。一般而言,平均數是最常被使用做為數據的集中趨勢,但如果有極端值存在,平均數的代表性降低,也就所謂的「男人女人平均一顆睪丸」的問題,因此在有極端值的狀況下,中位數是比較好的集中趨勢代表。因此,在各國的每人所得分布上,通常以中位數代表集中趨勢,而非平均數[2]

中位數通常出現在描述统计学無母數統計,有母數的統計分析很少提及。中位數為集中趨勢時,對應的離散趨勢係數為平均絕對離差(Mean absolute deviation, MAD)或是四位位距(Q3 - Q1)。不過如果論及母體中位數的統計量時,仍需根據統計分析對抽樣分配的要求,尋找母體中位數統計量的期望值與變異數,再依照點估計的充分、不偏、效率、一致性進行討論。而母體中位數的統計量通常是樣本中位數。因此,樣本中位數的期望值與變異數就值得被討論,進行基礎研究。

常態分配下的中位數

常態分配下的平均數、中位數、眾數都是同一個位置。目前最為世人熟知的是平均數的抽樣分配會是常態分配,期望值為母體平均數 且變異數為母體變異數( )。統計學對常態分配的母體平均數統計量說明甚多,並發展完善。那麼中位數可基於機率分配模擬器和數值分析發展,在n個獨立隨機變數來自常態分配可生成n個隨機樣本,則E(樣本中位數)= 且Var(樣本中位數)= ,其中,k(n)受到樣本個數(n)影響。當樣本個數介於2至200時,兩者的關係不明顯,但可計算出樣本個數和k(n)的關聯表[3]

k(n)和n的對應表
n k(n) n k(n) n k(n)
2 0.500267128 70 0.021985179 138 0.011271806
3 0.448703237 71 0.021403637 139 0.011269587
4 0.298172500 72 0.021393271 140 0.011109049
5 0.286770401 73 0.020840845 141 0.011111745
6 0.214713620 74 0.020830427 142 0.010959968
7 0.210476952 75 0.020295864 143 0.010962027
8 0.168172011 76 0.020294599 144 0.010810205
9 0.166171644 77 0.019776971 145 0.010809127
10 0.138304145 78 0.019777466 146 0.010661452
11 0.137221972 79 0.019291777 147 0.010659591
12 0.117603985 80 0.019294767 148 0.010513172
13 0.116875871 81 0.018831955 149 0.010523498
14 0.102209683 82 0.018826854 150 0.010377973
15 0.101704592 83 0.018394657 151 0.010379735
16 0.090397468 84 0.018390467 152 0.010244606
17 0.090046842 85 0.017972657 153 0.010247290
18 0.081017991 86 0.017972309 154 0.010109136
19 0.080776427 87 0.017567447 155 0.010114347
20 0.073450103 88 0.017564340 156 0.009986419
21 0.073284584 89 0.017187295 157 0.009984465
22 0.067168338 90 0.017189110 158 0.009862704
23 0.067002164 91 0.016812903 159 0.009858886
24 0.061881619 92 0.016813666 160 0.009735345
25 0.061762647 93 0.016466660 161 0.009736185
26 0.057309720 94 0.016462668 162 0.009617128
27 0.057271174 95 0.016125488 163 0.009619325
28 0.053440064 96 0.016119237 164 0.009501480
29 0.053332370 97 0.015802880 165 0.009502525
30 0.049992614 98 0.015797856 166 0.009389839
31 0.049937448 99 0.015492872 167 0.009388423
32 0.047029351 100 0.015490432 168 0.009279058
33 0.046965211 101 0.015190773 169 0.009277712
34 0.044337988 102 0.015189776 170 0.009169514
35 0.044336558 103 0.014904567 171 0.009169768
36 0.041990927 104 0.014896640 172 0.009061071
37 0.041942218 105 0.014628725 173 0.009060657
38 0.039852927 106 0.014623638 174 0.008961003
39 0.039832458 107 0.014359452 175 0.008957769
40 0.037939073 108 0.014359166 176 0.008860612
41 0.037904745 109 0.014100614 177 0.008859363
42 0.036184274 110 0.014104129 178 0.008762802
43 0.036152192 111 0.013856818 179 0.008760489
44 0.034579591 112 0.013854712 180 0.008665028
45 0.034577569 113 0.013609600 181 0.008663662
46 0.033133177 114 0.013610680 182 0.008571695
47 0.033118807 115 0.013383360 183 0.008570240
48 0.031791145 116 0.013382329 184 0.008475410
49 0.031783399 117 0.013153728 185 0.008477845
50 0.030548873 118 0.013156167 186 0.008388634
51 0.030533811 119 0.012938560 187 0.008384818
52 0.029411882 120 0.012939455 188 0.008300454
53 0.029402885 121 0.012729706 189 0.008300175
54 0.028347691 122 0.012731381 190 0.008214157
55 0.028342062 123 0.012533040 191 0.008211878
56 0.027348747 124 0.012525181 192 0.008130539
57 0.027350473 125 0.012333899 193 0.008128310
58 0.026442809 126 0.012334408 194 0.008045347
59 0.026436289 127 0.012141084 195 0.008041810
60 0.025573242 128 0.012138522 196 0.007964784
61 0.025575279 129 0.011964057 197 0.007961234
62 0.024780610 130 0.011961887 198 0.007882679
63 0.024751923 131 0.011782874 199 0.007882009
64 0.024005574 132 0.011779941 200 0.007806200
65 0.024006688 133 0.011604216 201 0.007801090
66 0.023304209 134 0.011600908 202 0.007729016
67 0.023287460 135 0.011433315 203 0.007728333
68 0.022616908 136 0.011438587 204 0.007654504
69 0.022624425 137 0.011271806 205 0.007652196

如果樣本個數超過200,但不超過1000時,兩者有明顯的關係,並且受到樣本個數是否為奇數或偶數影響。此時可使用迴歸分析尋找兩者的關係。

1. 樣本個數為偶數,迴歸式為k(n) = 0.0000148965 + 1.5599936862 / n。

2. 樣本個數為奇數,迴歸式為k(n) = 0.0000084608 + 1.5674001064 / n。

由此可得到樣本中位數的變異數和母體常態分配的變異數形成穩定的對應關係[4]

參考文獻

  1. ^ median - 中央值;中位數;正中的 - 國家教育研究院雙語詞彙. 國家教育研究院. [2022-04-21]. (原始内容存档于2018-11-24) (中文(臺灣)). 
  2. ^ 台北市政府主計處,台北市家庭所得概況,民國106年。(連結页面存档备份,存于互联网档案馆))
  3. ^ (PDF) Source code of how to run sample median's variance. ResearchGate. [2021-10-21]. doi:10.13140/rg.2.2.16784.23041 (英语). 
  4. ^ (PDF) The Relationships between Variances of Normal Distribution and Sample Median: Sample size from 200 to 1000. ResearchGate. [2021-10-31]. doi:10.13140/rg.2.2.12462.13124/1 (英语). 

外部链接

本條目含有来自PlanetMathMedian of a distribution》的內容,版权遵守知识共享协议:署名-相同方式共享协议