在統計學 中,樣本 的第
k
{\displaystyle k}
順序統計量 (英語:Order Statistics )即它從小到大排列時的第
k
{\displaystyle k}
個值,常用於非參數估計 與推斷 中。常見的順序統計量包括樣本的最大值 、最小值 、中位數 等。
記號
任給樣本
x
1
,
x
2
,
⋯
,
x
n
{\displaystyle x_{1},x_{2},\cdots ,x_{n}}
,將其從小到大排成一列,記為:
x
(
1
)
,
x
(
2
)
,
⋯
,
x
(
n
)
.
{\displaystyle x_{(1)},x_{(2)},\cdots ,x_{(n)}.}
則其第一順序統計量(即最小值)為
x
(
1
)
{\displaystyle x_{(1)}}
,第
n
{\displaystyle n}
順序統計量(即最大值)為
x
(
n
)
{\displaystyle x_{(n)}}
。
概率
隨機變量
X
(
k
)
{\displaystyle X_{(k)}}
的累積分佈函數
F
k
(
x
)
{\displaystyle F_{k}(x)}
由下式給出[ 1]
F
k
(
x
)
=
∑
j
=
k
n
(
n
j
)
(
F
(
x
)
)
j
(
1
−
F
(
x
)
)
n
−
j
,
x
∈
R
,
{\displaystyle F_{k}(x)=\sum _{j=k}^{n}{\binom {n}{j}}(F(x))^{j}(1-F(x))^{n-j},\quad x\in \mathbb {R} ,}
將累積分佈函數求導可得其概率密度函數
f
k
(
x
)
{\displaystyle f_{k}(x)}
為
f
k
(
x
)
=
n
!
(
k
−
1
)
!
(
n
−
k
)
!
(
F
(
x
)
)
k
−
1
(
1
−
F
(
x
)
)
n
−
k
f
(
x
)
,
x
∈
R
.
{\displaystyle f_{k}(x)={\frac {n!}{(k-1)!(n-k)!}}(F(x))^{k-1}(1-F(x))^{n-k}f(x),\quad x\in \mathbb {R} .}
連續均勻樣本
從單位區間 上的連續型均勻分佈 取得的樣本,其各順序統計量的邊緣分佈 屬於Β分佈 族。此外,任意幾個順序統計量的聯合分佈 也有簡單的表示。本節將作介紹。藉賴累積分佈函數 (cdf),該些結果亦可推廣到任意連續分佈。
本節中,
X
1
,
X
2
,
…
,
X
n
{\displaystyle X_{1},X_{2},\ldots ,X_{n}}
表示以
F
X
{\displaystyle F_{X}}
為cdf的一組隨機樣本 。記
U
i
=
F
X
(
X
i
)
{\displaystyle U_{i}=F_{X}(X_{i})}
,則
U
1
,
…
,
U
n
{\displaystyle U_{1},\ldots ,U_{n}}
是從標準連續均勻分佈 抽取的對應樣本。由
F
X
{\displaystyle F_{X}}
的單調性,後者的順序統計量為
U
(
i
)
=
F
X
(
X
(
i
)
)
{\displaystyle U_{(i)}=F_{X}(X_{(i)})}
。
順序統計量
U
(
k
)
{\displaystyle U_{(k)}}
的概率密度函數(pdf)等於[ 2]
f
U
(
k
)
(
u
)
=
n
!
(
k
−
1
)
!
(
n
−
k
)
!
u
k
−
1
(
1
−
u
)
n
−
k
.
{\displaystyle f_{U_{(k)}}(u)={n! \over (k-1)!(n-k)!}u^{k-1}(1-u)^{n-k}.}
換言之,均勻分佈的第
k
{\displaystyle k}
順序統計量遵循Β分佈 [ 2] [ 3]
U
(
k
)
∼
Beta
(
k
,
n
+
1
−
k
)
.
{\displaystyle U_{(k)}\sim \operatorname {Beta} (k,n+1\mathbf {-} k).}
證明如下:欲使
U
(
k
)
{\displaystyle U_{(k)}}
介乎
u
{\displaystyle u}
與
u
+
d
u
{\displaystyle u+\mathrm {d} u}
之間,樣本須恰有
k
−
1
{\displaystyle k-1}
個元素小於
u
{\displaystyle u}
,並至少有一個介乎
u
{\displaystyle u}
與
u
+
d
u
{\displaystyle u+\mathrm {d} u}
之間。該區間包含多於一個元素的概率已是
O
(
d
u
2
)
{\displaystyle O(\mathrm {d} u^{2})}
(使用了大O符號 ),故衹需計算
(
0
,
u
)
{\displaystyle (0,u)}
、
(
u
,
u
+
d
u
)
{\displaystyle (u,u+du)}
、
(
u
+
d
u
,
1
)
{\displaystyle (u+du,1)}
三區間分別恰有
k
−
1
{\displaystyle k-1}
、
1
{\displaystyle 1}
、
n
−
k
{\displaystyle n-k}
個元素的概率。此即三項分佈 概率
n
!
(
k
−
1
)
!
(
n
−
k
)
!
u
k
−
1
⋅
d
u
⋅
(
1
−
u
−
d
u
)
n
−
k
,
{\displaystyle {n! \over (k-1)!(n-k)!}u^{k-1}\cdot \mathrm {d} u\cdot (1-u-\mathrm {d} u)^{n-k},}
故上述pdf公式成立。該分佈的平均值為
k
/
(
n
+
1
)
{\displaystyle k/(n+1)}
。
參考文獻
^ Order Statistics . www.math.uah.edu. [2016-07-28 ] . (原始內容存檔 於2017-08-13).
^ 2.0 2.1 Gentle, James E. Computational Statistics . Springer. 2009: 63. ISBN 9780387981444 (英語) .
^ Jones, M. C. Kumaraswamy's distribution: A beta-type distribution with some tractability advantages. Statistical Methodology. 2009, 6 (1): 70–81. doi:10.1016/j.stamet.2008.04.001 . As is well known, the beta distribution is the distribution of the m ’th order statistic from a random sample of size n from the uniform distribution (on (0,1)).