經驗分佈函數

經驗分佈函數(英語:empirical distribution function)是統計學中一個與樣本經驗測度有關的分佈函數。該累積分佈函數是在所有n個數據點上都跳躍1/n階躍函數。對被測變量的某個值而言,該值的分佈函數值表示所有觀測樣本中小於或等於該值的樣本所佔的比例。

藍線為經驗分佈函數,黑色長條表示相應的樣本,綠線則是用於生成樣本的累積分佈函數。

經驗分佈函數是對用於生成樣本的累積分佈函數的估計。根據Glivenko–Cantelli定理英語Glivenko–Cantelli_theorem可以證明,經驗分佈函數以概率1收斂至這一累積分佈函數。

定義

(x1, …, xn)為獨立同分佈的的實隨機變量,它們共同的累積分佈函數為F(t)。於是,經驗分佈函數可定義為 [1][2]

 

其中 為事件A指示函數。對給定的t p = F(t)時的伯努利隨機變量。因而 則是期望為nF(t)、方差為nF(t)(1 − F(t))二項隨機變量。這意味着 F(t)無偏估計

不過,有些文獻中亦會將經驗分佈函數定義為[3][4]

 

參考文獻

  1. ^ van der Vaart, A.W. Asymptotic statistics. Cambridge University Press. 1998: 265. ISBN 0-521-78450-6. 
  2. ^ PlanetMath 互聯網檔案館存檔,存檔日期May 9, 2013,.
  3. ^ Coles, S. (2001) An Introduction to Statistical Modeling of Extreme Values. Springer, p. 36, Definition 2.4. ISBN 978-1-4471-3675-0.
  4. ^ Madsen, H.O., Krenk, S., Lind, S.C. (2006) Methods of Structural Safety. Dover Publications. p. 148-149. ISBN 0486445976