格魯布斯檢驗法

格拉布斯檢驗法Grubbs's test),有時也被稱為最大歸一化殘差檢驗,是一種在統計學中用於分析異常值的方法,因發明者弗蘭克·E·格拉布斯英語Frank E. Grubbs而得名[1]

定義

格拉布斯檢驗法基於數據服從正態分佈的假設,用於檢驗單變量英語Univariate數據集內的離群值。因此,在使用格拉布斯檢驗法時,必須先檢驗數據的分佈是否可以用正態分佈進行近似[2]

格拉布斯檢驗法定義於如下假設之上:

H0:數據集中沒有異常值;
Ha:數據集中只有一個異常值。

定義格拉布斯檢驗統計量為:

 

其中,  分別指代的是樣本的均值標準偏差

如果採用雙邊檢驗英語two-sided test的方法,則格拉布斯檢驗可按照以下步驟進行:

將數據集中的 個數值由最小排列到最大,則最小值 或最大值 為可能的可疑數值。若要檢驗最小值是否為離群值,則可以按如下公式計算:

 

檢驗最大值時,則為:

 

對該雙邊檢驗,若下式成立,則在置信度 處,無偏差值的假設不成立:

 

其中, 表示t-分佈中當自由度 、顯著性水平為 時的上臨界值。如果採用單邊檢驗方式,則應該將顯著性水平改為 

參考文獻

  1. ^ Grubbs, Frank E. Sample criteria for testing outlying observations. Annals of Mathematical Statistics英語Annals of Mathematical Statistics. 1950, 21 (1): 27–58. doi:10.1214/aoms/1177729885. 
  2. ^ 1.3.5.17 Detection of Outliers. NIST/SEMATECH e-Handbook of Statistical Methods. NIST. 2012 [2019-03-09]. (原始內容存檔於2019-06-19). 

參見

延伸閱讀