參數統計

统计学分支

母數統計(Parametric statistics)是統計學的一個分支,它假設樣本數據來自總體,而總體可以透過具有固定參數集的概率分布進行充分建模。 [1]相反,非參數模型的確切區別在於其參數集(或機器學習中的特徵集 )不是固定的,如果收集到新的相關信息,則該參數集可能會增加甚至減少。 [2]

大多數著名的統計方法都是參數化的。 [3]關於非參數(和半參數)模型, 戴維·考克斯爵士說:「這些模型通常較少涉及結構和分布形式的假設,但通常都包含有關獨立性的強有力假設」。 [4]

示例

正態分布族都具有相同的一般形態,並可以通過均值和標準差進行參數化 。這意味着,如果均值和標準差已知,並且分布是正態的,則任何將來觀察到的給定範圍內的概率都是已知的。

假設有一個存在99個測試分數的樣本,平均值為100,標準差為1。如果假設所有99個測試分數都是從正態分布中隨機觀察到的,那麼我們預測第100個測試分數有1%的概率將高於102.33(即平均值加2.33標準偏差)。給定99個來自相同正態分布的獨立觀測值,可使用參數統計方法計算上述標準偏差值。

對同一事物的非參數估計是前99個分數中的最大值。不需要假設考試分數的分布情況就可以推斷出,在我們進行考試之前,最高分數會出現在前100個分數中。因此,第100個分數有1%的可能性高於之前的99個分數。

歷史

RA Fisher在1925年的《 Statistical Methods for Research Workers 》中提到了參數統計,這為現代統計奠定了基礎。

參考文獻

  1. ^ Geisser, S., Modes of Parametric Statistical Inference, John Wiley & Sons, 2006 
  2. ^ Murphy, Kevin, Machine Learning: A probabilistic perspective, MIT Press: 16, 2012 
  3. ^ Cox, D. R., Principles of Statistical Inference, Cambridge University Press, 2006 
  4. ^ Cox 2006