估計量

統計學名詞

統計學中,估計量(Estimator),亦稱推定量,是基於觀測數據計算一個已知量的估計值的法則:於是估計量(estimator)、被估量(estimand)和估計值(estimate)是有區別的。

估計量用來估計未知總體的參數,它有時也被稱為估計子;一次估計是指把這個函數應用在一組已知的數據集上,求函數的結果。對於給定的參數,可以有許多不同的估計量。我們通過一些選擇標準從它們中選出較好的估計量,但是有時候很難說選擇這一個估計量比另外一個好。

定義

假設存在一個固定的待估參數 。那麼"估計量"是樣本空間映射到樣本估計值的一個函數。 的一個估計量記為 

易用隨機變量的代數來闡述這個理論:如果用X來標記對應觀測數據的隨機變量,估計量(本身視為隨機變量)的符號表示為該隨機變量的函數, 。對特定觀測數據集(即對於X=x)而言,其估計值為一固定值 。通常使用簡化標記 表示隨機變量,但這容易造成誤解。

量化特性

以下定義和屬性是相關的。[1]

誤差

對於一個給定樣本 ,估計量 的「誤差」定義為

 

其中 是待估參數。注意誤差e不僅取決於估計量(估計公式或過程),還取決於樣本。

均方誤差

估計量 的均方誤差被定義為誤差的平方的期望值,即為:

 

它用來顯示估計值的集合與被估計單個參數的平均差異。試想下面的類比:假設「參數」是靶子的靶心,「估計量」是向靶子射箭的過程,而每一支箭則是「估計值」(樣本)。那麼,高均方誤差就意味着每一支箭離靶心的平均距離較大,低均方誤差則意味着每一支箭離靶心的平均距離較小。箭支可能集聚,也可能不。比如說,即使所有箭支都射中了同一個點,同時卻嚴重偏離了靶子,均方誤差相對來說依然很大。然而要注意的是,如果均方誤差相對較小,箭支則更有可能集聚(而不是離散)。

抽樣偏差

方差

偏差

 

行為特性

一致性

一致估計量序列是一列隨着序號(通常是樣本容量)無限增大時依概率收斂於被估量的估計量序列。換句話說,增加樣本容量增大了估計量接近總體參數的概率。

在數學上,一個估計量序列{tn; n ≥ 0}是參數θ的一致估計量當且僅當對於所有ϵ > 0,不管多小,我們都有

 

就如,一個人不斷地拋硬幣,隨着次數的增多,任何一面出現的概率(機率)就會趨於0.5。那麼這個0.5就是這個拋硬幣事件中任何一面出現概率的一致估計量,或者說一致估計值。

參見

外部連結

  1. ^ Jaynes (2007), p.172.