核密度估計
此條目需要精通或熟悉相關主題的編者參與及協助編輯。 (2015年12月14日) |
核密度估計(英語:Kernel density estimation,縮寫:KDE)是在概率論中用來估計未知的密度函數,屬於非參數檢驗方法之一,由Rosenblatt (1955)和Emanuel Parzen(1962)提出,又名Parzen窗(Parzen window)。Ruppert和Cline基於數據集密度函數聚類算法提出修訂的核密度估計方法。
核密度估計在估計邊界區域的時候會出現邊界效應。
在單變量核密度估計的基礎上,可以建立風險價值的預測模型。通過對核密度估計變異係數的加權處理,可以建立不同的風險價值的預測模型。
一些比較常用的核函數是: 均勻核函數 , 加入帶寬後: 。
三角核函數 , 加入帶寬後: 。
伽馬核函數 。
定義
設 為從單變量分布中抽取的獨立同分布樣本,給定點 有未知的概率密度 ,我們對估計函數 的形狀感興趣,其核密度估計器是
其中 是非負的核函數,帶寬 為平滑參數。帶下標h的核被稱為縮放核,定義為 。直覺上講,在數據允許的範圍內應當選擇儘可能小的帶寬;然而,偏差和方差之間總有所權衡。
常用的核函數有:均勻核(Uniform)、三角核(Triangular)、雙權核(Biweight)、三權核(Triweight)、Epanechnikov核、正態核(Normal)等。從均方誤差的角度來看,Epanechnikov核是最佳的[1],儘管對於前面列出的核來說,效率的損失很小[2]。由於其數學特性良好,正態核經常被使用,即 ,其中 是標準正態密度函數。
參考文獻
- 唐林俊、楊虎、張洪陽:核密度估計在預測風險價值中的應用 The Application of The Kernel Density Estimates in Predicting VaR,《數學的實踐與認識》2005年10期
這是一篇與統計學相關的小作品。您可以透過編輯或修訂擴充其內容。 |
- ^ Epanechnikov, V.A. Non-parametric estimation of a multivariate probability density. Theory of Probability and Its Applications. 1969, 14: 153–158. doi:10.1137/1114019.
- ^ Wand, M.P; Jones, M.C. Kernel Smoothing. London: Chapman & Hall/CRC. 1995. ISBN 978-0-412-55270-0.