析因實驗
析因設計(英語:factorial design)或因子設計是一種實驗設計方法,用於目標變量同時受到多種因素(factor)影響的場合,能夠同時分析各因素的單獨效應和因素之間的交互效應。採用這一設計的實驗稱作析因實驗(factorial experiment)。在析因實驗中,作為研究物件的因素會被分配若干不同的取值,研究者則將這些取值的各種可能組合實施於實驗物件上,觀察每一組合下目標變量的結果。
發展
在實驗中同時檢驗多種因素的想法於19世紀下半葉出現在農業研究之中[1]。在分析不同作物品種、不同肥料、不同的播種時間等等因素對產量的影響時,各個因素之間常常相互關聯,例如不同品種的作物對應的最佳肥料用量可能不同[2]。這類實驗的例子譬如英國洛桑研究所的Hoosfield大麥實驗。自1852年起,洛桑研究所每年都播種一批大麥,施以不同的肥料組合來檢驗其對作物產量的影響,為世界上持續時間最久的農業實驗之一[3]。Hoosfield大麥實驗研究的因素包含磷肥(過磷酸鈣)、鉀肥(硫酸鉀)、以及氮肥(又細分為硫酸銨、硝酸鈉、菜籽餅)。「磷肥施加與否」包含兩種不同的可能性,「鉀肥施加與否」亦包含兩種不同的可能性,而「氮肥施加與否,若施加,施加哪一種氮肥」則有四種不同的可能性。用於實驗的田地因此被劃分為2×2×4=16塊,每一塊對應三個因素的一種組合。具體的劃分如下所示。[4]
C | ||||
AA | ||||
A | ||||
- | ||||
PK | K | P | - |
每一行對應與氮肥相關的四種可能性:C行中的田地施以菜籽餅,AA行施以硝酸鈉,A行施以硫酸銨,最後一行則不施加任何氮肥。每一列則對應鉀肥與磷肥的組合:PK列中的田地同時施以過磷酸鈣與硫酸鉀,K列僅施以硫酸鉀,P列僅施以過磷酸鈣,剩餘一列則不施加磷肥或鉀肥。整個實驗從而能夠同時檢驗三種因素的所有不同組合對作物產量的影響。[5]
不過,長期以來這一實驗設計方法並未得到認可,大多數實驗者仍認為每次實驗只應檢驗一種因素的影響。英國統計學家羅納德·費雪於20世紀初首次闡明了析因實驗的優勢,並完善了對析因實驗結果的分析方法[6][7]。這一觀點得到弗蘭克·耶茨等統計學家的認同和推廣,析因實驗也逐漸在其他科學領域中得到接受。[1]
術語
在析因實驗中,因素(factor)指研究者想要探索的,可能對目標變量產生影響的實驗條件,分為定量因素或定性因素:定量因素的值有內在的大小之分,例如溫度、重量;定性因素的值則無法依大小排序,例如化學實驗中使用的催化劑種類[8]。研究者會為每種因素選擇若干取值用於實驗,這些取值稱作各因素的水平(level),而在各種水平組合下實驗的結果稱作響應(response)。[9]
析因實驗依照其包含的因質數量和各因素的水平數量稱呼。包含兩種因素,每種因素都有兩種水平的實驗稱作2×2析因實驗或2²析因實驗。若因質數量更多,但水平數量仍保持兩種,便稱作稱作2×2×2×…或2ⁿ析因實驗[5][10]。如果水平數量多於兩種,比如實驗包含三種因素,分別有3,4,5種水平,則稱作3×4×5析因實驗。[11]
在Hoosfield大麥實驗中,全部的2×2×4=16種水平組合都在實驗中得到檢驗,這種包含所有水平組合的設計稱作完全析因設計或全因子設計(complete factorial design)。若實驗中的因素或水平數量較多,則完全析因設計需要檢驗大量不同的水平組合,使之不再現實;此時則可以考慮不檢驗所有水平組合,只選擇一部分合適的組合於實驗中研究,稱作部分析因設計。[12]
分析
析因設計較其他實驗設計的優勢可以以2×2析因實驗為例來展示。美國數學家喬治·斯內德克曾舉出以下例子:有兩種麵粉 與 ,兩種調味 與 ,蛋糕師希望研究哪種組合下烘培出的蛋糕評價最佳。
如果不使用析因設計,則需對麵粉和調味兩種因素分開實驗。假設先以調味為控制變量,比如固定調味為 ,以分析兩種麵粉對蛋糕評價的影響。實驗因而包含 、 兩種組合。採用兩種組合分別烘培若干個蛋糕,用上橫線表示顧客對使用某一組合的蛋糕的平均評價,則顧客對兩種蛋糕平均評價的差異可記為
假設兩種蛋糕都分別烘培了4個,用 表示單次誤差,則上述表達式的方差為 。同理,如果控制麵粉不變,使用兩種調味各烘培4個蛋糕,則方差同樣為 。這一實驗設計因而需要烘培16個蛋糕,方差為 。
若使用析因設計,則 、 、 、 四種組合同時得到考慮。此時對各個變量影響的計算不再僅包含兩種蛋糕間評價的差異,而是包含所有四種組合。例如兩種麵粉的差異此時表達為
這一表達式稱作麵粉這一因素的主效應。如果每種組合烘培 個蛋糕,則方差為 。這說明析因設計下只需要每種組合烘培2個,共8個蛋糕,即可獲得與之前同樣小的方差,所需樣本數量為不採用析因設計時的二分之一。[13]
析因實驗的結果還可用於計算各因素間的交互效應,表示一種因素對目標變量的效應在多大程度上受到另一因素的影響。如上述例子中,當調味為 時,蛋糕使用兩種麵粉時評價間的差異為
當調味為 時,兩種蛋糕評價間的差異為
兩種因素的交互效應被定義為以上表達式的差值的一半,即
參見
引用
- ^ 1.0 1.1 Webster 2006.
- ^ Yates 1937,第4-5頁.
- ^ Rothamsted Research 2018,第4頁.
- ^ Rothamsted Research 2018,第31-32頁.
- ^ 5.0 5.1 5.2 Yates 1935.
- ^ Speed 1992.
- ^ Yates 1964.
- ^ Davies 1956,第248-249頁.
- ^ Davies 1956,第249-250頁.
- ^ Davies 1956,第268頁.
- ^ Davies 1956,第291頁.
- ^ Davies 1956,第440頁.
- ^ Snedecor & Cochran 1989,第297-299頁.
- ^ Snedecor & Cochran 1989,第300頁.
參考文獻
- Davies, O. L. (編), The Design and Analysis of Industrial Experiments, 2nd Edition, Oliver and Boyd, 1956 (英語)
- Rothamsted Research, Rothamsted Long-term Experiments, 2018, ISBN 978-1-9996750-1-1 (英語)
- Snedecor, G. W.; Cochran, W. G., Statistical Methods, 8th Edition, Iowa State University Press, 1989, ISBN 0-8138-1561-4 (英語)
- Speed, T. P., Introduction to "The Arrangement of Field Experiments", Kotz, S.; Johnson, N. L. (編), Breakthroughs in Statistics, Volume 2: Methodology and Distribution, Springer: 71–81, 1992, ISBN 978-1-4612-4380-9 (英語)
- Webster, J. T., "Factorial experiments", Kotz, S.; Read, C. B.; Balakrishnan, N.; Vidakovic, B. (編), Encyclopedia of Statistical Sciences, 2nd Edition, Volume 4, Wiley: 2223–2227, 2006, ISBN 978-0-471-15044-2 (英語)
- Yates, F., Complex Experiments, Supplement to the Journal of the Royal Statistical Society, 1935, 2 (2): 181–247, JSTOR 2983638 (英語)
- Yates, F., The Design and Analysis of Factorial Experiments, Imperial Bureau of Soil Science, 1937 [2024-07-01], (原始內容存檔於2024-04-12) (英語)
- Yates, F., Sir Ronald Fisher and the Design of Experiments, Biometrics, 1964, 20 (2): 307–321, JSTOR 2528399 (英語)
延伸閱讀
- Cochran, W. G.; Cox, G. M., Experimental Designs, Wiley, 1950 (英語)
- Fisher, R. A., The Design of Experiments, 9th Edition, Macmillan, 1971 (英語)