型別安全
在電腦科學中,一部分程式語言具備型別安全(中國大陸用語習慣稱型別為类型;稱資料為数据)的性質。這個術語在不同的社群中有不同的定義,特別是正規的型別理論上的定義遠遠強過大多數的程式員的理解,但對於使用型別系統的認知,皆旨在避免必然的錯誤形式,和不良的程式行為(稱為型別錯誤)。
型別錯誤(type error)是錯誤或不期望的程式行為,由不同資料類型的差別所引起,適用於程式的常數、變數、方法(函數),如把整型(int)當作了浮點型(float)。
型別安全可以靜態方式實施,及早在編譯時期就捕捉到潛藏的錯誤;或者以動態方式,在執行時期關聯型別的資訊,並在必要時檢測即將發生的錯誤。型別安全是程式語言的性質,而不是程式所自有的。例如,有可能以型別不安全的語言,編寫出型別安全的程式。在此是以程式語言為主,而不討論以個人能力維護的型別安全。
某個行為之所以會被程式語言歸類為型別錯誤,通常是因為試圖對不適當型別的值進行運算。其分類的基本原則是:部分語言設計者和程式員的看法認為,如果所有運算不引起程式瓦解、安全上的瑕疵、或其它明顯故障,即為合理的,而不視之為一個錯誤;其他人則認為所有違背程式員意圖的,就是錯誤的,而且應該標上「不安全」。在靜態型別系統中,型別安全通常包含一個保證,所有運算式最終的值都是合理的靜態型別成員(比子型別和多態性所要求的還要更加精確細微)。
型別安全近似於所謂的記憶體安全(就是限制從記憶體的某處,將任意的位元組合複製到另一處的能力)。例如,某個語言的實作具有若干型別 ,假如存在若干適當長度的位元,且其不為 的正統成員。若該語言允許把那些資料複製到 型別的變數,那個語言就不是型別安全的,因為這些運算可將非 型別的值指派給該變數。反過來說,若該語言型別不安全的程度,最高只到允許將任意整數用作為指標,顯然它就不是記憶體安全的。
大部分的靜態型別語言,都提供了一定程度的型別安全,而且其嚴格性更勝於記憶體的安全性。因其型別系統強迫程式員以適當的抽象資料型別定義來使用,即使對記憶體安全或任何可能的災難而言,並不需如此嚴格的要求。
定義
Robin Milner 對於型別安全所喊出的口號:
- 「具備良好型別的程式從不出錯。」
這一口號的涵義,取決於語言形式化語義的類別。在指稱語義學裏,型別安全意謂着一個運算式的值具有良好型別τ,則表達式是一個屬於τ的集合的真正的成員。
1994年,Andrew Wright 和 Matthias Felleisen 以操作語義學定義的公式描述:何謂現今的標準定義,以及對於型別安全的檢驗技術。根據上述方法,型別安全是以程式語言語義中的兩個性質所決定的:
- 藏存性
- 程式中的良好型別這一性質,即使轉換了語言的法則(即,評價法則或約簡法則),也不會有所改變。
- 進行性
- 具備良好型別的程式從不卡住,即從不進入一個使其無法進一步轉換的未知狀態。
這些性質不是無中生有的,而是和程式語言所描述出來的語義相連繫,而且各式各樣的語言存在着可以此基準來充實的廣大的空間。因為「型別良好」程式的概念已是靜態語義學的一部分,而「卡住」(或者「搞錯」)則是動態語義學方面的屬性。
語言的型別安全性
學術研究用途的玩具語言,常會提出型別安全方面的需求。另一方面,許多語言以人工方式所產生的型別安全,證實經常需要上千次的檢查。不過,某些語言,如Standard ML,其嚴格定義了語義,且 Java 也已提供型別安全[來源請求]。其它語言如 Haskell 也被認為是型別安全。暫且不理會語言定義的性質,在執行時期發生的某些錯誤,應歸於實作時的缺陷,或是用了其它語言撰寫的程式庫;這種錯誤可能使給定的實作,在某些情況下的型別不再安全。
型別安全語言的記憶體管理
要實現完善的型別安全語言,它至少需要垃圾回收或增加記憶體組態和解組態的限制(本節主要針對前者)。更明確地說,不允許懸置指標橫跨不同結構型別的存在。這有一技術上的原因:假定型別語言(如Pascal要求分配的記憶體必須顯式釋放)。如果存在一個仍舊指向之前的記憶體地址的懸置指標,新的資料結構可能會分配到同一空間。例如,如果初始化一個指向整數區域資料結構的指標,但新物件的指標區域卻分配在整數的地方,然後指標區域可藉由改變整數區域的值簡單改變成任可東西(經由間接參照懸置指標)。因為當指標改變時,尚未指定將會發生什麼,所以這個語言就不是型別安全的。大部分型別安全的語言滿足使用垃圾回收實現記憶體的管理。
在允許指標算術的語言中,實作垃圾回收器是最好的,所以在型別不安全的語言或型別安全可能失效的語言中,如此實作回收器的程式庫是最好的。C 和 C++ 經常使用。
型別安全與強型別
在各種強型別的定義中,其往往成為型別安全的同義詞;然而,型別安全與動態型別並不互相排斥。也可將動態型別視為非常寬鬆的靜態型別語言,而且所有語法正確的程式皆具備良好型別;只要它的動態語義學能夠保證絕不會有程式「搞錯」,它就可以滿足上述定義,且可稱為型別安全。
參閱
參考資料
- Benjamin C. Pierce, Types and Programming Languages, MIT Press, 2002. (ISBN 0-262-16209-1) [1](頁面存檔備份,存於互聯網檔案館)
- Type Safe defined in the Portland Pattern Repository's Wiki [2](頁面存檔備份,存於互聯網檔案館)
- Andrew K. Wright and Matthias Felleisen, "A Syntactic Approach to Type Soundness," Information and Computation 115(1), pp. 38-94, 1994. [3](頁面存檔備份,存於互聯網檔案館)
- Stavros Macrakis, "Safety and power", ACM SIGSOFT Software Engineering Notes 7:2:25 (April 1982)requires subscription