PostgreSQL

自由且開放原始碼的關聯式資料庫管理系統

PostgreSQL/ˌpstɡrɛskjuˈɛl/ POHST-gres-kew-EL[5][6]是一款功能全面且開源關係型數據庫管理系統,憑藉其卓越的擴展能力和對SQL標準的嚴格遵循而廣受讚譽。作為一款成熟的數據庫系統,它不僅支持符合ACID特性的事務處理,還集成了自動更新的視圖、物化視圖、觸發器外鍵約束以及存儲過程等一系列強大功能。[7] PostgreSQL能夠在WindowsLinuxmacOS等主流操作系統上流暢運行,其應用範圍極為廣泛,無論是單機應用、大規模數據倉庫,還是數據湖[8]、高並發Web服務等場景,都能應對自如。

PostgreSQL
開發者PostgreSQL Global Development Group
首次發布1996年7月8日,​28年前​(1996-07-08[1]
當前版本17.2[2]在維基數據編輯(2024年11月21日,22天前)
源代碼庫 編輯維基數據鏈接
編程語言C語言
操作系統Linux, Windows, FreeBSD, OpenBSD, NetBSD, macOS, AIX, HP/UX, Solaris[3]
平台x86, x86_64, IA64, PowerPC, PowerPC 64, S/390, S/390x, Sparc, Sparc 64, ARM, MIPS, MIPSEL, PA-RISC[3]
語言英語
類型關聯式資料庫
許可協議PostgreSQL授權[4]
網站www.postgresql.org 編輯維基數據

PostgreSQL的核心開發工作由全球開發組(英語:PostgreSQL Global Development Group)負責,他們專注於數據庫引擎及其核心組件的研發與優化。在這個核心團隊之外,還活躍着一個生機勃勃的開發者社區和生態系統,他們為PostgreSQL提供了眾多增強功能,填補了通常由商業數據庫供應商所提供的功能空缺。這些擴展涵蓋了地理空間數據處理[9]時序數據庫[10]支持等特殊領域,以及模擬其他數據庫產品的兼容層。[11][12][13][14] 同時,第三方開發者也貢獻了各種用戶和機器接口功能,包括圖形用戶界面[15][16][17]負載均衡高可用性工具集等。[18] 儘管這個龐大的支持網絡(涵蓋個人、企業、產品和項目)並非PostgreSQL開發組的一部分,但它們共同促進了PostgreSQL生態系統的繁榮發展,對數據庫的推廣與應用起到了至關重要的作用。[19]

這款數據庫系統最初名為POSTGRES,以彰顯其作為加州大學柏克萊分校Ingres數據庫系統繼承者的身份。[20][21] 1996年,為了體現其對SQL的支持,項目更名為PostgreSQL。經過2007年的一次評審,開發團隊決定保留PostgreSQL這個名稱和Postgres這個簡稱。[22]

歷史

PostgreSQL經歷了長時間的演變。該項目最初開始於在加利福尼亞大學伯克利分校Ingres計劃。這個計劃的領導者邁克爾·斯通布雷克在1982年離開加利福尼亞大學伯克利分校去推進Ingres的商業化,但最後還是返回了學術界。在1985年返回伯克利之後,斯通布雷克開始了post-Ingres計劃,致力於解決在1980年代早期所出現一些數據庫系統存在的問題。Postgres和Ingres的代碼庫開始(並保持)完全分離。

新項目Postgres的目的是通過增加最少的功能來完全支持所需要的類型。這些功能包括類型定義和完整描述數據關係的能力。完整描述數據關係的能力之前雖廣為使用但卻需要由用戶來維護。Postgres的數據庫能夠"理解"關係,並可以使用一定的規則以自然方式在相關的表中檢索信息。

從1986年開始,該項目組發表了一些描述這一系統基本原理的論文,並在1988年實現並運行了一個Demo版本。項目組在1989年六月向少數用戶發行了版本1.0,隨後在1990年6月發行了帶有全新規則系統的版本2.0。1991年的版本3.0再次重寫了規則系統,並增加了對多個存儲管理器的支持與改進的查詢引擎。Postgres在1993年開始擁有大量用戶,這些用戶提供了大量的功能與優化建議。但是在發行了作為細節修正的版本4.0之後,Postgres計劃就終止了。

儘管Postgres計劃正式的終止了,BSD許可證(Postgres遵守BSD許可證發行)卻使開發者們得以獲取源代碼並進一步開發系統。1994年,兩個加利福尼亞大學伯克利分校的研究生 Andrew Yu和Jolly Chen 增加了一個SQL語言解釋器來替代早先的基於Ingres的QUEL系統,建立了Postgres95。代碼隨後被發布到互聯網上供全世界使用。Postgres95在1996年被重命名為PostgreSQL以便突出該數據庫全新的SQL查詢語言

PostgreSQL首次發行即選擇6.0作為其版本號,由來自世界各地的數據庫開發者和志願者們,通過互聯網進行軟件的維護。在2005年1月19日,PostgreSQL發行了版本8.0。自版本8.0之後,PostgreSQL得以藉助原生方式運行於Windows系統之下。

儘管許可證允許PostgreSQL被用於商業用途,PostgreSQL卻並沒有像Ingres那樣快速的被商業化。在2005年1月,PostgreSQL才收到了它來自數據庫廠商的第一份援助。Pervasive Software[23]宣布了對PostgreSQL的商業支持和社區參與。

但其實在此之前,就已經有一些公司開始對PostgreSQL伸出援手。2000年,前Red Hat投資者籌組了一間名為Great Bridge的公司來商業化PostgreSQL,與其他商用資料庫廠商展開競爭。Great Bridge資助了好幾位PostgreSQL開發者,並且貢獻了許多資源給社區。然而到了2001年末,Great Bridge卻終止了營運,一部分原因在於PostgreSQL在被商業化後,其市場狀況並不理想。

2001年,Command Prompt, Inc.發布了Mammoth PostgreSQL,這是最老牌的PostgreSQL商業軟件。他們通過對開發者的贊助,和開發PL/PerlPL/php等PostgreSQL在各語言中的實現,以及維護PostgreSQL Build Farm等方式來支援PostgreSQL社群。

2005年1月,PostgreSQL接到了來自另一間數據庫廠商Pervasive Software的支持,該公司以常見於Novell NetWare平台的Btrieve產品而聞名。他們宣布了進行商業支援和對社群的參與。但在他們成功商業化PostgreSQL一段時間後的2006年7月,Pervasive Software離開了PostgreSQL的支援市場。

在2005年中,兩間其他的公司宣佈商業化PostgreSQL,分別進入不同的利基市場EnterpriseDB宣布將專注於讓使用Oracle的應用程式能更容易的在PostgreSQL上運行。Greenplum則專注貢獻在資料倉儲商業智慧的應用程式,尤其以BizGres專案著稱。

2005年10月,昇陽的軟體部門執行副總裁John Loiacono談論到:"我們不會去OEM微軟的產品,我們正關注著PostgreSQL",儘管當時並沒有任何規格釋出。到了2005年11月,昇陽宣布將支援PostgreSQL。2006年6月,Solaris 10包含PostgreSQL一起發佈。

至於PostgreSQL專案本身,他繼續着每年一個主要版本發佈,以及次要的除錯版本發佈,這些發布全都遵守BSD授權。

描述

如果很粗略地觀察PostgreSQL,會覺得這個數據庫系統和其它數據庫很類似。因為PostgreSQL使用SQL語言來執行資料的查詢。這些資料通過外鍵聯繫在一起,以一系列表格的形式存在。PostgreSQL相對於競爭者的主要優勢為可編程性:對於使用數據庫資料的實際應用,PostgreSQL讓開發與使用變得更簡單。

SQL數據在「平面表格」中存儲簡單的數據類型,需要用戶使用查詢把有關的信息收集在一起。這與應用和用戶利用數據自身的方式相對立:典型的使用帶有豐富數據類型的高級語言,在其中所有有關的數據作為它自己的一個完整單元來操作。典型的稱呼為記錄對象(依據各自語言)。

轉換來自SQL世界的信息到面向對象編程世界體現得很困難,因為兩者有非常不同的數據組織的模型。工業界把這個問題稱為對象關係不匹配英語Object-relational_impedance_mismatch:從一個模型映射到另一個要花費項目開發者40%的時間。一些映射解決方案,典型的稱為對象關係映射,致力於這個問題,但是它們花費很多並有自身的問題,導致糟糕的性能或強制所有的數據訪問通過映射所支持的一種語言來進行。

PostgreSQL可以直接在數據庫中解決很多這類問題。PostgreSQL允許用戶定義基於正規的SQL類型的新類型,允許數據庫自身理解複雜數據。例如,你可以定義一個address來組合一些事物如街道編號、城市和國度的字符串。從這一點上你可以輕易地建立把保存地址所需要的所有字段包含在一個單一行列中的表。

PostgreSQL還允許類型包括繼承,這是在面向對象編程中的主要概念。例如,你可以定義post_code類型,並接着基於它建立us_zip_codecanadian_postal_code。在數據庫中的address就可以採用us_address或者canadian_address形式,而特定的規則可以在各自情況下驗證數據。在PostgreSQL的早期版本中,實現新類型需要寫C擴展並把它們編譯到數據庫服務器中;在版本7.4中,通過CREATE DOMAIN建立和使用定製類型變得很容易了。

數據庫自身的編程可以從使用函數上獲得巨大的利益。多數SQL系統允許用戶寫存儲過程,它是其他SQL語句可以調用的一塊SQL代碼。但是SQL自身仍舊不適合作為編程語言,而且SQL用戶在構造複雜邏輯時要經歷巨大的困難。更糟糕的是,SQL自身不支持很多的編程語言中最基本的操作,比如分支循環。每個廠商都轉而寫它們自己對SQL語言的擴展來增加這些特徵,而這種擴展不是必須跨越數據庫平台操作。

在PostgreSQL中程序員可以用一組可觀的支持語言中任何一種來寫這種邏輯。

  • 類似於Oracle的過程語言PL/SQL的叫做PgSQL[24]的內置語言,在處理查詢密集的過程時提供了獨特的優勢。
  • 流行腳本語言比如PerlPythonTclRuby的包裝器,允許利用它們在字符串處理和連接到廣闊的外部函數庫的力量。
  • 需要把複雜邏輯編譯到機器代碼所能提供的高性能的過程可以利用CC++
  • 在更加深奧的方面,R統計語言的處理器允許數據庫查詢利用它的一組豐富的統計函數。

程序員可以把代碼作為函數插入服務器中,它是使代碼類似於存儲過程的一個小包裝器。以這種方式SQL代碼可以調用(比如)C代碼或反之。

  • 性能增進,因為數據庫引擎在一個時間一個地方調用所有的邏輯,減少了在客戶和服務器之間的來回往返的次數。
  • 可靠性增進,因為數據驗證代碼集中到一個地方,就在服務器上,而不用依賴在多個客戶應用中的同步邏輯,它們甚至可能以多種編程語言寫成。
  • 通過向服務器增加有用的抽象,客戶代碼可以變得更短小和簡單。

這些優勢合起來可以證實PostgreSQL從編程角度是最高級的數據庫系統。使用PostgreSQL可以顯著的減少很多項目的整體編程時間,這種優勢隨着項目複雜而增長。

特徵

函數

通過函數,可以在數據庫服務器端執行指令程序。儘管這樣的指令程序可以使用基本的SQL語句寫成,但是由於其缺乏流程控制等功能,所以在PostgreSQL中引入了使用其它程序語言編寫函數的能力,包括:

  • 一個內置的名為pgSQL[25]的過程語言,類似於Oracle的PL/SQL
  • 包括PL/Perl[26],PL/PHP[27],PL/Python[28],PL/Ruby[29],PL/sh[30],PL/Tcl[31]與PL/Scheme[32]在內的腳本語言;
  • 編譯語言:CC++,或Java(通過PL/Java[33])。
  • R統計語言PL/R[34]

以上部分的語言,甚至可以在觸發器內執行。PostgreSQL支持行返回函數:它們的輸出是一系列行類型數據的集合,可以在查詢中當作表來使用。函數也可以被定義成以創建者或者調用者的身份運行。在某些場合,或者其他的數據庫產品中,函數也會被稱為「存儲過程」,但技術上這兩者並未有太大分別。

索引

在PostgreSQL中,用戶可以自定義索引方法,或使用內置的B樹哈希表GiST索引。PostgreSQL的索引功能同時也具有以下功能:

  • 反向索引檢索:無須額外的索引就能實現類似ORDER BY field DESC的操作。
  • 表達式索引:可以建立基於表達式值而非數值或列的索引。
  • 部分索引:僅索引表的部分,可以通過在CREATE INDEX語句口添加WHERE從句以創建更小的索引。
  • 位圖索引掃描:從8.1版開始支持此功能。該功能將讀取多個索引,生成表示它們之間符合查詢標準的多元組交集的位圖。這樣解決了混合索引的問題。在一個具有20列的表中,理論上能創建20! 個索引,在實際應用中並不實用。使用位圖索引掃描後,在每次查詢時,它將能把約束條件中所涉及列各自的索引進行任意的排列組合。

觸發器

觸發器是由SQL語句查詢所觸發的事件。如:一個INSERT語句可能觸發一個檢查數據完整性的觸發器。觸發器通常由INSERT或UPDATE語句觸發。

在PostgreSQL中,可在數據表上設置觸發器,但無法在視圖中設置(對視圖的UPDATE或者INSERT操作可以使用規則(RULE)定義)。多個觸發器可依據字母順序依次執行。此外,除了使用內嵌的PL/PgSQL語言之外,觸發器的函數也可以用PL/Perl,PL/Python等語言編寫。

多版本並發控制

PostgreSQL使用多版本並發控制(MVCC,Multiversion concurrency control)系統進行並發控制,該系統向每個用戶提供了一個數據庫的「快照」,用戶在事務內所作的每個修改,對於其他的用戶都不可見,直到該事務成功提交。這從很大程度上減少了對讀取鎖的依賴,同時保證了數據庫高效地符合ACID原則。

規則

規則(RULE)允許一個查詢能被重寫,通常用來實現對視圖(VIEW)的操作,如插入(INSERT)、更新(UPDATE)、刪除(DELETE)。

數據類型

PostgreSQL內置豐富的數據類型,包括:

此外,用戶可以創建自定義數據類型,通常通過PostgreSQL的GiST機制,它們也能被很好得索引,比如PostGIS地理信息系統的數據類型。

用戶定義對象

用戶可以為數據庫內幾乎所有的對象定義新的類型,包括:

繼承

數據表的結構及屬性可從一個「父」表中繼承,數據將在兩者間共享。對子表中數據的插入或者刪除也將在父表中呈現,同樣,對父表作出的修改,比如新增列等操作也會導致子表產生相應的變更。該功能尚未完全實現,實際上,表的約束尚不能繼承。比如,在一張外聯參考了父表id字段的表中,插入一條具有子表中某條記錄id數據的記錄會導致失敗,因為PostgreSQL在對父表的外鍵約束檢查中不會檢查子表的內容。

其他功能

資料庫管理及開發工具

  • phpPgAdmin[40]基於php語言寫的用於管理PostgreSQL數據庫的程序
  • PgAdmin[41]另外一個用於管理PostgreSQL數據庫的軟件

擴展

  • 地理數據對象:PostGIS GPL
  • 全文檢索:通過Tsearch2[42]GPL或OpenFTS,將在8.3版本中內嵌Tsearch2
  • 多種異步主/從複製方案,包括Slony-I[43](BSD授權),Mammoth Replicator[44]
  • XML/XSLT支持contrib軟件包中的XPath擴展[45]GPL
  • 機器學習:MADlib[46]ASF,由Apache基金會的支持的頂級開源項目;集成大量傳統數學分析統計、圖計算以及一些常見的機器學習的算法

知名客戶

版本

PostgreSQL - Red Hat Edition[51]是由Red Hat製作之分支版本,又稱Red Hat Database。

參考文獻

  1. ^ HAPPY BIRTHDAY, POSTGRESQL!. PostgreSQL Website. [2018-09-19]. (原始內容存檔於2018-07-30). 
  2. ^ 2.0 2.1 Out-of-cycle release scheduled for November 21, 2024. 2024年11月21日. 
  3. ^ 3.0 3.1 The PostgreSQL Global Development Group. Supported Platforms. PostgreSQL Documentation. [2018-09-19]. (原始內容存檔於2018-10-12). 
  4. ^ License. [2019-10-01]. (原始內容存檔於2019-09-05) (英語). 
  5. ^ FAQ: What is PostgreSQL? How is it pronounced? What is Postgres?. PostgreSQL Wiki. PostgreSQL community. [October 2, 2021]. 
  6. ^ 引用錯誤:沒有為名為Audio sample的參考文獻提供內容
  7. ^ 引用錯誤:沒有為名為intro-whatis的參考文獻提供內容
  8. ^ Parquet and Postgres in the Data Lake | Crunchy Data Blog. Crunchy Data. 2022-05-03 [2024-09-19] (英語). 
  9. ^ PostGIS. postgis.net. 2023-12-18 [2023-12-18]. PostGIS extends the capabilities of the PostgreSQL relational database by adding support for storing, indexing, and querying geospatial data. 
  10. ^ Temporal Extensions. PostgreSQL Wiki. 2023-12-18 [2023-12-18]. Postgres can be extended to become a Temporal Database. Such databases track the history of database content over time, automatically retaining said history and allowing it to be altered and queried. 
  11. ^ Orafce - Oracle's compatibility functions and packages. GitHub.com. 2023-12-17 [2023-12-18]. Functions and operators that emulate a subset of functions and packages from the Oracle RDBMS. 
  12. ^ pg_dbms_job. GitHub.com. 2023-11-08 [2023-12-18]. PostgreSQL extension to schedules and manages jobs in a job queue similar to Oracle DBMS_JOB package. 
  13. ^ WiltonDB. WiltonDB. 2023 [2023-12-18]. WiltonDB [is] packaged for Windows. It strives to be usable as a drop-in replacement to Microsoft SQL Server. 
  14. ^ Babelfish for PostgreSQL. babelfishpg.org. [2023-12-18]. Babelfish for PostgreSQL ... provides the capability for PostgreSQL to understand queries from applications written for Microsoft SQL Server. 
  15. ^ PostgreSQL Clients. wiki.postgresql.org. 2023-10-18 [2023-12-18]. This page is a partial list of interactive SQL clients (GUI or otherwise) ... that you can type SQL in to and get results from them. 
  16. ^ Design Tools. wiki.postgresql.org. 2023-10-23 [2023-12-18]. Tools to help with designing a schema, via creating Entity-Relationship diagrams and similar. Most are GUI. 
  17. ^ Community Guide to PostgreSQL GUI Tools. wiki.postgresql.org. 2023-12-01 [2023-12-18]. This page is a list of miscellaneous utilities that work with Postgres (ex: data loaders, comparators etc.). 
  18. ^ Replication, Clustering, and Connection Pooling. wiki.postgresql.org. 2020-07-13 [2023-12-18]. There are many approaches available to scale PostgreSQL beyond running on a single server. ... There is no one-size fits all... 
  19. ^ This is recognized by the liberal permission to use the PostgreSQL name, as approved (for fair use, when not confusing people about a legal relationship with the actual PostgreSQL project) when used in support of PostgreSQL, subject to the PostgreSQL Trademark Policy: Trademark Policy. PostgreSQL.org. 2020-12-08 [2023-12-17]. We will try to work with you to permit uses [of the PostgreSQL name] that support the PostgreSQL project and our Community. 
  20. ^ 引用錯誤:沒有為名為design的參考文獻提供內容
  21. ^ 引用錯誤:沒有為名為about/history的參考文獻提供內容
  22. ^ 引用錯誤:沒有為名為Project name的參考文獻提供內容
  23. ^ [1]頁面存檔備份,存於網際網路檔案館
  24. ^ PL/PgSQL頁面存檔備份,存於網際網路檔案館
  25. ^ PL/pgSQL頁面存檔備份,存於網際網路檔案館
  26. ^ PL/Perl頁面存檔備份,存於網際網路檔案館
  27. ^ PL/PHP
  28. ^ PL/Python頁面存檔備份,存於網際網路檔案館
  29. ^ PL/Ruby
  30. ^ PL/sh
  31. ^ PL/Tcl頁面存檔備份,存於網際網路檔案館
  32. ^ PL/Scheme
  33. ^ PL/Java
  34. ^ PL/R
  35. ^ [2]頁面存檔備份,存於網際網路檔案館
  36. ^ 不支持部分頁面存檔備份,存於網際網路檔案館
  37. ^ 未來版本的支持情況頁面存檔備份,存於網際網路檔案館
  38. ^ 已有版本手冊頁面存檔備份,存於網際網路檔案館
  39. ^ [3]頁面存檔備份,存於網際網路檔案館
  40. ^ phpPgAdmin頁面存檔備份,存於網際網路檔案館
  41. ^ PgAdmin頁面存檔備份,存於網際網路檔案館
  42. ^ Tsearch2頁面存檔備份,存於網際網路檔案館
  43. ^ Slony-I頁面存檔備份,存於網際網路檔案館
  44. ^ Mammoth Replicator
  45. ^ contrib軟件包中的XPath擴展
  46. ^ MADlib官网. [2023-11-13]. (原始內容存檔於2023-11-09). 
  47. ^ [4]頁面存檔備份,存於網際網路檔案館
  48. ^ [5]頁面存檔備份,存於網際網路檔案館
  49. ^ [6]頁面存檔備份,存於網際網路檔案館
  50. ^ [7]頁面存檔備份,存於網際網路檔案館
  51. ^ PostgreSQL - Red Hat Edition Project. [2010-06-24]. (原始內容存檔於2010-05-13). 

參閱

外部連結