數據集成是將不同來源與格式的數據邏輯上或物理上進行集成的過程。傳統上,數據集成可以分為兩大類方法,即數據倉庫和聯邦數據庫系統(英語:Federated database system)。數據庫倉庫技術在物理上將分布在多個數據源的數據統一集中到一個中央數據庫中;而聯邦數據庫則僅通過將用戶查詢翻譯為數據源查詢來進行邏輯上的數據集成。