根據Informix數據倉庫系統實施方法學,我們可以將數據倉庫的實施分為以下幾個步驟:
1.業務需求分析
業務需求分析是數據倉庫建設的基礎,應該同用戶進行充分溝通,了解用戶的真實需求,避免理解的誤差,同時,應該界定好項目開發范圍,
Informix數據倉庫處理辦法
。在此階段,主要工作包括:
(1)設定可以達到的目標并明確所有需求
(2)確定系統體系結構
從實施的角度來看,設計數據倉庫系統體系結構有多種方式:
構造部門級的數據集市DataMart
直接構造企業級的數據倉庫DataWarehouse系統
先建立部門級數據集市,然后發展成企業級數據倉庫系統
(3)確定數據源
列出向數據倉庫提供數據的數據源清單。源數據的復雜性、規模、完整性對建立數據倉庫的影響比其它因素要大。要格外注意哪些數據源的數據類型、粒度和內容是兼容的。
(4)容量規劃
除了體系結構之外,硬件和軟件資源對數據倉庫也至關重要。作為需求定義的一部分,估計數據倉庫將要存儲的數據量以及將對數據進行的處理很重要。
(5)技術評價
在選擇軟件和硬件平臺時,最好聽取專家的建議,尤其是對與您相似的環境有經驗的專家。InformixDecisionFrontier數據倉庫實現套件,為用戶提供了快速、集成、完整的數據倉庫實現工具。
2.邏輯模型設計
邏輯模型設計主要是指數據倉庫數據的邏輯表現形式。從最終應用的功能和性能的角度來看,數據倉庫的數據模型也許是整個項目最重要的方面。為數據倉庫和數據集市定義數據模型是一項復雜的工作,需要領域專家的參與。
3.物理模型設計
在進行物理模型設計時,主要是將數據倉庫的邏輯模型轉換為在數據庫中的物理表結構。在物理模型設計時,可以采用ERWin等輔助設計工具。
Informix采用ROLAP方式,數據倉庫數據的存儲主要采用InformixIDS(InformixDynamicServer)數據庫。InformixIDS數據庫是業界領先的數據庫引擎,它具有并發性、可伸縮性、多進程/多線索等特性,是Informix數據倉庫應用的核心,
電腦資料
《Informix數據倉庫處理辦法》(http://salifelink.com)。4.數據抽取、清洗、集成、裝載等
數據抽取是數據倉庫建立中的一個非常重要的步驟。它負責將分布在用戶業務系統中的數據進行抽取、清洗、集成。
(1)定義數據載入和維護策略
(2)數據抽取/清洗/轉換/裝載
Informix提供了一系列工具訪問存儲在異構數據庫中的業務系統數據。Informix還提供了數據復制產品,這樣,系統會通過同步或異步方式自動將符合規則的數據定時進行傳遞,保證數據的完整性、一致性。
用戶利用Informix的InfoMover可以輕松定義數據抽取、清洗、集成、裝載過程,并可以對該過程進行定期調度,減輕數據增量裝載的復雜度。同時,Informix數據裝載策略支持第三方廠家豐富的工具,如Prism、Carleton、ETI等。
5.數據倉庫的管理
數據倉庫元數據的管理也是極為重要的環節。Informix的MetacubeWarehouseManager提供GUI,用戶只須使用鼠標托拽方式即可對元數據進行管理。
6.數據的分析、報表、查詢等數據的表現
用戶分析、報表、查詢工具是用戶進行分析決策使用的工具。因此,其所有操作要非常簡單,但提供的功能卻要十分強大。Informix相應地提供了一套完善的工具。
此外,數據挖掘技術也是數據倉庫系統中一個重要部分。Informix提供RedBrickDataMine以及第三方廠商產品,支持數據挖掘應用。
7.數據倉庫性能優化及發布
數據倉庫性能的好壞直接影響系統查詢、分析響應速度。Informix提供MetaCube等工具支持匯總查詢、抽樣查詢和后臺查詢,以提高數據倉庫查詢效率。
總之,Informix為用戶數據倉庫應用提供了一個快速、完整的解決方案。采用Informix數據倉庫解決方案可以使您的數據倉庫系統具有高性能、高可擴展性,高開放性,可以自己進行定制等特性,同時,Informix還提供專業數據倉庫咨詢服務,這將充分保證您的數據倉庫系統建設快速、及時,保證它能真正發揮作用。