原創|行業資訊|編輯:陳俊吉|2016-09-19 10:08:22.000|閱讀 1071 次
概述:隨著數據量日益劇增,企業決策比以往更需要具備強大的信息管理和掌控能力來協助解決關鍵問題。若要提升企業競爭優勢,必須隨時掌握企業內的信息,并透過這些“可信賴”信息獲得新的企業價值。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關鏈接:
1.信息質量與你的業務息息相關
隨著數據量日益劇增,企業決策比以往更需要具備強大的和掌控能力來協助解決關鍵問題。若要提升企業競爭優勢,必須隨時掌握企業內的信息,并透過這些“可信賴”信息獲得新的企業價值。在現實世界中,很多用戶使用數據時都難以取到可信賴信息,給業務運營和決策帶來高風險。常常讓客戶頭痛的數據質量的問題呈現多樣化、復雜化和時效化等多種因素交織、組合在一起,使得工作推進和項目實施變得相當艱難,問題主要涉及到以下方面:
根據業界權威機構(TDWI,Gartner)的調查核實,用戶存在的數據質量問題的狀況按種類分布如下:
由于信息質量問題而造成的損失,使用戶因此付出相當之大的代價:
怎樣才能解決信息質量問題呢? IBM根據在全球各行各業客戶的相關項目實施經驗,提出了要擺脫傳統的分析方法,主張組織或機構必須停止僅通過IT手段來解決數據質量問題。當今,業界中很多富有經驗的 CIO就如何有效地解決信息質量問題,找到了高效的方法,其底線如下:
2.IBM解決方案
評估信息資產,首要任務是分析現有企業數據來源,以理解可用信息的結構、內容和質量。用戶查看描述數據的現有文檔可能已經過時,且需要驗證以確保數據的準確性、一致性和完整性。為此,IBM提供基于 InfoSphere Information Analyzer(以下簡稱 IA)分析軟件工具的信息質量解決方案,幫助用戶了解在給定時間點的數據內容、結構和總體質量,該解決方案提供了用于分析數據源和規則的分析方法的深入見解。
IA 對多個企業儲存庫中的源數據進行概要和分析,它包括一個業務驅動數據規則定義方法,可以進行集成數據規則分析,來評估和監控信息資產。IA 可以在一個包含 IBM 和非 IBM 信息源的異構 IT 環境中工作。它還可以在異構信息源中及跨異構信息源創建珍貴元數據,作為數據概要流程的一部分,識別新數據目標,以及支持深度分析。評估可以跨整個企業信息生態系統:各種數據庫、文件和企業應用。沒有 IA,這個流程將需要手動完成,耗時,且容易出錯。
通過IBM解決方案,實現了信息按分析功能進行組織,向您提供深入的知識和最佳實踐,用于:
數據分析,包括:
數據質量分析和監視,包括:
IA數據發現和分析工具,是基于Web的架構方式,對數據倉庫的源系統數據分析和數據倉庫的表屬性級分析,表級分析和關聯分析,并可使用規則來定義和分析數據的分布和相關性。IA工具的架構如下:
IA 提供的主要功能說明如下:
- 分析和記錄下列屬性;
- 各個值或基數的數量;
- 空值、“null”值、和非“null”或非空值的數量;
- 最小、最大、和平均數值;
- 基本數據類型,包括不同的日期—時間格式;
- 最小、最大、和平均長度;
- 數值的精度和范圍。
主鍵分析針對一個或多個表識別所有候選鍵,幫助您測試一個列或 列組合,以確定是否存在成為主鍵的候選。
外鍵分析檢查表之間的內容和關系,有助于識別外鍵、檢查其完整 性、并檢查主鍵和外鍵之間的參照完整性。
交叉值域分析檢查表之間的內容和關系,以確定列之間值的交疊,以及表內或表間數據的任何冗余(參照上圖)
通過基線分析,將來自先前列分析的數據(基線)和新的、當前的列分析進行比較,尋找變化。
創建邏輯規則進行數據驗證,驗證規則分析可以延伸數據源或跨數據源的評估,以定義數據之間的關系。允許以多種方式表達驗證規則。它還可以檢查了解數據是否符合某些限制:
包含:一個字段是否包含一個字符串,或符合某個包含某些字符串的表達式。
相等:一個字段是否與某些值相等。
存在:一個源是否擁有任何數據。
模式:源數據中的值是否與一個模式字符串匹配。
出現:一個源表中某些值出現的次數。
范圍:源數據的范圍。范圍可以包含最小值、最大值,或二者皆有。
參照列:源數據對參照列的參照完整性。
參照清單:數據是否符合一個允許值的參照清單。
類型:源數據是否能夠從字符轉換為數字或日期。
唯一性:源數據是否含有重復值。某些字段(如賬號)必須為唯一。
這些規則可以與邏輯操作符結合,從一個或多個表中(其中,多個列擁有多種特征)找到行。您還可以將這些規則與邏輯操作符結合,進行復雜條件評估,并指出雖然自身并沒有出現問題,但是不符合更廣泛的限制或業務條件的數據,隨時間發展以提供有關數據質量趨勢的追蹤分析。
提供全面分析報告,通過使用圖形顯示和打印報表理解源數據質量狀況。
3.業務用例
4.給用戶帶來變化
分析數據的自動化流程管理,無需要手工進行處理。相對手工分析而言,減少 50+%分析數據的工作量,提高生產效率,加快數據整合速度;
5.成功實施參考案例
項目背景:
20xx年,某零售巨頭多年來第一次發生虧損。該企業通過一系列的研究與自我反思,認為其主要是由以下幾方面原因引起的。
項目挑戰:
解決方案:
Information Analyzer是IBM推出的一款數據質量分析工具。它能幫助客戶方便快捷地全面理解企業數據。它提供了數據質量評估,數據質量監控以及可定制的數據規則設計和分析功能。這些強大的能力能讓客戶輕易的掌控整個企業的雜亂數據,并極大地加速企業的信息整合工程。因此本產品可以很好地滿足該企業的需求并加速實現其轉型目標。
在IBM為該企業制定的全套解決方案中,Information Analyzer主要應用于以下3個關鍵階段:
全面分析理解該企業各個數據庫系統的數據質量,找出異常數據,為隨后的數據清洗、轉換、整合提供有力的支持。
通過對清洗過的歷史數據進行高效的比對,找出數據變化趨勢,分析客戶行為,從而及時調整相應的推銷策略。
自動按需審計各個接口的數據質量,從而保證最低的臟數據率和最高的數據兼容性。
部署架構:
方案收益:
通過列分析、主/外鍵分析、域交叉分析等手段自動分析您的數據,快速完成整體分析并生成數據的結構、內容和質量報告。
詳情請咨詢!
客服熱線:023-66090381
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn