原創|行業資訊|編輯:況魚杰|2020-06-24 13:52:17.327|閱讀 241 次
概述:Qlik-TDWI-AWS聯合網絡研討會名為“人工智能和分析的真相之源:優化數據湖管道以實現更快的業務洞察力”,是由TDWI高級分析研究副總裁Fern Halper和AWS合作伙伴解決方案架構師Dilip Rajan共同組織。該網絡研討會重點討論了托管數據湖創建對于AI和ML程序成功的重要性,并討論了構建高性能數據湖的關鍵考慮因素。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關鏈接:
很高興與大家共同提出一個有關許多組織的主題的話題,即如何更快地獲得人工智能(AI)和機器學習(ML)計劃的回報。各行各業的公司都在AI和ML功能方面進行了大量投資,但是在獲取及時可靠的見解方面繼續付出的努力卻是可信賴數據的單個版本的可用性,可以連續使用這些數據。
Qlik-TDWI-AWS聯合網絡研討會名為“人工智能和分析的真相之源:優化數據湖管道以實現更快的業務洞察力”,是由TDWI高級分析研究副總裁Fern Halper和AWS合作伙伴解決方案架構師Dilip Rajan共同組織。該網絡研討會重點討論了托管數據湖創建對于AI和ML程序成功的重要性,并討論了構建高性能數據湖的關鍵考慮因素。
該網絡研討會在多個地區得到廣泛觀察,產生了100多個問題。在下面回答最常見的五個最常見和/或最有趣的問題。
您能解釋一下數據倉庫和數據湖之間的區別嗎? 哪個更好?
幾乎每個討論中都會繼續提出這個問題。盡管數據倉庫和數據湖都用于存儲和管理數據,但這兩者是完全不同的體系結構方法。
數據倉庫是結構化的相關數據的存儲庫,在存儲時定義了數據使用的目的。數據倉庫通常充當組織的記錄系統,旨在支持高級商業智能(BI)和報告計劃。 數據倉庫通常不是設計用來處理原始,半結構化或非結構化數據的重要來源,這些數據可供分析使用。
另一方面,數據湖存儲大量的所有數據-結構化,半結構化或非結構化。沒有數據被拒絕。數據是從源系統加載的,主要是原始格式,在存儲時沒有定義的目的,這使得數據湖非常適合數據探索/實驗,AI,ML和數據科學計劃。請參閱下表,以了解數據湖和數據倉庫之間的更多區別。
盡管數據倉庫和數據湖對于企業數據管理都至關重要,但它們各自都有自己的優勢和局限性。然后開始看到Data Lakehouse概念的出現,其中Data Warehouse和Data Lake平臺將其功能融合在一起,目的是提供更加統一的架構,為所有分析計劃提供單一的事實來源,包括 BI,流分析,機器學習和數據科學。
具有多種數據架構的公司如何在云環境中合理化和現代化其環境? 我們有一個傳統的本地數據倉庫和一個基于云的數據湖。
Qlik 的客戶正在建立更小,更專注于主題領域的云數據倉庫。還可以看到客戶利用其云數據湖作為預階段提取階段,將原始數據降落到數據湖中,然后將這些數據的子集提取到云數據倉庫中。沒有一種方法適合每種組織或業務場景,這就是為什么Qlik Data Integration旨在在所有主要云平臺上隨著客戶需求的發展跨多種架構構建支持客戶的原因。
我們有許多系統,它們以多種不一致的格式存儲數據。 我們如何使用您的功能使中央系統中的各個系統的數據保持一致? 另外,您如何支持典型的ELT操作(例如匹配/合并等)? 這需要自定義編碼嗎?
Qlik Data Integration自動執行數據標準化,原始更改數據文件的格式和合并,以創建數據的完整歷史記錄,而無需自定義編碼。該解決方案還允許您通過簡單,用戶友好的基于Web的控制臺將數據源中的數據管道自動化到您選擇的目標系統。 無需手動腳本。
將信息遷移到一個平臺平均需要多長時間?您的解決方案需要多少費用?您能否提及一些客戶以及他們如何從您的解決方案中受益?
Qlik Data Integration解決方案的變更數據捕獲和復制組件可以在不到一個小時的時間內建立和配置并移動數據。將數據從特定源遷移到目標端點所花費的時間取決于要移動的數據量。定價根據客戶的特定需求而有所不同,例如客戶希望從中復制數據的源數量,源系統的CPU內核以及目標端點的數量。
Qlik Data Integration在全球近2500家客戶中使用,近一半的《財富》 100強公司使用該平臺來優化其數據管道。Qlik 的客戶報告了許多好處,包括降低了計算成本,縮短了部署時間表,降低了構建成本并加快了決策速度。實際上,全球最大的投資管理公司之一Vanguard在2019年的AWS re:Invent上公開分享了它如何利用Qlik解決方案將大型機交易復制到AWS云中,延遲為一到兩秒,從而支持超過每小時更新6000萬行。另一個客戶Ferguson是美國最大的管道和HVAC設備供應商之一,該公司報告說,能夠使用Qlik解決方案在短短六個月內遷移27個數據庫的功能,而以前該解決方案過去只花了兩年時間才遷移了兩個。
在預算有限且資源很少的環境中,如何啟動數據湖?
從存儲和計算的角度來看,云是一個很好的起點,因為它為您提供了購買所需資源的靈活性。Qlik Data Integration支持所有主要的云平臺提供商,包括AWS,Microsoft Azure,Google Cloud Platform以及Cloudera和Databricks,使您能夠完全靈活地選擇自己選擇的合作伙伴。此外,Qlik 完全自動化了將近實時數據更改結合在一起所需的ELT代碼生成過程,從而從基于Hadoop的數據湖實施中的編碼任務中釋放了昂貴而稀缺的數據工程和編程資源。還可以自動化數據管道設置,配置和管理的整個過程,因此您的資源可以專注于更高價值的分析任務。
關于Qlik
Qlik 一直重視數據的作用。Qlik 提供端到端、實時數據集成和分析解決方案,幫助組織訪問所有數據并將其轉換為價值。幫助公司以數據為導向,更深入地了解客戶行為,重新設計業務流程,發現新的收入來源,并平衡風險和回報。
今年4月,Qlik 發布了新的包裝和使用項目,為客戶提供更多的選擇,并使云平臺上的分析技術變得更簡單、更容易也更符合成本效益。新的程序包括支持 SaaS 和 Client-Managed 選項的 QlikSense Enterprise 軟件包,以及為 QlikView 客戶提供的 Qlik Sense Enterprise SaaS 直接途徑,使其能夠在云中托管 QlikView 文檔。
Qlik數據分析與管理平臺
LEAD WITH DATA
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn