原創|實施案例|編輯:況魚杰|2020-06-02 10:53:40.377|閱讀 233 次
概述:GoDaddy 是一家國際網絡托管和 Internet 域注冊機構,本文將會介紹GoDaddy 使用 Tableau 針對每天 13 TB 的數據擴展大數據管理的故事。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關鏈接:
公司介紹
GoDaddy 是一家國際網絡托管和 Internet 域注冊機構,每天為 1,700 萬客戶提供服務,收集 13 TB 的數據,并在 Hadoop 中進行存儲和管理。現在,借助 Tableau 和 Alation,其企業數據團隊加強了對數據準確性的控制,確保業務部門訪問的組織化數據源已通過 GoDaddy 數據管理員認證。如今,分析師只需花費較少時間就能搜索到準確數據,從而擁有較多時間進行分析。因此,憑借數據驅動型決策,團隊能夠持續推動產品開發,提供更好的客戶體驗。
幫助 1400+ 名 Tableau 用戶獲得規模化的大數據管理自助式功能
GoDaddy 有數百個數據源,分布在數十個平臺之上,而且擁有超過 1400 位 Tableau 用戶,因此該團隊需要采用一種更好的方式來確保組織能夠使用受信任的安全數據。
“我們有許多重復數據。一些計算字段沒有得到記錄。”Sharon Graves 回憶道。她是 GoDaddy 的企業數據拓展專員兼 Tableau Server 管理員。“從商業智能的角度來看,我們并不能確信地說‘行了,這正是我制作報告所需的數據。’”
為了實現大規模自助式服務,除了 Tableau 外,GoDaddy 的企業數據團隊還采用了 Alation 數據目錄,列出所有數據源并提供基于使用情況的業務上下文。
在數據管控方面,Alation 堪稱 Tableau 方法的有益補充,它可讓最終用戶輕松發現來自多個源的數據,并深入了解數據的細微差別。Alation 通過對以下內容進行抓取和編目,以獨特的自動化方式實現上述目的:組織數據、數據相關的業務語義,以及組織分析歷史記錄中嵌入的分析邏輯(通過 SQL 查詢日志捕獲)。
Tableau 和 Alation 的聯合解決方案優于 GoDaddy 之前使用的 Hadoop 解決方案,后者包括 Apache Pig(用于處理和分析大型數據集的腳本平臺)、Apache Spark(群集計算框架)和 Apache Hive。
借助這個新的數據平臺,GoDaddy 的多個手動進程均已實現自動化,其中包括創建自動通知,確保數據正常加載。此外,還會在處理過程中統一應用業務規則。
實際上,改進遠不止這些。 Sharon 表示:“Alation 中的機器學習技術會在 GoDaddy 服務器上掃描查詢日志文件并分析數據,自動捕獲大部分元數據。”
數據管理員結合使用 Tableau 和 Alation 來整理 Alation 數據目錄中自動清點的數據。 使用 Alation 的整理功能,管理員可以確認自動建議的業務語義,捕獲數據的上下文。出于其他合規性考慮,他們可以使用標簽來標記含有 PII 數據的數據集或需要通過數據使用策略進行管理的數據集。他們還可以認可或棄用數據源,確保公司所用數據的準確性,并在分析師和高級用戶構建分析時提供指導。
“通過組建企業數據團隊并應用這些產品,為 GoDaddy 的所有數據提供了一個集中的分析處理場所。”Sharon 解釋說,“這有助于我們強化規則和管理,極大地改善了最終用戶體驗。”
為 1700 多萬客戶提供優化的產品體驗
GoDaddy 的企業數據團隊每天需要處理 13 TB 的數據:網站流量指標、客戶購買歷史記錄、內部統計數據等等。Sharon 回憶說,在使用新解決方案之前,這些流程非常復雜,GoDaddy 分析師訪問數據時速度緩慢,讓人感到非常困惑和沮喪。
“有些高級用戶可能不太熟悉數據,不知道在哪里可以找到適合其分析的數據,或者雖然知道數據所在位置,但不知道如何使用這些數據來滿足自己的需求。”Sharon 說。
這一新平臺標志著 GoDaddy 向自助式分析的轉變。Sharon 表示:“通過創建自助式環境,GoDaddy 產品經理和業務用戶可以利用數據實現更好的客戶體驗,并且可以通過識別趨勢和預見問題,找到并設計滿足客戶需求的產品。”
由于用戶可以輕松找到自己需要分析的數據,因此搜索數據耗費的時間大大減少,他們有了更多的時間用于改進流程,從而為其 1700 萬客戶提供更好的產品體驗。
使用 Tableau 儀表板,產品經理和職能團隊可識別趨勢,并發現潛在問題,從而避免這些問題發生。借助觸手可及的數據,他們可以深入了解網站趨勢和電子郵件宣傳活動,優化產品開發。
“最終用戶獲得數據后,便能快速整合自己的基礎報告。”Sharon 解釋道,“如果發現有顧客在特定環節退出流程,我們可以重新審視該流程,看看是否有更好的方法。最終用戶是產品和應用程序變化的最直接感受者,他們可以快速發現可能需要調整的地方。”
通過更好的數據管控減少代價高昂的錯誤
在過去,若要生成分析師報告,需要從 SQL 中拉取數據,將其放入電子表格,然后通過電子郵件發送結果,因此企業數據團隊幾乎不了解數據的使用情況。錯誤難以追查,消除錯誤更是難上加難。
現在,GoDaddy 數據管理員使用 Alation 掃描數千個 Tableau 工作簿,并顯示最頻繁訪問每個數據源的用戶。掌握這些信息后,分析團隊和業務團隊可以更好地了解整個公司的數據使用情況,并且知道需要向誰尋求幫助,以獲取進一步見解。這有助于減少大規模、代價高昂的錯誤。
Sharon 指出:“借助 Alation 和 Tableau,GoDaddy 的企業數據團隊能夠檢查表格的沿襲情況,搜索多個數據源以查找某個字段,提高可見性和控制力。”
只需點擊幾下,即可查看 Tableau Server 中各種數據源的使用量,了解哪些用戶將數據用在了哪些地方,并且可以搜索數百個數據源以查找特定字段。
與此同時可以撥打慧都熱線023-68661681或咨詢慧都在線客服,我們將幫您轉接BI專業團隊,并發送相關資料給您!
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn