轉(zhuǎn)帖|行業(yè)資訊|編輯:陳俊吉|2016-06-27 09:47:35.000|閱讀 310 次
概述:Watson Analytics是IBM基于Watson認(rèn)知技術(shù)構(gòu)建的一個創(chuàng)新云分析平臺,它為用戶提供了一系列自助式的分析服務(wù),包括數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)探索、預(yù)測、構(gòu)建分析儀表盤等。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關(guān)鏈接:
是IBM基于Watson認(rèn)知技術(shù)構(gòu)建的一個創(chuàng)新云分析平臺,它為用戶提供了一系列自助式的分析服務(wù),包括數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)探索、預(yù)測、構(gòu)建分析儀表盤等。Watson Analytics的一項重要特點是簡單易用的基于自然語言的自助式分析,使得“人人都能做分析“,即便是不懂IT的人士。在體驗這項服務(wù)時,用戶只需要上傳數(shù)據(jù),點擊“探索Explore”,Watson Analytics就會分析數(shù)據(jù),用自然語言列舉出用戶可能感興趣的一系列問題。點擊其中的問題,Watson Analytics會針對該問題,展現(xiàn)出精美的圖表,和用戶進行交互式的分析。然后,用戶可以利用“預(yù)測Predict”功能進一步做深入分析,或者通過“組合Assemble”功能,組合一系列的分析圖表進行綜合分析。
最近,筆者試用了一下服務(wù),雖然目前Watson Analytics的自然語言部分還不支持中文,但Watson Analytics易用、直觀的啟發(fā)式自助分析服務(wù),還是給人留下非常深刻的印象。下面就讓我們一起體驗一下吧。
數(shù)據(jù)準(zhǔn)備
根據(jù)社區(qū)的一篇教程,筆者使用的數(shù)據(jù)是下載自 www.happyplanetindex.org 的各國的幸福指數(shù)數(shù)據(jù)(不代表官方數(shù)據(jù),這里純粹作為學(xué)習(xí)使用。)目前網(wǎng)站的數(shù)據(jù)時間大約是2010-2012年的,很多數(shù)據(jù)是根據(jù)蓋洛普Gallup等咨詢公司的問卷調(diào)查統(tǒng)計得到的。
數(shù)據(jù)是一個簡單的Excel表格,共11個字段,字段描述如上圖,數(shù)據(jù)中包括各個國家的HPI(Happy Planet Index)幸福指數(shù)和排名,以及一些相關(guān)數(shù)據(jù)例如人均GDP,人口,生活水平期望指數(shù),生態(tài)足跡(Footprint gha/capita這個指標(biāo)八卦幾句,指標(biāo)評估人均對生態(tài)的影響,是個有趣的指標(biāo),有興趣的同學(xué)可以在網(wǎng)站計算自己的生態(tài)足跡。)
數(shù)據(jù)分析
數(shù)據(jù)準(zhǔn)備好了,讓我們開始分析吧!分析前需要在上注冊一個免費的試用賬號,//watson.analytics.ibmcloud.com/。注冊登錄后,進到歡迎頁面,點擊Add,然后選擇Desktop,選擇你的Excel數(shù)據(jù)文件,選擇Upload,頁面顯示Transfer,完成后數(shù)據(jù)就緒了。
下面點擊Explore開始分析。什么?還沒有建模,還沒有設(shè)計報表格式?對不起,在Watson Analytics上真的不需要。更驚喜的是,點擊Explore后,Watson Analytics會分析Excel數(shù)據(jù),并且通過自然語言處理,生成一系列你可能感興趣的問題(英文顯示,這里翻譯成中文易于理解),例如:
讓我們首先點擊第一個問題:各個國家的幸福年份數(shù)是多少?(What are the values of Happy Life Years by Country?) Watson Analytics 會自動識別我們數(shù)據(jù)中包含國家數(shù)據(jù),通過世界地圖展示 :
其中,顏色越深的部分代表這個國家幸福的年份越久。好吧,這項數(shù)據(jù)顯然老牌發(fā)達國家占優(yōu)勢。那么撇開歷史,活在當(dāng)下的話,哪些國家更幸福?
點擊圖中的分析指標(biāo)”Happy Life Years”,從下拉菜單中將指標(biāo)替換“Happy Planet Index”,圖形發(fā)生了變化,現(xiàn)在顯示的是當(dāng)下的各個國家的幸福指數(shù):
嗯,顯然金磚四國為首的發(fā)展中國家當(dāng)下更幸福。
下面我們想找出那些對幸福生活標(biāo)準(zhǔn)期望高而且現(xiàn)實也確實生活幸福(夢想成真)的國家,回到開始的界面,點擊另一個問題:哪些國家的幸福生活期望指數(shù)和幸福指數(shù)都比較高?(Which countries have high measurements for life expectancy and well-being?) 我們得到了下圖:
這里縱軸代表幸福感(Well-being),橫軸代表對幸福生活的期望(Life Expectancy),因此越靠近右上角的國家在兩個指標(biāo)上都越高,越接近夢想成真了。這里有丹麥(Denmark),加拿大(Canada),哥斯達黎加(Costa Rica)…
慢著,為什么氣泡有大有小?原來圖里還有一個玄機,這里氣泡大小代表了另一個指標(biāo):生態(tài)足跡(Footprint),氣泡越大代表人均生態(tài)足跡越高,即對環(huán)境影響越大。光幸福還不夠,幸福不能以破壞自然環(huán)境為代價,保持可持續(xù)發(fā)展,才能持續(xù)幸福。比較一下右上限的氣泡大小,我們發(fā)現(xiàn)哥斯達黎加實在是人類楷模,不僅幸福指數(shù)高,而且那個氣泡比起丹麥,加拿大小了幾圈呢,說明人家對生態(tài)環(huán)境的影響還要小,給個大拇指吧!
說到幸福感(Well-being),腦中不由浮起了那首歌“幸福在哪里?”,那么幸福感和哪些因素有關(guān)呢?是財富嗎?讓我們點開這個問題:幸福指數(shù)和人均GDP關(guān)系大嗎?(What is the relationship between Well-being and GDP/capita by Country?),出現(xiàn)了下圖:
這里縱軸代表人均GDP,越靠上越高,橫軸代表幸福感(Well-being),越靠右越幸福。先看看右上角,丹麥,芬蘭,奧地利,比利時,還有加拿大,澳大利亞,這些國家不但富有而且幸福指數(shù)高。那么難道真的沒錢就沒幸福,還不給人窮著樂了?請看回右下角,哥斯達黎加,巴西,阿根廷這些國家,雖說人均GDP只有15K左右,離右上角那些國家的40K人均GDP差了一倍多,但是幸福指數(shù)卻差距不大。看來幸福指數(shù)并不由人均GDP決定,錢確實不是萬能的。
那么到底什么才是幸福感的主要因素呢?
這里我們就需要用到中的預(yù)測(Predict)功能了,回憶一下我們的數(shù)據(jù),在Excel的每一行數(shù)據(jù)中都含有幸福指數(shù),以及相關(guān)的人均GDP,人口數(shù)量,人均生態(tài)足跡等數(shù)據(jù),我們可以建立一個預(yù)測模型,看看哪些相關(guān)變量對幸福指數(shù)影響最大。點擊預(yù)測(Predict)功能,把上述指標(biāo)放進要預(yù)測的列表,然后開始預(yù)測,我們得到下圖:
這張圖對關(guān)聯(lián)指標(biāo)進行了各種組合(縱軸的Sub Region),并分析了它們對幸福指數(shù)(橫軸)的影響。我們發(fā)現(xiàn)第一組指標(biāo)對幸福感的影響是最強的。那么第一組中都有哪些因素?我們點擊最上面的橫條,具體來分析它:
在這張圖中,我們有了答案。圖中的標(biāo)題顯示,原來對幸福指數(shù)貢獻最大的是生態(tài)足跡(Footprint)和幸福的年數(shù)(Happy Life Years),可信度是81%。圖中橫軸是生態(tài)足跡(Footprint),縱軸是幸福的年數(shù)(Happy Life Years),顏色越深代表幸福指數(shù)越高。對比這兩個指標(biāo),又以縱軸幸福的年數(shù)(Happy Life Years)影響更大,就是說幸福的年數(shù)越多,則繼續(xù)幸福的可能性越大。為什么?難道幸福是可以遺傳的?非也,筆者的結(jié)論是只有每一代人都努力減少生態(tài)足跡,減少對環(huán)境的破壞,保持長期可持續(xù)發(fā)展,才能造福子孫后代,世代幸福。你贊同嗎?
如果對這個結(jié)論背后的算法感興趣,可以切換一下視圖,下圖中Watson Analytics會告訴你它用的算法,由于我們需要分析的幸福指數(shù)是一個連續(xù)變量,Watson Analytics自動使用了線性回歸(Liner Regression)算法,建立了一個多階方程式來計算相關(guān)變量如人均GDP,生態(tài)足跡等因素與幸福指數(shù)之間的關(guān)系,并選擇了其中關(guān)聯(lián)性最緊密的組合。當(dāng)然,這都是圖形背后的故事,Watson Analytics的強大之處在于分析人員根本不需要關(guān)注復(fù)雜的模型和算法,一切都已經(jīng)自動化,用戶需要關(guān)注的只是分析結(jié)果和它的含義。
怎么樣?通過本次對分析服務(wù)的體驗,是不是對分析過程的易用性和基于自然語言的智能化引導(dǎo)印象深刻?通過Watson Analytics,只要有數(shù)據(jù),點點按鈕,每個人都可以進行數(shù)據(jù)分析,而且并不需要關(guān)注高深的模型和算法。實際上,“看圖講故事”,透過精致的圖表,分析后面的業(yè)務(wù)含義,才是分析員真正的關(guān)注點,這不正是分析師們期待已久的下一代自助式分析嗎?
另外,本次體驗只使用了Watson Analytics基本的數(shù)據(jù)探索(Explore)和預(yù)測(Predict)服務(wù),可以說只使用了Watson Analytics豐富服務(wù)的冰山一角。Watson Analytics上還提供了對數(shù)據(jù)的加工(Refine)服務(wù),對各種分析結(jié)果進行綜合的組合(Assemble)服務(wù),甚至可以讓W(xué)atson根據(jù)分析結(jié)果生成令人信服的故事。Watson Analytics還可以結(jié)合IBM Bluemix公有云上的服務(wù)一起使用,例如使用Bluemix的DashDB存儲更復(fù)雜更大量的數(shù)據(jù)源進行分析;進行社交數(shù)據(jù)、天氣數(shù)據(jù)、物聯(lián)網(wǎng)數(shù)據(jù)的分析等。目前,各行業(yè)的分析人員正在使用Watson Analytics構(gòu)建自己的創(chuàng)新分析應(yīng)用。在Watson Analytics的社區(qū)中,有些有趣的案例令人腦洞打開,例如用到Watson Analytics來挑選球員,構(gòu)建自己攻守兼?zhèn)涞淖罴殃囆?/community.watsonanalytics.com/dream-el-salvador-soccer-team/;
另一個案例則分析讀個本科學(xué)歷對個人工作收入、工作時間的影響:
//community.watsonanalytics.com/what-will-a-graduate-degree-give-me-exploring-the-american-time-use-survey-data-set/
筆者還有同事上傳自己的每月開銷來進行分析
有了數(shù)據(jù),有了,分析如此簡單,人人都能成為數(shù)據(jù)分析師。不多說了,祝您圣誕快樂,一起為中國的幸福指數(shù)加分吧!
via:華南IBM大數(shù)據(jù)支持團隊
詳情請咨詢“”!
客服熱線:023-66090381
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請郵件反饋至chenjj@fc6vip.cn