原創(chuàng)|行業(yè)資訊|編輯:陳俊吉|2016-07-11 09:54:17.000|閱讀 1069 次
概述:IBM BigInsights 是實(shí)現(xiàn)IBM大數(shù)據(jù)戰(zhàn)略的重要旗艦產(chǎn)品,下文將介紹剛發(fā)布的4.1版本所包含的功能和組件。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關(guān)鏈接:
是實(shí)現(xiàn)IBM大數(shù)據(jù)戰(zhàn)略的重要旗艦產(chǎn)品,下文將介紹剛發(fā)布的4.1版本所包含的功能和組件。
由兩個部分組成,分為開源部分和IBM增值部分,由此組合成5個不同的軟件包提供給市場需求不同的客戶使用。
在上圖中藍(lán)線之下的部分是IBM Open Platform with Apache Hadoop 版本,它包含了由Apache Hadoop社區(qū)發(fā)布的最新模塊。剛發(fā)布的版本包含了以下的內(nèi)容:
用戶可以很方便地使用Apache Ambari 2.1來安裝部署IBM Open Platform with Apache Hadoop 4.1,服務(wù)也可選擇Apache社區(qū)支持(免費(fèi))或購買IBM原廠服務(wù)。
新版本可以運(yùn)行的硬件和操作系統(tǒng)平臺更多了:
Red Hat Enterprise Linux 7
Red Hat Enterprise Linux 6
Red Hat Enterprise Linux 7
當(dāng)然,對于將Hadoop引入到企業(yè),IBM不僅只用到開源部分,沒有金剛鉆,不攬瓷器活!以下內(nèi)容介紹IBM 對Hadoop 增值部分
金剛鉆之一 : BigSheets
企業(yè)內(nèi)分析數(shù)據(jù)最常使用的工具其實(shí)是電子表格,來到大數(shù)據(jù)時代,怎能輕易放棄這么好用的工具?IBM提供BigSheets可以輕易將存在Hadoop里面的數(shù)據(jù)進(jìn)行可視化展現(xiàn),使用習(xí)慣也是類似電子表格方式,過濾行?透視表?合并不同表格列?然后選擇圖形展現(xiàn):柱狀圖?餅圖?熱點(diǎn)圖?地理圖?輕松搞定!它自動變成了MR跑出結(jié)果!
BigSheets表格處理功能
餅狀圖
標(biāo)記云圖
地理信息集成圖
金剛鉆之二:BigSQL
企業(yè)傳統(tǒng)上使用SQL語言訪問數(shù)據(jù)倉庫得到分析結(jié)果,在企業(yè)引入Hadoop架構(gòu)變成了分布式存儲,并且成為潮流時,IBM也順勢將其企業(yè)級MPP的DB2數(shù)據(jù)庫引擎移植到了Hadoop平臺上,這個SQL查詢優(yōu)化器引擎在國內(nèi)外可是久經(jīng)考驗(yàn),出色性能得到公認(rèn),目前是開源社區(qū)技術(shù)拍馬也難追的,沒有幾十年技術(shù)沉淀是學(xué)不會的!
金剛鉆之三:BigR
R語言被越來越多的應(yīng)用在企業(yè)內(nèi)進(jìn)行數(shù)據(jù)統(tǒng)計(jì)和挖掘,它具備以下優(yōu)點(diǎn):
R 還提供了各種工具,可使用它們來將數(shù)據(jù)輕松導(dǎo)入軟件包以進(jìn)行分析。但缺點(diǎn)也明顯,天生不支持在分布式的部署,因此有很多項(xiàng)目嘗試將R引入到Hadoop領(lǐng)域。IBM實(shí)現(xiàn)的方式就是利用Big R技術(shù)將R算法集成如Hadoop平臺內(nèi)。IBM BigR的最大特色是不需重寫R程序,又充分利用的Hadoop平臺的可擴(kuò)展性,還可以直接在BigSQL里面使用SQL來調(diào)用R算法!4.1版本還把SystemML-IBM Watson機(jī)器學(xué)習(xí)算法修改后也可以直接在BigR里面運(yùn)行了!
金剛鉆之四:文本分析
大數(shù)據(jù)其中重要的應(yīng)用就是要分析機(jī)器日志和社交媒體的數(shù)據(jù),里面有大量的自然語言語義需要分析,IBM在海外和推特(Twitter)是合作伙伴的關(guān)系,可以輕松將其社交媒體數(shù)據(jù)放入進(jìn)行分析。需要用到的重要的工具就是Text Analytics模塊,IBM提供了一個圖形化管理的工具,可以便捷地定義抓取規(guī)則。當(dāng)然,里面也包含一系列預(yù)定義好的社交媒體接口,無需重復(fù)工作,可以快速開展工作。
由以上IBM給Hadoop社區(qū)增值的四大金剛鉆組合出主要的兩個付費(fèi)版本:給數(shù)據(jù)分析員使用的版本就是含BigSheets和BigSQL模塊的IBM BigInsights Analyst 產(chǎn)品包;給數(shù)據(jù)科學(xué)家使用的版本是含四個金剛鉆的IBM BigInsights Data Scientist 產(chǎn)品包。
另外對于Hadoop平臺的有力補(bǔ)充,在IBM BigInsights Enterprise Management 包內(nèi)含有另外兩個特別的模塊:GPFS-FPO分布式文件系統(tǒng)和Platform Symphony任務(wù)調(diào)度和多租戶管理模塊。前者是可以替代HDFS的文件系統(tǒng),后者可以有力補(bǔ)充YRAN的一些局限性,我們將在未來的文章內(nèi)詳細(xì)介紹。
看完了是否心動?IBM提供學(xué)習(xí)環(huán)境,免費(fèi)下載Quick Start產(chǎn)品包吧,其中Quick Start產(chǎn)品包除了包含開源的IBM Open Platform for Apache Hadoop 外,BigSheets、BigSQL、BigR、Text Analytics功能都在里面!
下載試用鏈接:
詳情請咨詢!
客服熱線:023-66090381
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請郵件反饋至chenjj@fc6vip.cn