Apache Hive是用于查詢和管理分布式存儲中大型數(shù)據(jù)集的數(shù)據(jù)倉庫軟件。
標(biāo)簽:開發(fā)商: Apache
當(dāng)前版本: v1.2.1
產(chǎn)品類型:軟件
產(chǎn)品功能:數(shù)據(jù)庫工具
平臺語言:
開源水平:不提供源碼
本產(chǎn)品的分類與介紹僅供參考,具體以商家網(wǎng)站介紹為準(zhǔn),如有疑問請來電 023-68661681 咨詢。
* 關(guān)于本產(chǎn)品的分類與介紹僅供參考,精準(zhǔn)產(chǎn)品資料以官網(wǎng)介紹為準(zhǔn),如需購買請先行測試。
Hive 構(gòu)建在基于靜態(tài)批處理的Hadoop 之上,Hadoop 通常都有較高的延遲并且在作業(yè)提交和調(diào)度的時候需要大量的開銷。Hive 不能夠在大規(guī)模數(shù)據(jù)集上實現(xiàn)低延遲快速的查詢,例如,Hive 在幾百MB 的數(shù)據(jù)集上執(zhí)行查詢一般有分鐘級的時間延遲。因此,Hive 不適合那些需要低延遲的應(yīng)用,例如,聯(lián)機事務(wù)處理(OLTP)。Hive 查詢操作過程嚴(yán)格遵守Hadoop MapReduce 的作業(yè)執(zhí)行模型,Hive 將用戶的HiveQL 語句通過解釋器轉(zhuǎn)換為MapReduce 作業(yè)提交到Hadoop 集群上,Hadoop 監(jiān)控作業(yè)執(zhí)行過程,然后返回作業(yè)執(zhí)行結(jié)果給用戶。Hive 并非為聯(lián)機事務(wù)處理而設(shè)計,Hive 并不提供實時的查詢和基于行級的數(shù)據(jù)更新操作。Hive 的最佳使用場合是大數(shù)據(jù)集的批處理作業(yè),例如,網(wǎng)絡(luò)日志分析。
Hive 是一種底層封裝了Hadoop 的數(shù)據(jù)倉庫處理工具,使用類SQL 的HiveQL 語言實現(xiàn)數(shù)據(jù)查詢,所有Hive 的數(shù)據(jù)都存儲在Hadoop 兼容的文件系統(tǒng)(例如,Amazon S3、HDFS)中。Hive 在加載數(shù)據(jù)過程中不會對數(shù)據(jù)進(jìn)行任何的修改,只是將數(shù)據(jù)移動到HDFS 中Hive 設(shè)定的目錄下,因此,Hive 不支持對數(shù)據(jù)的改寫和添加,所有的數(shù)據(jù)都是在加載的時候確定的。Hive 的設(shè)計特點如下:
支持索引,加快數(shù)據(jù)查詢。
不同的存儲類型,例如,純文本文件、HBase 中的文件。
將元數(shù)據(jù)保存在關(guān)系數(shù)據(jù)庫中,大大減少了在查詢過程中執(zhí)行語義檢查的時間。
可以直接使用存儲在Hadoop 文件系統(tǒng)中的數(shù)據(jù)。
內(nèi)置大量用戶函數(shù)UDF 來操作時間、字符串和其他的數(shù)據(jù)挖掘工具,支持用戶擴展UDF 函數(shù)來完成內(nèi)置函數(shù)無法實現(xiàn)的操作。
類SQL 的查詢方式,將SQL 查詢轉(zhuǎn)換為MapReduce 的job 在Hadoop集群上執(zhí)行。
主要分為以下幾個部分:
用戶接口主要有三個:CLI,Client 和 WUI。其中最常用的是 CLI,Cli 啟動的時候,會同時啟動一個 Hive 副本。Client 是 Hive 的客戶端,用戶連接至 Hive Server。在啟動 Client 模式的時候,需要指出 Hive Server 所在節(jié)點,并且在該節(jié)點啟動 Hive Server。 WUI 是通過瀏覽器訪問 Hive。
Hive 將元數(shù)據(jù)存儲在數(shù)據(jù)庫中,如 mysql、derby。Hive 中的元數(shù)據(jù)包括表的名字,表的列和分區(qū)及其屬性,表的屬性(是否為外部表等),表的數(shù)據(jù)所在目錄等。
解釋器、編譯器、優(yōu)化器完成 HQL 查詢語句從詞法分析、語法分析、編譯、優(yōu)化以及查詢計劃的生成。生成的查詢計劃存儲在 HDFS 中,并在隨后由 MapReduce 調(diào)用執(zhí)行。
Hive 的數(shù)據(jù)存儲在 HDFS 中,大部分的查詢由 MapReduce 完成(包含 * 的查詢,比如 select * from tbl 不會生成 MapReduce 任務(wù))。
更新時間:2016-01-26 13:48:02.000 | 錄入時間:2016-01-25 10:39:05.000 | 責(zé)任編輯:陳俊吉