不卡一区,91自拍在线,97蜜桃网站

下載：75 收藏：0

免費下載

YARN (產品編號：13741)

YARN是一種新型的Hadoop通用資源管理系統。

標簽：

開發商： Apache

當前版本：

產品類型：控件

產品功能：數據庫工具

平臺語言：

開源水平：不提供源碼

本產品的分類與介紹僅供參考，具體以商家網站介紹為準，如有疑問請來電 023-68661681 咨詢。

Apache Hadoop YARN（Yet Another Resource Negotiator）是Apache Hadoop為完善大數據處理，而推出的新型集群框架處理模型。?相對于最初的MapReduce，YARN提供了更加優秀的資源管理器，讓Storm等流處理框架同樣可以運行在Hadoop集群之上。

YARN從某種意義上說可算做是一個云操作系統，它負責集群的資源管理。在操作系統之上可以開發各類的應用程序，例如批處理MapReduce、流式作業Storm以及實時型服務Storm等。這些應用可以同時利用Hadoop集群的計算能力和豐富的數據存儲模型，共享同一個Hadoop 集群和駐留在集群上的數據。此外，這些新的框架還可以利用YARN的資源管理器，提供新的應用管理器實現。

* 關于本產品的分類與介紹僅供參考，精準產品資料以官網介紹為準，如需購買請先行測試。

經典 MapReduce 的局限性：

經典 MapReduce 的最嚴重的限制主要關系到可伸縮性、資源利用和對與 MapReduce 不同的工作負載的支持。在 MapReduce 框架中，作業執行受兩種類型的進程控制：

一個稱為JobTracker的主要進程，它協調在集群上運行的所有作業，分配要在 TaskTracker 上運行的 map 和 reduce 任務。
許多稱為TaskTracker的下級進程，它們運行分配的任務并定期向 JobTracker 報告進度。

大型的 Hadoop 集群顯現出了由單個 JobTracker 導致的可伸縮性瓶頸。依據 Yahoo!，在集群中有 5,000 個節點和 40,000 個任務同時運行時，這樣一種設計實際上就會受到限制。由于此限制，必須創建和維護更小的、功能更差的集群。

此外，較小和較大的 Hadoop 集群都從未最高效地使用他們的計算資源。在 Hadoop MapReduce 中，每個從屬節點上的計算資源由集群管理員分解為固定數量的 map 和 reduce slot，這些 slot 不可替代。設定 map slot 和 reduce slot 的數量后，節點在任何時刻都不能運行比 map slot 更多的 map 任務，即使沒有 reduce 任務在運行。這影響了集群的利用率，因為在所有 map slot 都被使用（而且我們還需要更多）時，我們無法使用任何 reduce slot，即使它們可用，反之亦然。

最后但同樣重要的是，Hadoop 設計為僅運行 MapReduce 作業。隨著替代性的編程模型（比如 Apache Giraph 所提供的圖形處理）的到來，除 MapReduce 外，越來越需要為可通過高效的、公平的方式在同一個集群上運行并共享資源的其他編程模型提供支持。

YARN與經典 MapReduce的變化：

YARN 是下一代 Hadoop 計算平臺，它進行了如下改變：

ResourceManager 代替集群管理器
ApplicationMaster 代替一個專用且短暫的 JobTracker
NodeManager 代替 TaskTracker
一個分布式應用程序代替一個 MapReduce 作業

YARN主要架構解析：

1）全局管理的ResourceManager（RM）

RM是一個全局的資源管理器，負責整個系統的資源管理和分配。它主要由兩個組件構成：調度器（Scheduler）和應用程序管理器（Applications Manager，ASM）。

調度器：調度器根據容量、隊列等限制條件（如每個隊列分配一定的資源，最多執行一定數量的作業等），將系統中的資源分配給各個正在運行的應用程序。需要注意的是，該調度器是一個“純調度器”，它不再從事任何與具體應用程序相關的工作，比如不負責監控或者跟蹤應用的執行狀態等，也不負責重新啟動因應用執行失敗或者硬件故障而產生的失敗任務，這些均交由應用程序相關的ApplicationMaster完成。調度器僅根據各個應用程序的資源需求進行資源分配，而資源分配單位用一個抽象概念“資源容器”（Resource Container，簡稱Container）表示，Container是一個動態資源分配單位，它將內存、CPU、磁盤、網絡等資源封裝在一起，從而限定每個任務使用的資源量。此外，該調度器是一個可插拔的組件，用戶可根據自己的需要設計新的調度器，YARN提供了多種直接可用的調度器，比如Fair Scheduler和Capacity Scheduler等。
應用程序管理器：應用程序管理器負責管理整個系統中所有應用程序，包括應用程序提交、與調度器協商資源以啟動ApplicationMaster、監控ApplicationMaster運行狀態并在失敗時重新啟動它等。