3种 Hadoop集群配置

时间:2020-02-23 14:33:25  来源:igfitidea点击:

单机架Hadoop部署

单机架部署是Hadoop集群的理想起点。

在这里,群集是相当独立的,但是由于它仍然具有相对较少的从属节点,因此Hadoop的弹性的真正优势尚不明显。

三机架Hadoop部署

中型集群具有多个机架,其中三个主节点分布在机架上。

Hadoop的弹性开始变得明显:即使整个机架发生故障(例如,单个机架中的两个ToR交换机),集群仍可以正常运行,尽管性能较低。从节点故障几乎不会引起注意。

大规模Hadoop部署

在具有许多机架的较大群集中,如所示示例,所需的网络体系结构非常复杂。

无论Hadoop集群扩展到多少机架,任何机架的从节点都需要能够有效地进行对话。到任何主节点。

随着从节点数量增加到拥有三个以上机架的程度,除ToR交换机外,其他机架仅由从节点组成。如果您在群集上大量使用HBase,则可以添加主节点以托管其他HMaster和Zookeeper服务。

如果要真正实现大规模扩展(拥有数百个从节点),则可能需要使用HDFS联合功能,以便数据集的大部分由不同的NameNode服务管理。

对于每个其他的活动NameNode,您将需要一个相应的Standby NameNode和两个主节点来托管这些服务器。有了HDFS联合,就可以扩展群集的范围而言,天空确实是极限。