HBase中的Regionservers.

时间:2020-02-23 14:33:36  来源:igfitidea点击:

Regionservers是我们激活的软件进程(通常被称为守护程序),以存储和检索HBase(Hadoop数据库)中的数据。
在生产环境中,每个RegionServer都部署在其自己的专用计算节点上。
当我们开始使用HBase时,我们可以创建一个表,然后开始存储和检索数据。

但是,在某些时候 - 或者许在大数据用例中可能很快 - 表格的增长超出可配置限制。
此时,HBase系统会自动拆分表并将负载分发到另一个Regionserver。

在此过程中,通常称为自动分片,HBase自动缩放,因为我们将数据添加到系统时 - 与大多数数据库管理系统相比,这一巨大的好处,需要手动干预将整个系统扩展到单个服务器之外。
使用HBase,只要我们在机架中配置了另一台配置的备用服务器,缩放是自动的!

为什么要对表设置限制,然后分割它们?
毕竟,HDFS是底层存储机制,因此HDFS集群中的所有可用磁盘可用于存储表。
(当然不是计算复制因子。
)如果我们有整个集群,为什么为自己限制为一个Regionserver来管理表?

简单的。
我们可能有大量或者小的表格,我们将希望HBase在管理数据时利用所有可用的Regionservers。
我们希望充分利用群集的计算性能。
此外,对于访问HBase系统的许多客户端,我们将希望使用许多Regionservers来满足需求。

HBase在存储容量和计算电源方面为我们提供了所有这些问题和自动缩放。