HBase客户端生态系统

时间:2020-02-23 14:33:39  来源:igfitidea点击:

HBase是用Java编写的,一种优雅的语言,用于建立像HBase这样的分布式技术,而是面对它 - 不是想要利用HBase Innovations的每个人都是Java开发人员。
这就是为什么那里有一个富有的HBase客户端生态系统,其唯一目的是为我们做重型Java举起,让我们专注于为我们制作HBase工作。

富人通常是一个很好的特征,但是当形容词穿过线条压倒压倒时,你就会开始遇到问题。
以下是客户端生态系统以图表形式概述。
请注意,该图类似于HBase架构图,具有客户端框的分解视图。

以下列表总结了选项,从Apache Hadoop客户端开始,更具体地说,是Apache Hadoop生态系统的一部分的HBase客户端以及旨在构建HBase客户端的HBase捆绑的技术:

  • Hive:Hive是另一个顶级Apache项目。 Hive在Apache Hadoop的顶部提供了自己的数据仓库函数。它配备了HBase的存储处理程序,还提供了HiveQL查询语言,它与SQL非常相似。通过Hive,我们可以使用Hiveql的所有查询我们想要的Hbase查询haveql, - 这是kicker - 当我们使用Hbase时,不需要Java编码。

  • mapreduce:mapreduce是apache hadoop框架的一部分。 MapReduce声称Fame是它是一个用于在分布式集群上并行处理数据的编程模型。在Hadoop Universe中,HBase是(顾名思义)"Hadoop数据库"。 HBase利用Hadoop分布式文件系统(HDF),也可以通过MapReduce作业来利用。 HBase表可以是并行处理MapReduce作业的源或者接收器。

  • Pig:Pig是另一种技术,包括Apache Hadoop,与Hive一样,Pig可以利用HBase。Pig通过给你一个叫做Pig拉丁语的更高级别的编程语言来提高一个水平,这可以为我们提供重型MapReduce举起。

  • 多语言旧系统:节俭为构建HBase客户端提供语言中立方法。由Facebook开发,节俭的界面定义语言(IDL)允许我们定义数据类型和服务接口,以便以不同语言编写的两个不同的系统可以彼此通信。写入IDL后,节俭生成通信所需的代码。

  • Java Client:如果我们碰巧成为Java开发人员,并且我们了解Java软件包的INS和OUT,那么我们将想要查看随着HBase分布捆绑的包。

  • REST系统:可能是访问HBase表的最快方法是利用REST接口。代表代表状态转移的休息是使Web浏览器工作的技术。大多数人现在只需拍摄Web浏览器就会被授予,因此任何人都可以更加自然,而不是仅使用我们喜欢的浏览器作为一个HBase群集的网关?与旧方法一样,REST网关服务器使用HBase船舶,我们需要启动至少一个,以便启用与表的浏览器交互。为此,只需选择网关服务器的端口号,然后执行以下命令:

$INSTALL_DIR/hbase-0.94.7/bin/hbase rest start _p 7777
  • JRUBY(HBase Shell):卷起袖子并学习使用HBase的最快方法是通过HBase shell。由于我们可能已经在上一节中的HBase Shell的实际示例中已经看到,因此shell是一种与HBase交互的强大工具。 HBase shell基于JRuby的交互式Ruby Shell或者IRB。
    但请记住,我们还可以编写脚本并以批处理模式执行它们。