Squirrel与JDBC驱动程序一起Hive客户端

时间:2020-02-23 14:33:38  来源:igfitidea点击:

Squirrel SQL是一个充当Hive客户端的开源工具。
我们可以从SourceForge下载此通用SQL客户端。

它提供了一个用户界面来蜂拥而至,简化查询大表的任务并使用Apache Hive分析数据。

该图说明了使用诸如松鼠等工具时的Hive架构如何工作。

我们可以看到松鼠客户端使用JDBC API通过服务器将命令传递给Hive驱动程序。

按照以下步骤获取松鼠运行:

  • 使用命令lsiting启动Hive Thrift服务器:
$$HIVE_HOME/bin/hive --service hiveserver -p 10000 -v
Starting Hive Thrift Server
Starting Hive Thrift Server on port 10000 with 100 min worker threads and 2147483647 max worker threads
  • 从SourceForge站点下载最新的大鼠分发到我们选择的目录中。

  • 使用gunzip命令解压缩松鼠包,并使用tar命令展开存档。

gunzip squirrel-sql-3.5.0-standard.tar.gz; tar xvf squirrel-sql-3.5.0-standard.tar.gz
  • 更改为新的松鼠发布目录并使用以下命令启动工具。
$cd squirrel-sql-3.5.0-standard;./squirrel-sql.sh

请注意,包括Hadoop核心.jar文件的说明可能因Hadoop释放而异。在这种情况下,Hadoop .jar文件名为hadoop-core-1.2.1.jar,所以包括$hadoop_home/hadoop - * - core.jar按照在线说明的不正确。

这就是开始使用Squirrel图形用户界面所需的全部。
下图显示了针对Hive驱动程序运行的一些Hiveql命令 - 类似于我们之前ran的命令,使用CLI。

Apache Hive 0.11版本还包括一个名为Hiveserver2的新蜂窝增节服务器。
正确配置后,HiveServer2可以支持多个客户端(例如,同时的CLI客户端和Squirrel客户端),并且提供更好的安全性。