DbVisualizer配置连接hive

发表: 2016-06-29 浏览: 3877

最近在测试hive on Spark的功能, 由于数据库Oracle习惯使用PLsql了，其他我都使用DbVisualizer，就尝试配置了一下。

测试了2个hadoop集群，机器都是4台普通的服务器2U服务器

测试环境1:hive on hadoop

hive-1.0

hadoop-common-2.2

测试环境2:hive on spark

cdh5.7

hive-1.1.0

hadoop-2.6.0

spark-1.6.0

修改dbvisgui.bat

增加PATH=JDK_PATH;%PATH%

DbVisualizer\jdbc\hive下复制这2个文件

hadoop-common-2.6.4.jar

hive-jdbc-1.1.1-standalone.jar

然后在tools/Driver manager按如下配置即可

注意hive server如果是1.x的版本，hive-jdbc就不能使用2.x版本，会报如下错误：

Required field 'client_protocol' is unset! Struct:TOpenSessionReq(client_protocol:null, configuration:{use:database=default})

hadoop版本高一点没关系，使用hadoop-common-2.7.2.jar也可以。

如果要使用老版本

需要在DbVisualizer\jdbc\hive下复制以下文件

hadoop-2.2.0/share/hadoop/common/hadoop-common-2.2.0.jar

hadoop-2.2.0/share/hadoop/common/lib/slf4j-api-1.7.5.jar

hadoop-2.2.0/share/hadoop/common/lib/slf4j-log4j12-1.7.5.jar

hive-1.0.0/lib/*

数据表test 3000万的数据量，字段就是20个左右。

语句select sum(quantity),count(*) from test

hive on spark 大概第一次50三s+ ,以后20 s+

hive on hadoop 大概都是70 s+

具体的性能还要再加点数据看看。

0 个评论

要回复文章请先登录或注册