网学之家(5588net.com) - 执着关注互联网技术!

网学之家|5588net.com

hive Cli常用操作(翻译自Hive wiki)

来源:www.5588net.com 作者:网学之家 时间:2014-05-05 点击:

这里罗列常用操作,更多参考

https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Cli

hive命令行

执行一个查询

$HIVE_HOME/bin/hive -e 'select a.col from tab1 a'

之后过程中,会在终端上显示mapreduce的进度,执行完毕后,最后把查询结果输出到终端上,接着hive进程退出,不会进入交互模式。

使用静音模式执行一个查询

$HIVE_HOME/bin/hive -S -e 'select a.col from tab1 a'

加入-S,终端上的输出不会有mapreduce的进度,执行完毕,只会把查询结果输出到终端上。这个静音模式很实用,,通过第三方程序调用,第三方程序通过hive的标准输出获取结果集。

使用静音模式执行一个查询,把结果集导出

$HIVE_HOME/bin/hive -S -e 'select a.col from tab1 a' > tab1.csv

不进入交互模式,执行一个hive script

$HIVE_HOME/bin/hive -f /home/my/hive-script.sql

hive-script.sql是使用hive sql语法编写的脚本文件,执行的过程和-e类似,区别是从文件加载sql.

但是sql文件,对于bash来说,不能使用变量,而使用-e的方式,可以在bash里使用变量(但是对于sql文件的形式,可以利用程序基于变量动态生成sql文件,再执行,稍微麻烦点)。

这里可以和静音模式-S联合使用,通过第三方程序调用,第三方程序通过hive的标准输出获取结果集。

hive交互式模式

当$HIVE_HOME/bin/hive执行时,没有-e或者-f选项,会进入交互式shell模式。

命令描述

quit 

exit退出交互式shell

reset重置配置为默认值

set=修改特定变量的值

注意: 如果变量名拼写错误,不会报错

set输出用户覆盖的hive配置变量

set -v输出所有Hadoop和Hive的配置变量

add FILE[S]

add JAR[S]

add ARCHIVE[S]*添加 一个或多个 file, jar,  archives到分布式缓存

list FILE[S] 

list JAR[S] 

list ARCHIVE[S]输出已经添加到分布式缓存的资源。

list FILE[S]

list JAR[S]

list ARCHIVE[S]*检查给定的资源是否添加到分布式缓存

delete FILE[S]

delete JAR[S]

delete ARCHIVE[S]*从分布式缓存删除指定的资源

!从Hive shell执行一个shell命令

dfs从Hive shell执行一个dfs命令

执行一个Hive 查询,然后输出结果到标准输出

source FILE在CLI里执行一个hive脚本文件

例子

hive> set mapred.reduce.tasks=32;

hive> set;

hive> select a.* from tab1;

hive> !ls;

hive> dfs -ls;

顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
验证码: 点击我更换图片
栏目列表
推荐内容