第14天:Cli命令行操作讲解
 hive命令行
 使用静音模式执行一个查询,把结果集导出


$HIVE_HOME/bin/hive -S -e 'select a col from tab1 a' > tab1.csv




 不进入交互模式,执行一个hive script


$HIVE_HOME/bin/hive -f /home/my/hive-script.sql  :-f执行一个文件




 hive-script.sql是使用hive sql语法编写的脚本文件,执行的
 过程和-e类似,区别是从文件加载sql


但是sql文件,对于bash来说,不能使用变量,而使用-e的方式,
可以在bash里使用变量(但是对于sql文件的形式,
可以利用程序基于变量动态生成sql文件,在执行,稍微麻烦点);


这里可以和静音模式-S 联合使用,通过第三方程序调用,
第三方程序通过hive的标准输出获取结果集。




我理解的意思是:
不用进入hive的命令行模式啊,
直接这样执行,能把login表中的信息打印出来,
然后你可以在后面加上> 重定向符号,这样可以把
打印的信息,输入到一个 .sql 或者.cvs里面。

hive -e 'select * from login';  

 > hadoop/hive/hivetest.txt










执行一个查询

hive -e 'select a col from tab1 a'


之后过程中,会在中断上显示mapreduce的进度,执行完毕后,
最后把查询结果输出到终端上,
接着hive进程退出,不会进入交互模式。
使用静音模式执行一个查询, hive -S -e 'select * from login'
加入 -S 终端上的输出不会有mapreduce的进程,
执行完毕,,只会把查询结果输出到终端上面,这个静音模式
很实用 通过第三方程序的调用,第三方程序通过hive的标准
输出获取结果集。


hive Cli常用操作
hive交互式模式
当 $HIVE_HOME/bin/hive 执行时,
没有-e 或者-f 选项,会进入交互式shell模式下


quit 退出交互式shell
exit 退出交互式shell


reset 重置配置为默认
set<key>= <value> 修改特定变量的值
注意:如果变量名拼写错误,不会报错


set 输出用户要覆盖的hive的配置变量
set -v 输出所有hadoop和hive的配置变量


add file
add mr
add archive 添加一个活多个file,jar,archive到分布式缓存


list file
list jar
list archive 输出已经添加到分布式缓存的资源


delete file
delete jar
delete archive   从分布式缓存红棕移除指定的资源


! command 从hive shell执行一个shell命令
dfs <dfs command> 从hiveshell执行一个dfs命令
《query string 执行一个hive查询,然后输出结果到标准输出
source file 在cli里执行一个hive脚本文件。






hive数据类型
列类型
hive支持的数据类型如下:
原生类型:

tinyint 

 smallint 

 int 

 bigint 

 boolean 

 float 

 double 

 string 

 binary(hive 0.8以上才支持 

 timestamp(hive 0.8以上才可用




复杂类型:

arrays:array<data_type> 

 maps:map<primitve_type,data_type> 

 structs; struct 

 union



union类型
union
类型可以在同一时间点,保持恰好有一个指定的数据类型,
您可以使用create_union的UDF创建一个实例类型。

create table union_test(foo uniontype<int,double,array<string> 

 ,struct<a int,b string>>); 



 select foo from union_test; 



 {0,1} 

 {1.2,0} 

 {2,["three","four"]}




常量
数值类型:
默认,数值类型认为是int,除非
int超出了int的范围,那么会被解释为bigint
或者是如下的后缀,在数值中呗使用

type 
 postfix 
  example 

  tinyint   Y 
 100Y 

  smallint  S 
 100S 

  bigin 
   L     100L




 字符串类型
  字符串可以使用单引号(') 或者(“)
  hive在字符串中使用C-style的转义
  浮点类型
  浮点类型数值,呗假定为双浮点类型,目前
  不支持科学计数法


  null值的处理
  遗漏的值按代表为特殊值null,要导入null字段
  的数据,需要查阅使用serDe的文档,
  默认的文本格式使用lazy