hive判断某个字段长度 hive判断包含数字_mob64ca140b466e的技术博客_51CTO博客

hive判断某个字段长度 hive判断包含数字

关注 mob64ca140b466e

文章目录

row_number() over、nvl、from_unixtime、datediff、union、parse_url、parse_url_tuple、locate、split、substr、instr、concat、regexp_extract
row_number() over
分组统计排序
nvl
空值转换函数,必须是null，''不行
from_unixtime
把时间戳格式的时间，转化为年月日时分秒格式的时间
datediff
两个时间参数的日期之差
parse_url
函数parse_url,解析URL字符串
parse_url_tuple
类似parse_url()，但它可以同时提取多个部分并返回
locate
非全量匹配
split
分割字符串函数
如果是在shell中运行,hive脚本执行，特别注意\\要写\\\\，则(前缀加上\\)
substr
字符串截取，下标
instr
模糊匹配
trim
concat
用于将多个字符串连接成一个字符串
union

hive判断某个字段长度 hive判断包含数字

转载

mob64ca140b466e 2023-12-25 20:49:52

文章标签 hive判断某个字段长度 hive 字符串 facebook 文章分类 Hive 大数据

row_number() over、nvl、from_unixtime、datediff、union、parse_url、parse_url_tuple、locate、split、substr、instr、concat、regexp_extract

row_number() over	分组统计排序语法：ROW_NUMBER() OVER(PARTITION BY COLUMNORDER BY COLUMN) row_number() OVER (PARTITION BY COL1 ORDERBY COL2)表示根据COL1分组，在分组内部根据COL2排序，而此函数计算的值就表示每组内部排序后的顺序编号（该编号在组内是连续并且唯一的)。分组统计排序： ROW_NUMBER() OVER (PARTITION BY video_type_name ORDER BY count(course_name) DESC) AS rnk select count(course_name) total,video_type_name,course_name, ROW_NUMBER() OVER (PARTITION BY video_type_name ORDER BY count(course_name) DESC) AS rnk from video_see_records group by video_type_name,course_name
nvl	空值转换函数,必须是null，''不行 NVL(expr1, expr2)： 1、空值转换函数； 2、类似于mysql-nullif(expr1, expr2)，sqlserver-ifnull(expr1, expr2)。备注： 1、如果expr1为NULL，返回值为 expr2，否则返回expr1。 2、适用于数字型、字符型和日期型，但是 expr1和expr2的数据类型必须为同类型。
from_unixtime	把时间戳格式的时间，转化为年月日时分秒格式的时间 from_unixtime的参数要求为整数，且单位为秒。如果从业务系统拿到的时间戳格式的时间单位为毫秒，则需要先将它转化为秒，方法如下 from_unixtime( int (timestamp_in_millisecond / 1000))
datediff	两个时间参数的日期之差
parse_url	函数parse_url,解析URL字符串 parse_url(url, partToExtract[, key]) - extracts a part from a URL 解析URL字符串，partToExtract的选项包含[HOST,PATH,QUERY,REF,PROTOCOL,FILE,AUTHORITY,USERINFO]。举例： * parse_url('http://facebook.com/path/p1.php?query=1', 'HOST')返回'facebook.com' * parse_url('http://facebook.com/path/p1.php?query=1', 'PATH')返回'/path/p1.php' * parse_url('http://facebook.com/path/p1.php?query=1', 'QUERY')返回'query=1'，可以指定key来返回特定参数，例如 * parse_url('http://facebook.com/path/p1.php?query=1', 'QUERY','query')返回'1'， * parse_url('http://facebook.com/path/p1.php?query=1#Ref', 'REF')返回'Ref' * parse_url('http://facebook.com/path/p1.php?query=1#Ref', 'PROTOCOL')返回'http' 注意：HOST\PATH需要大写
parse_url_tuple	类似parse_url()，但它可以同时提取多个部分并返回返回值: string 　　　　说明：返回URL中指定的部分。partToExtract的有效值为：HOST, PATH, QUERY, REF, PROTOCOL, AUTHORITY, FILE, and USERINFO. 　　举例： hive> select parse_url(‘http://facebook.com/path1/p.php?k1=v1&k2=v2#Ref1′, ‘HOST’) from dual; facebook.com hive> select parse_url_tuple(‘http://facebook.com/path1/p.php?k1=v1&k2=v2#Ref1’, ‘QUERY:k1’, ‘QUERY:k2’); v1 v2
locate	非全量匹配 locate(string substr, string str[, int pos]) join模糊匹配 left join , right join , full join hive> select * from a left join b on 1=1 where locate(a.col,b.col)>0 hive> select * from a right join b on 1=1 where locate(a.col,b.col)>0 hive> select * from a full join b where locate(a.col,b.col)>0 除了将locate()直接写在where条件里，也可以使用row_number()来搭配使用。 select col from( select if(locate(a.col, b.col)>0, b.col, a.col) as col, row_number() over(partition by a.col order by locate(a.col, b.col) desc) as rn from a left join b on 1=1 ) as a where rn=1
split	分割字符串函数语法: split(string str, string pat) 返回值: array 说明: 按照pat字符串分割str，会返回分割后的字符串数组举例： hive> select split(‘abtcdtef’,'t’) from dual; ["ab","cd","ef"] 特殊字符如正则表达式中的特殊符号作为分隔符时，需做转义 (前缀加上\) 如果是在shell中运行,hive脚本执行，特别注意\\要写\\\\，则(前缀加上\\) 注：有些特殊字符转义只需\，而有些需\\，eg.?。可能在语句翻译过程中经历经历几次转义。
substr	字符串截取，下标第一种用法： substr（string A，int start）和 substring（string A，int start），用法一样功效：返回字符串A从下标start位置到结尾的字符串第二种用法： substr（string A，int start，int len）和 substring（string A，int start，int len），用法一样功效：返回字符串A从下标start位置开始，长度为len的字符串注意：substr下标start记做0或1都是从第一个开始，记做2是从第二个开始
instr	模糊匹配 instr(sourceStr,destStr,start,appearPosition) instr（’源字符串’ , ‘目标字符串’ ,’开始位置’,’第几次出现’） 1.destString 是匹配标准，sourceString 是被筛选的源数据集 2.start 代表查找的开始位置，这个参数可选的，默认为1；--从1开始计数 3.appearPosition代表想从源字符中查找出第几次出现的destStr，这个参数也是可选的，默认为1 4.如果start的值为负数，则代表从右往左进行查找，但是位置数据 start 仍然从左向右计算。 5.返回值为：查找到的字符串的位置。如果没有查找到，返回0。最简单例子：在abcd中查找a的位置，从第一个字母开始查，查找第一次出现时的位置 select instr(‘abcd’,’a’,1,1) from dual; —1 select instr(‘abcd’,’c’,1,1) from dual; —3 select instr(‘abcd’,’e’,1,1) from dual; —0 应用于模糊查询：instr(字段名/列名, ‘查找字段’) select count(k.terminal) from cr_t_etl09 k where k.partition='2020-12-01' and instr(k.prevurl,'https://baidu.com')=1; 等同于 select count(k.terminal) from cr_t_etl09 k where k.partition='2020-12-01' and like 'https://baidu.com%' ; 应用于判断包含关系： select ccn,mas_loc from mas_loc where instr(‘FH,FHH,FHM’,ccn)>0; 等同于 select ccn,mas_loc from mas_loc where ccn in (‘FH’,’FHH’,’FHM’);
trim	trim，只能将标准的英文空格删掉
concat	用于将多个字符串连接成一个字符串 select concat(cookie,'-',rnk,'.0-',url)url_c from dwd_visit
regexp_extract	正则表达式，匹配截取

hive官网函数地址	LanguageManual UDF - Apache Hive - Apache Software Foundation
网速灾备。。
为方便看懂转换了中文
union	去重

regexp_extract(string subject, string pattern, int index)	返回使用模式提取的字符串。例如，regexp_extract（'foothebar'，'foo（。*？）（bar）'，2）返回'bar'。请注意，使用预定义的字符类时必须格外小心：使用'\ s'作为第二个参数将与字母s匹配；'\\ s'是匹配空格等所必需的。'index'参数是Java regex Matcher group（）方法的索引。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：win子系统ubuntu设置开机启动mysql ubuntu server 开机启动

下一篇：ios 点击a标签要点击多次点击a标签触发onclick事件

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

mob64ca140b466e

关注

精品课程

免费资料>

2024软考

高级中级初级

华为认证

数通云计算安全

厂商认证

K8s Oracle 红帽

IT技术

数据库网络安全 AIGC

近期文章

文章目录

row_number() over、nvl、from_unixtime、datediff、union、parse_url、parse_url_tuple、locate、split、substr、instr、concat、regexp_extract
row_number() over
分组统计排序
nvl
空值转换函数,必须是null，''不行
from_unixtime
把时间戳格式的时间，转化为年月日时分秒格式的时间
datediff
两个时间参数的日期之差
parse_url
函数parse_url,解析URL字符串
parse_url_tuple
类似parse_url()，但它可以同时提取多个部分并返回
locate
非全量匹配
split
分割字符串函数
如果是在shell中运行,hive脚本执行，特别注意\\要写\\\\，则(前缀加上\\)
substr
字符串截取，下标
instr
模糊匹配
trim
concat
用于将多个字符串连接成一个字符串
union

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 25年5月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费资料
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册