元数据
data.json
{“name”:“Yuhui”}
{“name”:“lihui”, “age”:30}
{“name”:“Justin”, “age”:19}
people.json
{“name”:“Yuhui”,“age”:29}
{“name”:“lihui”, “age”:33}
{“name”:“Leijiexu”, “age”:28}
加载且建立临时表
val jsondf01=sqlContext.read.json(“hdfs://hadoop14:9000/yuhui/json/data.json”)
val jsondf02=sqlContext.read.json(“hdfs://hadoop14:9000/yuhui/json/people.json”)
jsondf01.registerTempTable(“people01”)
jsondf02.registerTempTable(“people02”)
sqlContext.sql("select * from people01 ").show()
sqlContext.sql("select * from people02 ").show()
isnull方法
ISNULL(A.age) 当A.age为null时,则ISNULL(A.age)为true
ISNULL(A.age) 当A.age不为null时,则ISNULL(A.age)为false
Case When 方法
第一个查询结果:如果B表的age有值则取B表中的age。如果没有值则去A表中的age
第二个查询结果:如果A表的age有值则取A表中的age。如果没有值则去B表中的age
北京小辉微信公众号
大数据资料分享请关注