JSON文件

Spark SQL 能够自动推测 JSON数据集的结构,并将它加载为一个Dataset[Row]. 可以通过SparkSession.read.json()去加载一个 一个JSON 文件。

注意:这个JSON文件不是一个传统的JSON文件,每一行都得是一个JSON串。格式如下:

{“name”:”Michael”}
{“name”:”Andy”, “age”:30}
{“name”:”Justin”, “age”:19}

1)导入隐式转换

import spark.implicits._

2)加载JSON文件

val path = “examples/src/main/resources/people.json”
 val peopleDF = spark.read.json(path)

3)创建临时表

peopleDF.createOrReplaceTempView(“people”)

4)数据查询

spark json解析 spark sql json_spark