hue是一个Apache Hadoop ui系统,本篇文章介绍如何使用hue创建一个ozzie的pyspark action的workflow, 该workflow仅包含一个spark action。注意,本文使用的是python语言的pyspark。
- 编写一个python操作spark的程序。
demo.py
from pyspark.sql import SparkSession
spark = SparkSession.builder.enableHiveSupport().appName(
"demo").getOrCreate()
# spark 的一些操作
.......
- 新建workflow
传入需要运行的python脚本
- 对该action 进行一些属性的配置。
对spark进行设置,可以选择spark的运行模式。
默认使用的是spark1 的库去执行,如果使用的是spark2,则需要设置属性oozie.action.sharelib.for.spark=spark2
如图所示。
进入2设置,进行一些变量的设置
oozie.libpath 需要使用到spark的一些jar包,填入路径jar包路径。
4. 该workflow已经设置成功,可以对其进行运行进行测试。
欢迎关注,互相学习,共同进步~
我的个人博客
我的微信公众号:编程黑洞