DataStream API 主要分为 块: DataSource Transformation, Sink
 
DataSource 
数据源组件,是程序的数据源输入,可以通过 StreamExecutionEnvironment. addSource( sourceFunction)为程序添加1个数据源
 
 
 
Transformation
表示算子,主要用来 对数据进行处理,是具体的操作,它对一个或多个输入数据源进行计算处理,比如 Map FlatMap Filter 等操作
 
 
 
Sink
是程序的输出,它可以把Transformation 处理之后的数据输出到指定的存储介质中。
 
 

因此,想要组装一个Flink Job,至少需要这3个组件。

Flink Job=Source+Transformation+Sink