在Standalone模式下,Spark中各个组件之间交互还是比较复杂的,但是对于一个通用的分布式计算系统来说,这些都是非常重要而且比较基础的交互。首先,为了理解组件之间的主要交互流程,我们给出一些基本要点:
一个Application会启动一个Driver
一个Driver负责跟踪管理该Application运行过程中所有的资源状态和任务状态
一个Driver会管理一组Executor
一个Executor只执行属于一个Driver的Task
核心组件之间的主要交互流程,如下图所示:
上图中,通过不同颜色或类型的线条,给出了如下6个核心的交互流程,我们会详细说明:
橙色:提交用户Spark程序
用户提交一个Spark程序,主要的流程如下所示:
- 用户spark-submit脚本提交一个Spark程序,会创建一个ClientEndpoint对象,该对象负责与Master通信交互
- ClientEndpoint向Master发送一个RequestSubmitDriver消息,表示提交用户程序
- Master收到RequestSubmitDriver消息,向ClientEndpoint回复SubmitDriverResponse,表示用户程序已经完成注册
- ClientEndpoint向Master发送RequestDriverStatus消息,请求Driver状态
- 如果当前用户程序对应的Driver已经启动,则ClientEndpoint直接退出,完成提交用户程序
总结:提交driver程序!!!!!!!!!!!!!!!!!
紫色:启动Driver进程
当用户提交用户Spark程序后,需要启动Driver来处理用户程序的计算逻辑,完成计算任务,这时Master协调需要启动一个Driver,具体流程如下所示:
- Maser内存中维护着用户提交计算的任务Application,每次内存结构变更都会触发调度,向Worker发送LaunchDriver请求
- Worker收到LaunchDriver消息,会启动一个DriverRunner线程去执行LaunchDriver的任务
- DriverRunner线程在Worker上启动一个新的JVM实例,该JVM实例内运行一个Driver进程,该Driver会创建SparkContext对象
总结:启动Driver程序,创建SparkContext对象!!!!!!!!!!!!!!!!!!
红色:注册Application
Dirver启动以后,它会创建SparkContext对象,初始化计算过程中必需的基本组件,并向Master注册Application,流程描述如下:
- 创建SparkEnv对象,创建并管理一些基本组件
- 创建TaskScheduler,负责Task调度
- 创建StandaloneSchedulerBackend,负责与ClusterManager进行资源协商
- 创建DriverEndpoint,其它组件可以与Driver进行通信
- 在StandaloneSchedulerBackend内部创建一个StandaloneAppClient,负责处理与Master的通信交互
- StandaloneAppClient创建一个ClientEndpoint,实际负责与Master通信
- ClientEndpoint向Master发送RegisterApplication消息,注册Application
- Master收到RegisterApplication请求后,回复ClientEndpoint一个RegisteredApplication消息,表示已经注册成功
总结:像master注册,Application对象!!!!!!!!!!!!!!!!!!!!!
蓝色:启动Executor进程
- Master向Worker发送LaunchExecutor消息,请求启动Executor;同时Master会向Driver发送ExecutorAdded消息,表示Master已经新增了一个Executor(此时还未启动)
- Worker收到LaunchExecutor消息,会启动一个ExecutorRunner线程去执行LaunchExecutor的任务
- Worker向Master发送ExecutorStageChanged消息,通知Executor状态已发生变化
- Master向Driver发送ExecutorUpdated消息,此时Executor已经启动
总结:master像woker发送消息,启动Executor !!!!!!!!!!!!!!!!!!!!!
粉色:启动Task执行
- StandaloneSchedulerBackend启动一个DriverEndpoint
- DriverEndpoint启动后,会周期性地检查Driver维护的Executor的状态,如果有空闲的Executor便会调度任务执行
- DriverEndpoint向TaskScheduler发送Resource Offer请求
- 如果有可用资源启动Task,则DriverEndpoint向Executor发送LaunchTask请求
- Executor进程内部的CoarseGrainedExecutorBackend调用内部的Executor线程的launchTask方法启动Task
- Executor线程内部维护一个线程池,创建一个TaskRunner线程并提交到线程池执行
总结:Executor 启动 task 执行 程序 !!!!!!!!!!!!!!!!!!!!!
绿色:Task运行完成
- Executor进程内部的Executor线程通知CoarseGrainedExecutorBackend,Task运行完成
- CoarseGrainedExecutorBackend向DriverEndpoint发送StatusUpdated消息,通知Driver运行的Task状态发生变更
- StandaloneSchedulerBackend调用TaskScheduler的updateStatus方法更新Task状态
- StandaloneSchedulerBackend继续调用TaskScheduler的resourceOffers方法,调度其他任务运行