如何查看spark任务执行日志 spark任务状态监控

转载

lingyuli 2024-02-26 14:33:29

文章标签 如何查看spark任务执行日志 JSON 代码记录运行时间 文章分类 Spark 大数据

1. Spark监控页

进入对应的application

如何查看spark任务执行日志 spark任务状态监控_代码记录

进入Tracking URL

如何查看spark任务执行日志 spark任务状态监控_JSON_02

选择Streaming

如何查看spark任务执行日志 spark任务状态监控_代码记录_03

2. 监控指标

Input Size 每个批次处理输入数据大小（如多少条日志）

如何查看spark任务执行日志 spark任务状态监控_JSON_04

Processing Time 每个批次处理时间

如何查看spark任务执行日志 spark任务状态监控_运行时间_05

Scheduling Delay 每个批次延迟时间

如何查看spark任务执行日志 spark任务状态监控_JSON_06

Status 每个批次的状态 queued排队等待，processing正在执行

如何查看spark任务执行日志 spark任务状态监控_如何查看spark任务执行日志_07

Active Batches 执行中/等待中的批次

如何查看spark任务执行日志 spark任务状态监控_JSON_08

Completed Batches 已完成的批次信息

3. 调整Spark的batch time

如何查看spark任务执行日志 spark任务状态监控_代码记录_09

观察Spark监控页中的“Completed Batches”和“Active Batches”（注意观察Input Size不为0的批次），如果每个批次的处理时间在可接受的范围内，而“Active Batches”中Status列中有很多批次都在排队等待，如图示：

如何查看spark任务执行日志 spark任务状态监控_JSON_10

这时需要调大Spark的批次处理时间，消除排队等待的任务。

如何查看spark任务执行日志 spark任务状态监控_如何查看spark任务执行日志_11

如何查看spark任务执行日志 spark任务状态监控_运行时间_12

4. 分配足够的资源

选择耗时较长的batch，点击进入选择耗时较长的Job id，点击进入选择耗时较长的stage，点击进入进入了stage的详情页，可以看到该stage划分的tasks数量，分配的executor数量，

如何查看spark任务执行日志 spark任务状态监控_代码记录_13

理想情况下num-executors * executor-cores >= tasks数量，这样所有task都可以并行跑，不过需要根据集群的资源而定。

5. 避免循环调用低效的接口

如果分配给Job的资源足够（主要是executor-memory，num-executors，executor-cores），tasks并发度高，每个task的运行时间太长，可能需要分析业务代码，或许是业务代码中循环调用了一些低效的接口，这个时候可能需要在代码记录log，缩小范围来确定问题

比如：对每一个RDD的每一个元素调用如下接口，

logger.info("############## start JSON.parseFull ")
  val JsonString = JSON.parseFull(log)
  logger.info("############## start JSON.parseFull ")

log打印

2016-10-19 10:21:01,402 | INFO  | [Executor task launch worker-0] | ############## start JSON.parseFull
2016-10-19 10:21:01,406 | INFO  | [Executor task launch worker-0] | ############## start JSON.parseFull

发现该接口每处理一条日志，都耗时在4ms以上；RDD中的每一个元素都需要调用该接口，如果一个RDD中的元素有几千条，耗时就有几秒甚至十几秒了。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：Java 视频链接推流 java实现流媒体

下一篇：阿里设计规范 java 注释阿里代码注释规范

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯