线上故障_51CTO博客
线上故障排查完整套路 - 从 CPU、磁盘、内存、网络、GC CPU 磁盘 内存 GC问题 网络 线上故障主要会包括cpu、磁盘、内存以及网络问题,而大多数故障可能会包含不止一个层面的问题,所以进行排查时候尽量四个方面依次排查一遍。 同时例如jstack、jmap等工具也是不囿于一个方面的问题的,基
原创
Soy
2021-08-10 16:53:04
263阅读
##墨菲定律任何事情都没有表面看起来那么简单所有事情的发展都会比你预计的时间长会出错的事情总会出错如果担心某个事情发生,那么它更有可能发生墨菲定律暗示我们,如果担心某种情况会发生,那么它更有可能发生,久而久之就一定会发生。这警示我们,在互联网公司,对生成环境发生的任何怪异现象和问题都不要轻视,对其背后的原因一定要调查清楚。同样,海恩法则也强调任何严重的事故背后都是很多次小问题的积累,当到一定量级后
原创 精选 2018-02-27 18:52:33
10000+阅读
4点赞
2评论
前言 说起线上故障,程序员应该都经历过,从故障处理恢复过程中我们能快速提高。踩坑多了,慢慢也就成了大牛。这道题也是大厂的面试官们特别喜欢问的问题之一,从候选人对这道题的回答过程中...
转载 2020-12-14 08:57:00
153阅读
2评论
墨菲定律任何事情都没有表面看起来那么简单所有事情的发展都会比你预计的时间长会出错的事情总会出错如果担心某个事
原创 2021-12-31 16:49:51
338阅读
      Java线上故障主要会包括 CPU、磁盘、内存以及网络问题,而大多数故障可能会包含不止一个层面的问题,所以进行排查时候尽量四个方面依次排查一遍。同时例如 jstack、jmap 等工具也是不囿于一个方面的问题的,基本上出问题就是 df、free、top 三连,然后依次 jstack、jmap 伺候,具体问题具体分析。     
原创 2023-02-17 10:19:20
245阅读
概述线上故障通常是指大规模的影响线上服务可用性的问题或者事件,通俗点讲就是:掉‘坑’里了,这个‘坑’就是线上故障线上故障的处理过程可以形象地表达为:‘踩坑’、‘跳坑’、‘填坑’、‘避坑’。线上故障的处理不仅是一项技术活,更是对技术人员/技术团队反应能力、决策能力、判定能力、组织能力的考验。面对突发的生产故障,需要快速定位问题,找到解决方案,快速实施解决方案并不是一件容易的事情。本文主要包括如下内
转载 2017-05-04 18:34:30
414阅读
Linux,关注的是四个元素:内存,cpu,存储,网络。Linux1.1 CPU1.2 内存1.3 存储使用df -h查看系统磁盘使用概况lsblk 列出块设备信息du 查看目录或者文件大小1.4 网络一、CPU 飚高如何定位问题呢?思路:首先找到 CPU 飚高的那个 Java 进程,因为你的服务器会有多个 JVM 进程。然后找到那个进程中的 “问题线程”,最后根据线程堆栈信息找到问题代码。最后对
JVM
转载 2021-06-04 08:48:47
278阅读
本文主要是以常见的线上问题进行模拟,然后介绍定位问题的方法。1.环境准备:基础环境 jdk1.8,采用 SpringBoot 框架来写几个接口来触发模拟场景,首先是模拟 CPU 占满情况2.问题列举2.1 cpu占用率较高模拟cpu占用率较高,实现方法较简单,用一个死循环占用cpu计算即可。代码模拟:/** * 模拟CPU占满 */ @GetMapping("/cpu/
作者:飒然Hang https://www.rowkey.me/blog/2018/11/22/online debug/ 线上运行的Java应用突然没有响应、响应缓慢,进程突然消失,遇到这些情况应该如何应对呢? 推荐去我的博客阅读更多: 1. "Java JVM、集合、多线程、新特性系列教程" 2
原创 2021-05-25 13:26:02
207阅读
线上故障主要会包括 cpu、磁盘、内存以及 网络 问题,而大多数故障可能会包含不止一个层面的问题,所以进行排查时候尽量四个方面依次排查一遍。同时例如 jstack 、jmap 等工具也是不囿于一个方面的问题的,基本上出问题就是 df、free、top 三连,然后依次 jstack、jmap 伺候,具体问题具体分析即可。CPU一般来讲我们首先会排查cpu方面的问题。 cpu异常往往还是比较好定位的。
线上故障主要会包括cpu、磁盘、内存以及网络问题,而大多数故障可能会包含不止一个层面的问题,所以进行排查时候尽量四个方面依次排查一遍。同时例如jstack、jmap等工具也是不囿于一个方面的问题的,基本上出问题就是df、free、top 三连,然后依次jstack、jmap伺候,具体问题具体分析即可。CPU一般来讲我们首先会排查cpu方面的问题。cpu异常往往还是比较好定位的。原因包括业务逻辑问题
转载 2021-04-29 19:53:07
188阅读
2评论
        笔记本+联通无线上网。安全卫士360查出rojan/win32.delf.qh的木马。        删除,可是出现一个问题,查杀后无线上网程序删除,不能上网。每次都需要再重新安装一次。不知何原因。
原创 2008-03-10 08:40:26
1122阅读
1评论
线上故障分析-故障分级,原因,分类,混沌工程,排除方法_架构_Ybb_s
原创 2022-11-06 00:21:39
195阅读
最近想总结这块,网上搜索到的,写的不错,有需求的朋友可以看下、学习总结下如何快速处理线上故障http://www.cnblogs.com/daoqidelv/p/6785372.html#_label1http://www.jianshu.com/p/08eae8ad08ac
转载 2017-08-16 10:55:53
915阅读
#概述 线上故障通常是指大规模的影响线上服务可用性的问题或者事件,通俗点讲就是:掉‘坑’里了,这个‘坑’就是线上故障线上故障的处理过程可以形象地表达为:‘踩坑’、‘跳坑’、‘填坑’、‘避坑’。 线上故障的处理不仅是一项技术活,更是对技术人员/技术团队反应能力、决策能力、判定能力、组织能力的考验。面 ...
转载 2021-09-06 18:07:00
183阅读
2评论
线上项目遇到问题无法调试,线下又无法重现,难道只能加日志再重新发布么?有了这款神器,既可以线上调试,又可以实现热修复,推荐给大家!Arthas 简介 Arthas是Alibaba开源的Java诊断工具,深受开发者喜爱。它采用命令行交互模式,同时提供丰富的 Tab 自动补全功能,进一步方便进行问题的定位和诊断。安装 为了还原一个真实的线上环境,我们将通过Arthas来对Docker容器中的Java程
转载 2023-11-25 19:33:50
58阅读
线上故障主要会包括cpu、磁盘、内存以及网络问题,而大多数故障可能会包含不止一个层面的问题,所以进行排查时候尽量四个方面依次排查一遍。同时例如jstack、jmap等工具也是不囿于一个方面的问题的,基本上出问题就是df、free、top 三连,然后依次jstack、jmap伺候,具体问题具体分析即可。CPU一般来讲我们首先会排查cpu方面的问题。cpu异常往往还是比较好定位的。原因包括业务逻辑问
原创 2021-02-09 20:21:47
201阅读
    前言 CPU 飚高 内存问题排查 总结 前言 对于后端程序员,特别是 Java 程序员来讲,排查线上问题是不可避免的。各种 CPU 飚高,内存溢出,频繁 GC 等等,这些都是令人头疼的问题。楼主同样也遇到过这些问题,那么,遇到这些问题该如何解决呢? 首先,出现问题,肯定要先定位问题所在,然后分析问题原因,再然后解决问题,最后进行总结,防止下次再次出现。 今天的文章,就如
jvm
转载 2021-07-26 15:55:44
72阅读
线上故障主要会包括cpu、磁盘、内存以及网络问题,而大多数故障可能会包含不止一个层面的问题,所以进行排查时候尽量四个方面依次排查一遍。同时例如jstack、jmap等工具也是不囿于一个方面的问题的,基本上出问题就是df、free、top 三连,然后依次jstack、jmap伺候,具体问题具体分析即可。
转载 2021-07-28 16:20:05
265阅读
    作者:莫那一鲁道   前言 对于后端程序员,特别是 Java 程序员来讲,排查线上问题是不可避免的。各种 CPU 飚高,内存溢出,频繁 GC 等等,这些都是令人头疼的问题。楼主同样也遇到过这些问题,那么,遇到这些问题该如何解决呢? 首先,出现问题,肯定要先定位问题所在,然后分析问题原因,再然后解决问题,最后进行总结,防止下次再次出现。 今天的文章,就如我们的题目一样,讲的是基本操作,也就
转载 2021-09-15 11:42:08
58阅读
  • 1
  • 2
  • 3
  • 4
  • 5