1、性能测试分析与调优
1)tomcat配置和调优
①设置Tomcat堆内存,优化新生代老年代之间的比例 垃圾回收机制
visualvm工具:监控GC和线程死锁问题
②修改Tomcat线程数 配置Tomcat最大链接数,配置
③修改日志级别,让日志记录不要太频繁
④JVM GC:设置新生代老年代比例,老年代大一些2倍,调大堆内存也是GC优化
⑤visual监控java程序,监控死锁,查看新生代老年代回收次数和速率
2)Nginx调优
①配置负载策略,不同的策略也会产生不同的性能,权重,ip_hash
②nginx还可以配置前端界面图片和其他某些格式的压缩
3)MySQL调优
①设置mysql最大连接数
②mysql慢查询优化,加索引,加外键索引(ref级别),加唯一索引,主键索引等各种索引
2、分析与调优的过程
①性能现象:tps,rt,错误率有没有问题,有问题的话这就是现象,没有达标,值超了,有问题进入下一步
②全局定向:cpu,内存,磁盘,网络
③局部剖析:进程,配置,代码、架构层
3、简单场景分析
场景:假设压测完成后cpu一直下不来
看服务器资源情况,使用grafana查看,一段时间对比
Jmeter压测结束后查看grafana监控发现 user+system 系统加用户加起来一起差不多25% cpu下不来
分析服务器 top
分析java进程 容器级别
找到这个一直使用资源的进程 jps和top 是pid 7 一直使用cpu在25%左右
到底是哪一个线程导致的cpu高 查看一个进程里开辟的线程参数:top -H -p 7
7是进程号,H查看线程资源,p通过进程id查看指定进程的状态
看到是pid=77的线程占用资源
进程的线程分析 堆栈信息,堆栈记录了所有线程的东西,线程有问题,堆栈一定能看到
jstack 7 > miaosha.txt 把进程为7的堆栈信息写入txt文件便于分析
在堆栈信息里面记录了线程的信息,使用的线程id tid==77 线程号 ,堆栈信息文件里的线程号一般使用,16进制记录的
找到日志信息给研发
4、redis相关击穿/雪崩现象解读
redis缓存击穿:一个数据,少量数据访问,改加载的没加载,这时候导致击穿到db获取数据。
一个值拿不到还是要去击穿缓存去db里拿数据。
比如:查询aaa对应键的值redis缓存没有,没有就去db数据库拿,拿完之后可能写到缓存,这就是击穿。
redis避免频繁访问数据库,redis本身就是保护db,tomcat想去拿数据做一层保护,保护db让去缓存拿数据。
缓存的key设置一定时间,比如2天,隔多久更新一次,在刚好过期的时间点上大量请求发到redis。
这时候redis没这个资源的,还会去数据库请求数据。
这个时候拿不到,就去数据库拿,被击穿了,失去保护的意义了大量击穿,最后造成雪崩。