测试CPU负载
在一般的嵌入式设备上都会有 hardware watchdog存在,它的意义是当你系统发生异常情况的时候,可以让你的嵌入式设备进行自动重启,而不是阻塞在被卡住的位置,如果系统在没有watchdog的情况下,Linux 发生Panic的时候,也可以触发自动重启。目前我们的嵌入式设备遇到了自动重启的问题,但是没有panic的Log,所以怀疑是Watchdog没有定期喂狗造成的重启。所以需要伪造一个坏境,让watchdog异常。
watchdog的工作原理
watchdog 简称是WDT(Watch Dog Timer),是一种定时装置。由(一般需要客户编写)软件读写定时器相关的寄存器,打开看门狗,并设定计数时间(以秒或分钟计算),定时器计数计满,由软件清零,以表明系统状态正常,这时,定时器计数重新开始,反复,否则,看门狗认为系统异常或有其他特定事件发生,触发系统复位信号,或提供中断,系统正常后重复定时器计数。只要软件正常运行,就不会出现复位或触发中断。当软件死机或运行出错时,由看门狗定时器对系统进行复位或触发中断,从而保证系统的正常运行。看门狗的定时时间可以由用户设定,这样可以根据需要在指定的时间内复位系统。
伪造CPU负载
在我这个问题里面,首先应该确认watchdog是开启的,才能伪造CPU负载的情况查看watchdog是否会异常。ps查看:
我使用的是 openssl speed -multi 4 命令,后面的4是当前设备的CPU核数量,你可以通过cat /proc/cpuinfo 查看你当前的嵌入式设备的核数。
openssl的性能测试主要就是测试在固定时间内、不同长度数据操作的次数。所以会比较吃CPU,可以通过这个命令伪造CPU满载运行的情况。
使用top查看CPU负载情况:
发现只有usr的占用率过高,尝试使用中断来占用一些CPU的资源,由于我的嵌入式产品是一台网络设备,所以我只需要跑一些throughput
就很容易的伪造一些软中断出现。我跑throughput的工具是iperf3,不做介绍。
这下比较明显的看到,中断处理将usr的cpu占用分去了一些,idle(空闲)还是0,但是保持这个场景我运行了12小时,没有触发我想要的watchdog异常的状况。
使用memtester
memtester是一个内存压力测试程序,其实就是为了测试内存(主要DDR)的读写访问可靠性(仅正确性,与速度性能无关),这是验证板级硬件设备必不可少的一项测试。我们在上面的测试基础上,使用memtester 10k命令来追加到上面的测试中。执行成功标志如下:(memtester 10k 5)
这个由于指定了执行次数,所以只执行了5次,如果命令不指定次数,默认会一直循环执行。通过这样的测试场景执行大概十分钟,很快就触发了我们想要的结果: