coredump文件
通常情况下
core文件会包含程序运行时的内存,寄存器状态,堆栈指针,内存管理信息还有各种函数调用堆栈信息等
coredump文件的存储位置
core文件的存储位置在/proc/sys/kernel/core_pattern文件里面进行描述
一般缺省值为core,表示在当前进程工作目录下创建
Linux系统默认的情况不产生段错误文件
可以通过下面的命令来查看系统默认段错误文件的大小:
ulimit -c 一般显示的结果是0
可以通过以下两条命令设置段错误文件大小为2048blocks和大小不受限制:
ulimit -c unlimited
ulimit -c 2048
单位是blocks,一般1block=512bytes
注意以上在终端中输入只是暂时的,若要永久生效需要把以上命令之一加入到/etc/profile或者/文件中。
可能发生coredump的原因
出现段错误时,首先应该想到段错误的定义,从它出发考虑引发错误的原因。
1、在使用指针时,定义了指针后记得初始化指针,在使用的时候记得判断是否为NULL。
2、在使用数组时,注意数组是否被初始化,数组下标是否越界,数组元素是否存在等。
3、在访问变量时,注意变量所占地址空间是否已经被程序释放掉。
4、在处理变量时,注意变量的格式控制是否合理等。
总结(一般可能引起core dump的情况)
1.内存访问越界
使用错误的下标,导致数组访问越界
查找字符串时,依靠字符串结束符来判断字符是否结束,但字符串没有正常的使用结束符
使用strcpy, strcat, sprintf, strcmp,strcasecmp等字符串操作函数,将目标字符串读/写爆。应该使用strncpy, strlcpy, strncat, strlcat, snprintf, strncmp, strncasecmp等函数防止读写越界
2.多线程程序使用了线程不安全的函数
3.多线程读写的数据未加锁保护
对于会被多个线程同时访问的全局数据,应该注意加锁保护,否则很容易造成coredump
4.非法指针
使用空指针
随意使用指针转换类型,(如果这段内存的开始地址不是按照这种结构或类型对齐的,那么访问它时会很容易因为bus error,而core dump)
4.堆栈溢出
不要使用大的局部变量(因为局部变量都分配在栈上),这样容易造成堆栈溢出,破坏系统的栈和堆结构,导致出现莫名其妙的错误
core dump的信号
SIGABRT
调用abort函数时产生此信号。进程异常终止。
SIGBUS
指示一个实现定义的硬件故障。
SIGEMT
指示一个实现定义的硬件故障。EMT这一名字来自PDP-11的emulator trap指令。
SIGFPE
此信号表示一个算术运算异常,例如除以0,浮点溢出等。
SIGILL
此信号指示进程已执行一条非法硬件指令。4.3BSD由abort函数产生此信号。SIGABRT现在被用于此。
SIGIOT
这指示一个实现定义的硬件故障。IOT这个名字来自于PDP-11对于输入/输出TRAP(input/output TRAP)指令的缩写。系统V的早期版本,由abort函数产生此信号。SIGABRT现在被用于此。
SIGQUIT
当用户在终端上按退出键(一般采用Ctrl-/)时,产生此信号,并送至前台进程组中的所有进程。此信号不仅终止前台进程组(如SIGINT所做的那样),同时产生一个core文件。
SIGSEGV
指示进程进行了一次无效的存储访问。名字SEGV表示“段违例(segmentation violation)”。
SIGSYS
指示一个无效的系统调用。由于某种未知原因,进程执行了一条系统调用指令,但其指示系统调用类型的参数却是无效的。
SIGTRAP
指示一个实现定义的硬件故障。此信号名来自于PDP-11的TRAP指令。
SIGXCPUSVR4和4.3+BSD支持资源限制的概念。如果进程超过了其软C P U时间限制,则产生此信号。
SIGXFSZ
如果进程超过了其软文件长度限制,则SVR4和4.3+BSD产生此信号。