在编写服务进程的时候,经常有这样一个需求:保证服务进程只有一个实例在运行。
为实现这个简单的功能,有下面各种常见的实现方式:
1. 通过已知的进程名,来查询是否有同名的进程正在运行。
可以利用proc,也可以读取ps的输出等;
由于进程号可能被其他进程覆盖,所以必须确保改pid下的启动服务就是我们要的程序路径
找到某进程启动路径的方法是:
1.我们可以从ps命令中得到僵死进程的PID,如上例中23347
2.进入/proc目录下以该PID命名的目录中
3.输入ls -ail,结果中 exe链接对应的就是可执行文件的全路经详细信息
2. 利用pid文件,这也是linux各种服务常见的实现方式:
服务进程启动的时候,首先在指定目录下,一般为/var/run/,查找是否已经存在对应该进程的pid文件。
如果已经存在,表明有同样的进程在运行。但是也许该进程意外崩溃,所以需要进一步检查。读取该pid文件,获得pid。
然后再利用确定该pid的进程是否存在。如存在,是否为同名进程。
如果这个executable有多个进程在运行,那么我们得到的就是多个pid.这里的pid文件可能需要自己写入。
当然,我们还看到过lock file,一般都放在/var/lock/subsys/目录下面,如果一个deamon已经启动了,那么它的lock文件就应该存在了。
上面两种方式,是我以前常用的方法。后来,我更倾向于下面这种利用flock文件锁的方式。
闲话不说,见代码:
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <errno.h>
#include <sys/file.h>
#include <unistd.h>
#include <my_basetype.h>
static int g_single_proc_inst_lock_fd = -1;
static void single_proc_inst_lockfile_cleanup(void)
{
if (g_single_proc_inst_lock_fd != -1) {
close(g_single_proc_inst_lock_fd);
g_single_proc_inst_lock_fd = -1;
}
}
B_BOOL is_single_proc_inst_running(const char *process_name)
{
char lock_file[128];
snprintf(lock_file, sizeof(lock_file), "/var/tmp/%s.lock", process_name);
g_single_proc_inst_lock_fd = open(lock_file, O_CREAT|O_RDWR, 0644);
if (-1 == g_single_proc_inst_lock_fd) {
fprintf(stderr, "Fail to open lock file(%s). Error: %s\n",
lock_file, strerror(errno));
return B_FALSE;
}
if (0 == flock(g_single_proc_inst_lock_fd, LOCK_EX | LOCK_NB)) {
atexit(single_proc_inst_lockfile_cleanup);
return B_TRUE;
}
close(g_single_proc_inst_lock_fd);
g_single_proc_inst_lock_fd = -1;
return B_FALSE;
}
注:这个代码由我自定义的类型,如B_BOOL。感兴趣的同学,可以自行更改。
is_single_proc_inst_running为关键函数,返回true,则表明只有一个进程实例在运行(本进程)。返回false则表明已有同名进程在运行了。
利用非阻塞的文件锁,对相应的文件进行上锁。成功获得文件锁的时候,就排斥了其它实例再次拿锁。在进程退出时,无论是正常退出还是意外崩溃的时候,Linux内核本身都会关闭该文件描述符。
当文件关闭时,文件锁都会被释放。这样新的服务进程可以再次启动。
但是我在写这个代码时,还是利用atexit,实现了对该文件描述符的关闭。即使加了这个不必要的实现,这份代码仍然比最早提出的两种方式要简单的多。
这份代码没有考虑多线程竞争,因为没有必要。一般来说,检测进程唯一实例应该是在进程刚刚启动的时候。那时,应该只有一个线程。