Redis底层还是基于网络请求的,对于单机数据库而言,网络请求仅仅是在一台机器上交互,即服务器客户端都在一台计算机上
当在终端输入redis-serve时,便启动了一个Redis服务器,随后开始初始化内部数据,对于Redis而言包括
读取配置文件初始化内部参数
创建默认数据库(默认为16个)
创建监听套接字并绑定回调函数(接收客户端连接请求)
执行事件驱动循环,开始响应客户端请求
…
当在终端输入redis-cli时,遍启动了一个客户端
到这里可以简单的猜测一下,Redis的命令交互流程大致为
启动一个客户端,请求连接到服务器
服务器接收客户端请求,建立连接成功,服务器开始监听客户端文件描述符并绑定回调函数
客户端输入命令,导致服务器端监听的文件描述符变为可读,服务器开始读取命令
服务器解析命令,并调用对应的命令处理函数
服务器将处理结果反馈给客户端
客户端文件描述符变为可读,读取反馈信息,输出在终端
上述是一个常见的C/S模型,Redis采用Reactor模式处理连接,Reactor模式就是常说的使用io多路复用函数监听客户端的方法。不过Redis是单线程下的Reactor,在常见的高并发服务器设计模型中可以使用Reactor+线程池的方法提高并发性(也叫one loop per thread,muduo网络库采用的设计模型)
关于redis单线程的理解: redis只是在处理客户端的请求时使用一条线程来处理, 即在一个线程内处理所有的客户端连接请求. redis的瓶颈不在于redis本身的操作, 而是在于网络连接请求. 在这个线程中监听的事件包括: 客户端连接请求, 客户端命令请求...(还有需要监听的其他事件??)
在redis-server启动时先注册一个客户端连接请求事件. 之后进入事件监听.
如果监听到客户端连接请求(接收完了请求数据), 则执行回调函数acceptTcpHandler, 在redis服务端创建一个client结构体数据, 并继续向该线程注册该客户端的命令请求监听
如果监听到客户端命令请求(接收完了请求数据), 则执行回调函数readQueryFromClient,解析该命令并执行并写入客户端套接字的描述符中
在该线程中监听到事件并执行回调函数是单线程的,同步的,每个回调函数执行结束后才会触发下一个回调函数的执行,所以说redis的每个命令操作都是单线程, 即非并发的. 如此如果redis内部的执行命令是个长时间的操作会导致整个redis阻塞
下面就从源代码的角度体会服务器和客户端交互的流程(只截取关键部分)
服务器与客户端的交互流程
服务器监听客户端连接
当服务器启动时,首先执行的是server.c/main函数,如上所述,main函数进行了大量初始化工作,其中有一项就是创建监听套接字
//server.c
int main(int argc, char **argv) {
...
/* 初始化服务器,创建监听套接字 */
initServer();
...
}
initServer函数中同样进行了大量初始化工作,其中的一部分是创建监听套接字
//server.c
/* 服务器启动时调用,初始化服务器 */
void initServer(void) {
...
/* 创建监听套接字 */
/* ipfd_count是监听套接字的数量 */
for (j = 0; j < server.ipfd_count; j++) {
if (aeCreateFileEvent(server.el, server.ipfd[j], AE_READABLE,
acceptTcpHandler,NULL) == AE_ERR)
{
serverPanic(
"Unrecoverable error creating server.ipfd file event.");
}
}
...
}
创建监听套接字由函数aeCreateFileEvent函数实现
//ae.c
/*
* 创建文件事件(事件驱动)
* eventLoop : 服务器的事件驱动循环数组
* fd : 文件描述符
* mask : 需要监听的事件
* proc : 回调函数
* clientData: 传给回调函数的参数
*/
int aeCreateFileEvent(aeEventLoop *eventLoop, int fd, int mask,
aeFileProc *proc, void *clientData)
{
/* 如果要创建的文件描述符大于服务器规定的大小,则报错 */
if (fd >= eventLoop->setsize) {
errno = ERANGE;
return AE_ERR;
}
/* 返回服务器事件驱动循环中的第fd个事件 */
aeFileEvent *fe = &eventLoop->events[fd];
/* 将文件描述符和其需要监听的事件添加到io多路复用函数中 */
if (aeApiAddEvent(eventLoop, fd, mask) == -1)
return AE_ERR;
/* 将监听事件保存在事件驱动中 */
fe->mask |= mask;
/* 设置回调函数 */
if (mask & AE_READABLE) fe->rfileProc = proc;
if (mask & AE_WRITABLE) fe->wfileProc = proc;
/* 设置参数 */
fe->clientData = clientData;
if (fd > eventLoop->maxfd)
eventLoop->maxfd = fd;
return AE_OK;
}
函数中的aeEventLoop是事件驱动循环,保存所有正在监听的事件,当io复用返回时,会将所有以激活的事件也保存在aeEventLoop中以便于处理,和libevent中的事件驱动循环作用相同
aeFileEvent是对事件的封装,内部保存有监听的文件描述符,监听的事件以及回调函数,和libevent中的事件(event)作用相同
接收客户端连接请求
另外对于传给aeCreateFileEvent函数的回调函数,可以猜测它的作用主要就是调用accept函数接收客户端连接请求,建立与客户端关联的文件描述符,注册到io复用中。它的定义如下
//networking.c
/* 服务器监听套接字的回调函数,用于接收客户端的连接请求 */
void acceptTcpHandler(aeEventLoop *el, int fd, void *privdata, int mask) {
int cport, cfd, max = MAX_ACCEPTS_PER_CALL;
char cip[NET_IP_STR_LEN];
while(max--) {
/* 调用accept接收客户端连接请求,返回与客户端关联的文件描述符 */
cfd = anetTcpAccept(server.neterr, fd, cip, sizeof(cip), &cport);
...
/* 根据文件描述符创建客户端实例(client对象),用于与客户端交互 */
acceptCommonHandler(cfd,0,cip);
}
}
每当接收到一个客户端请求时,服务器都会根据客户端文件描述符创建一个客户端实例(client类型),client是服务器与客户端交互的桥梁,客户端输入的所有命令都是读取到client中的缓冲区再进行处理的
创建客户端实例
创建客户端实例的函数定义如下
//networking.c
/*
* 根据客户端文件描述符创建客户端实例
* fd : 接收客户端连接请求时返回的文件描述符
* ip : 客户端地址<ip, port>
*/
static void acceptCommonHandler(int fd, int flags, char *ip) {
client *c;
/* 以客户端文件描述符创建客户端实例 */
if ((c = createClient(fd)) == NULL) {
serverLog(LL_WARNING,
"Error registering fd event for the new client: %s (fd=%d)",
strerror(errno),fd);
close(fd); /* May be already closed, just ignore errors */
return;
}
...
}
该函数调用createClient,执行真正创建客户端实例的操作
//networking.c
/* 根据文件描述符创建与客户端的连接 */
client *createClient(int fd) {
/* 申请client大小的内存空间 */
client *c = zmalloc(sizeof(client));
if (fd != -1) {
/* 设置成非阻塞io */
anetNonBlock(NULL,fd);
anetEnableTcpNoDelay(NULL,fd);
/* keep-alive选项 */
if (server.tcpkeepalive)
anetKeepAlive(NULL,fd,server.tcpkeepalive);
/* 为这次连接创建事件,监听可读事件, 回调函数为readQueryFromClient */
if (aeCreateFileEvent(server.el,fd,AE_READABLE,
readQueryFromClient, c) == AE_ERR)
{
close(fd);
zfree(c);
return NULL;
}
}
...
}
创建与文件描述符关联的事件和上面相同,只是这里的回调函数变为readQueryFromClient,因为这个连接不是为了接收客户端连接请求,而是用于接收客户端的输入命令。
处理客户端输入的命令
当客户端输入命令后,会执行相应的回调函数readQueryFromClient,该函数主要调用read函数从客户端文件描述符中读取输入的命令
//networking.c
/* 当客户端可读时的回调函数 */
void readQueryFromClient(aeEventLoop *el, int fd, void *privdata, int mask) {
client *c = (client*) privdata;
int nread, readlen;
readlen = PROTO_IOBUF_LEN;
/* 为缓冲区申请空间,用于保存客户端命令 */
c->querybuf = sdsMakeRoomFor(c->querybuf, readlen);
/* 从客户端读取命令,保存在c->querybuf中 */
nread = read(fd, c->querybuf+qblen, readlen);
...
/* 处理客户端命令 */
processInputBuffer(c);
processInputBuffer函数根据客户端选项执行不同的操作,最终调用processCommand函数处理命令,这个函数会先解析客户端的命令关键字,判断这个关键字是否合法。如果合法,再判断参数个数是否合法
//server.c
/* 解析客户端命令,先判断命令关键字是否合法,再判断参数个数是否合法 */
int processCommand(client *c) {
...
/* 从命令字典中查找该命令名字,判断是否存在该命令 */
/* 将命令保存在cmd中,其中包括命令对应的处理函数 */
c->cmd = c->lastcmd = lookupCommand(c->argv[0]->ptr);
...
if(...)
{
...
}
else
{
//调用命令处理函数
call(c,CMD_CALL_FULL);
...
}
}
可以看到这个函数主要是解析命令关键字,从底层字典中查找是否有这个关键字,如果有,会连同命令对应的处理函数一起返回赋值给cmd变量中,cmd变量是struct redisCommand *类型,稍后可以看到用处
call函数的定义如下
//server.c
/* 调用命令处理函数 */
void call(client *c, int flags) {
...
/* 调用命令回调函数 */
c->cmd->proc(c);
...
}
命令结构
Redis内部已经将每个命令以及其对应的处理函数包装好,这个结构就是struct redisCommand,其中两个比较重要的成员变量为
//server.h
struct redisCommand {
char *name; //命令关键字
redisCommandProc *proc;//处理函数
...
};
到这里可以猜到,在processCommand函数中调用lookupCommand函数时,会查找是否有相应命令关键字的结构,如果有,则返回到cmd变量中。现在可以看一下Redis内部是如果包装每一个命令的了
struct redisCommand redisCommandTable[] = {
{"get",getCommand,2,"rF",0,NULL,1,1,1,0,0},
{"set",setCommand,-3,"wm",0,NULL,1,1,1,0,0},
{"setnx",setnxCommand,3,"wmF",0,NULL,1,1,1,0,0},
{"setex",setexCommand,4,"wm",0,NULL,1,1,1,0,0},
{"psetex",psetexCommand,4,"wm",0,NULL,1,1,1,0,0},
...
};
原来Redis已经为每个命令设计好了struct redisCommand结构,但是查找是否有命令关键字却不是直接从这个“超大”的数组中一个个找,那样太慢了。Redis内部是将每个命令关键字和它对应的struct redisCommand结构记录在一个字典中,由于字典(底层由哈希表实现)的查找效率是O(1),所以不会造成性能瓶颈
获取到相应的命令结构后,同样也获取了命令处理函数,对于get命令而言是getCommand,对于set命令而言是setCommand,大概就是命令关键字后加Command是对应的命令处理函数
所以上述c->cmd->proc(c)函数调用时便直接调用了相应的处理函数,处理完成后,将反馈发送给客户端,完成一次交互
交互模型总结:
0.创建epoll
1.redis服务器启动创建监听套接字socket_server,注册到epoll中, 注册的监听事件为读事件, 回调函数为acceptTCP
2.acceptTCP函数中, 注册socket_client到epoll, 注册的监听事件为读事件, 回调函数为querycommand
3.querycommand函数中, 进行命令查询或写操作, 然后将结果写入到redisClient的缓冲中, 之后注册socket_client到epoll, 注册的监听事件为写事件, 回调函数为sendreplyToclient(换言之redis查询到结果不是立即返回给客户端, 而是等客户端的套接字文件可写后再写入, 所以再为写事件创建一个监听)
4.sendreplyToclient函数将客户端的查询结果写入到socket_client中, 并从epoll中将该socket_client对应的些时间注销
关于redis单线程模型:
所谓的单线程模型是指main方法启动的这个线程, 在一系列初始化和向epoll注册完监听事件后, main方法就进入到监听状态(循环等待有监听到的事件到来, 每次循环都会调用epoll_wait方法获取已经监听到的事件
), 所有监听到事件后对应的回调函数都是在main方法这个线程下执行的, 如果监听到多个事件则他们的回调方法是依次执行的, 所以说是单线程. 至于监听哪个事件发生了是由内核执行, 与main这个方法的线程无关
(redis在main方法的线程中, 主动向epoll中注册要监听的事件, 并且要主动去epoll中拉取已经监听到发生的事件)