一、ØMQ模式总览
  • ØMQ支持多种模式,具体可以参阅:javascript:void(0)
  • 本文介绍ØMQ的管道模式
二、管道模式
  • 管道模式在有的地方也称为“流水线”模式
  • 管道模式用于将数据分发到布置在流水线中的节点。数据始终沿流水线向下流动,流水线的每一级都连接到至少一个节点。当流水线级连接到多个节点时,数据在所有连接的节点之间进行轮询
  • 管道模式由http://rfc.zeromq.org/spec:30正式定义
  • 管道模式支持的套接字类型有4种:
    • ZMQ_PUSH
    • ZMQ_PULL
三、“PUSH-PULL”套接字类型

ZMQ_PUSH

  • 管道节点使用类型为ZMQ_PUSH的套接字将消息发送到下游流水线节点。消息循环到所有连接的下游节点
  • 该套接字类型不支持zmq_msg_recv()等接收数据的函数
  • 当ZMQ_PUSH套接字由于已达到所有下游节点的高水位线而进入静音状态时,或者如果根本没有下游节点,则套接字上的任何zmq_send()操作都应阻塞,直到静音状态结束或处于至少一个下游节点可用于发送;消息不会被丢弃
                                                                                                         ZMQ_PUSH特性摘要 
兼容的对等套接字 ZMQ_PULL
方向 单向
发送/接收模式 仅发送
入网路由策略 不适用(N/A)

外发路由策略

轮询
静音状态下的操作 阻塞

MQ_PULL

  • 管道节点使用ZMQ_PULL类型的套接字从上游管道节点接收消息
  • 消息从所有连接的上游节点中公平排队
  • 该套接字类型不支持zmq_msg_send()等发送数据的函数
                                                                                                       ZMQ_PULL特性摘要 
兼容的对等套接字 ZMQ_PUSH
方向 单向
发送/接收模式 仅接收
入网路由策略 公平排队

外发路由策略

不适用(N/A)
静音状态下的操作 阻塞
四、演示案例
  • 本文介绍的一个例子,是一个典型的并行处理模式。内容有:
    • 一台发生器(taskvent.c),它产生可以并行执行的任务
    • 一组工人(taskwork.c),用于处理任务。在现实中,工人在超快的电脑上运行,例如使用GPU(图形处理单元)来完成这个艰难的数学运算
    • 一个接收器(tasksink.c),用于收集工作进程返回的结果

重头戏!ZeroMQ的管道模式详解:ZMQ_PUSH、ZMQ_PULL_套接字

  • 发生器代码如下所示:发生器产生100个任务,每个任务包含一个消息,用来告诉工人某个休眠所需的毫秒数

// taskvent.c
// 源码链接: https://github.com/dongyusheng/csdn-code/blob/master/ZeroMQ/taskvent.c
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <assert.h>
#include <time.h>
#include <zmq.h>

#define randof(num)  (int)((float)(num) * random() / (RAND_MAX + 1.0))

// 向套接字socket发送消息string
static int s_send(void *socket, char *string);

int main()
{
    int rc;
    
    // 1.创建新的上下文
    void *context = zmq_ctx_new();
    assert(context != NULL);

    // 2.创建PUSH套接字、绑定套接字,
    //   工人会连接这个套接字, 用来给工人发送消息的
    void *sender = zmq_socket(context, ZMQ_PUSH);
    assert(sender != NULL);
    rc = zmq_bind(sender, "tcp://*:5557");
    assert(rc != -1);

    // 3.创建PUSH套接字、并连接到接收器,
    //   该套接字给接收器发送一个消息, 告诉接收器开始工作, 只使用一次
    void *sink = zmq_socket(context, ZMQ_PUSH);
    assert(sink != NULL);
    rc = zmq_connect(sink, "tcp://localhost:5558");
    assert(rc != -1);

    // 4.输入回车, 回车之后发生器开始产生任务, 并且向接收器发送一条消息, 用于指示当前发生器要开始工作了
    printf("Press Enter when the workers are ready:");
    getchar();
    printf("Sending tasks to workers...\n");

    // 随意发什么, 此处我们发送字符0
    // 如果接收器未工作, 则s_send()阻塞
    rc = s_send(sink, "0");
    assert(rc != -1);

    // 5.初始化随机数发生器
    srandom((unsigned)time(NULL));

    // 6.生成100个任务, 然后将任务发送给工人
    int task_nbr;
    int total_msec = 0;
    int workload;
    for(task_nbr = 0; task_nbr < 100; ++task_nbr)
    {
        workload = randof(100) + 1;      //生成一个毫秒数, 1-100之间
        total_msec += workload;          //加到总的毫秒数上
        char string[10];
        sprintf(string, "%d", workload);
        s_send(sender, string);          //将毫秒发送给工人
    }
    //打印总的毫秒数
    printf("Total expected cost: %d msec\n", total_msec);
    
    // 7.休眠1秒, 给ZeroMQ时间来传递消息
    sleep(1);

    // 8.关闭套接字、销毁上下文
    zmq_close(sender);
    zmq_close(sink);
    zmq_ctx_destroy(context);
    
    return 0;
}

static int s_send(void *socket, char *string)
{
    int rc;

    zmq_msg_t msg;
    zmq_msg_init_size(&msg, strlen(string));
    memcpy(zmq_msg_data(&msg), string, strlen(string));

    rc = zmq_msg_send(&msg, socket, 0);

    zmq_msg_close(&msg);
    
    return rc;
}
  • 工人代码如下所示:工人从发生器接收到消息,该消息是一个毫秒数,接收到该毫秒数之后,工人按照指定的毫秒数进行休眠,休眠完成之后发出它完成任务的信号
// taskwork.c
// 源码链接: https://github.com/dongyusheng/csdn-code/blob/master/ZeroMQ/taskwork.c
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <time.h>
#include <assert.h>
#include <zmq.h>

// 从socket上接收数据并返回
static char *s_recv(void *socket);

// 向套接字socket发送消息string
static int s_send(void *socket, char *string);


// 休眠msecs毫秒
static int s_sleep(int msecs);

int main()
{
    int rc;
    
    // 1.初始化新的上下文
    void *context = zmq_ctx_new();
    assert(context != NULL);

    // 2.创建套接字、连接发生器
    //   该套接字用来从发生器接收数据
    void *reciver = zmq_socket(context, ZMQ_PULL);
    assert(reciver != NULL);
    rc = zmq_connect(reciver, "tcp://localhost:5557");
    assert(rc != -1);
    
    // 3.创建套接字、连接接收器
    //   该套接字用来向接收器发送数据
    void *sender = zmq_socket(context, ZMQ_PUSH);
    assert(sender != NULL);
    rc = zmq_connect(sender, "tcp://localhost:5558");
    assert(rc != -1);

    // 4.永久循环处理任务
    while(1)
    {
        // 5.从发生器接收数据, 这里接收到的将是一个毫秒数
        char *string = s_recv(reciver);
        assert(string != NULL);
        //打印接收到的毫秒数
        fflush(stdout);
        printf("%s.", string);

        // 然后工人休眠指定的毫秒继续工作
        s_sleep(atoi(string));
        free(string);

        
        // 6.工人在处理完任务之后, 发送一条消息给接收器, 表示完成了一条任务
        rc = s_send(sender, "");
    }

    // 7.关闭套接字、销毁上下文
    zmq_close(reciver);
    zmq_close(sender);
    zmq_ctx_destroy(context);

    return 0;
}

static char *s_recv(void *socket)
{
    int rc;
    
    zmq_msg_t msg;
    zmq_msg_init(&msg);

    rc = zmq_msg_recv(&msg, socket, 0);
    if(rc == -1)
        return NULL;

    char *string = (char*)malloc(rc + 1);
    if(string == NULL)
        return NULL;
    memcpy(string, zmq_msg_data(&msg), rc);

    string[rc] = 0;
    
    return string;
}

static int s_send(void *socket, char *string)
{
    int rc;

    zmq_msg_t msg;
    zmq_msg_init_size(&msg, strlen(string));
    memcpy(zmq_msg_data(&msg), string, strlen(string));

    rc = zmq_msg_send(&msg, socket, 0);

    zmq_msg_close(&msg);
    
    return rc;
}

static int s_sleep(int msecs)
{ 
#if (defined (WIN32))
    Sleep (msecs);
#else
    struct timespec t;
    t.tv_sec  =  msecs / 1000;
    t.tv_nsec = (msecs % 1000) * 1000000;
    nanosleep (&t, NULL);
#endif
}
  •  接收器代码如下所示:下面是接收器的代码,它收集100条消息,然后计算整体处理用了多长时间,所以我们可以证实,如果有一个以上的工人,它们确实是并行运行的
// tasksink.c
// 源码链接: https://github.com/dongyusheng/csdn-code/blob/master/ZeroMQ/tasksink.c
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <time.h>
#include <sys/time.h>
#include <zmq.h>

// 从socket中接收数据
static char* s_recv(void* socket);

// 返回当前系统时钟,以毫秒返回
static int64_t s_clock (void);

int main()
{
    // 1.创建新的上下文
    void *context = zmq_ctx_new();

    // 2.创建、绑定套接字
    //   发生器、工人都会连接这个套接字, 并向这个套接字发送数据
    void *receiver = zmq_socket(context, ZMQ_PULL);
    zmq_bind(receiver, "tcp://*:5558");

    // 3.这是接收的第一条消息, 从发生器那里接收的, 是发生器用来告诉当前接收器, 表示开始工作了
    char *string = s_recv(receiver);
    free(string);

    // 4.启动时钟
    int64_t start_time = s_clock();

    // 5.从工人那里接收100个确认, 因为发生器只分配了100个任务给工人
    int task_nbr;
    for(task_nbr = 0; task_nbr < 100; task_nbr++)
    {
        // 6.接收数据
        char *string = s_recv(receiver);
        free(string);

        // 7.每接收10个任务打印一次:号, 其余打印.
        if((task_nbr / 10) * 10 == task_nbr)
            printf(":");
        else
            printf(".");
        fflush(stdout);
    }
    
    // 8.处理完成之后打印一下总共执行了多长时间, 也就是工人一共工作了多长时间
    printf("Total elapsed time: %d msec\n",(int)(s_clock() - start_time));

    // 9.关闭套接字、销毁上下文
    zmq_close(receiver);
    zmq_ctx_destroy(context);
    
    return 0;
}

static char* s_recv(void* socket)
{
    zmq_msg_t msg;
    zmq_msg_init(&msg);
 
    int rc = zmq_msg_recv(&msg, socket, 0);
    if(rc == -1)
        return NULL;
 
    char *string = (char*)malloc(rc + 1);
    memcpy(string, zmq_msg_data(&msg), rc);
 
    zmq_msg_close(&msg);
    string[rc] = 0;
    
    return string;
}

static int64_t s_clock (void)
{
#if (defined (WIN32))
    SYSTEMTIME st;
    GetSystemTime (&st);
    return (int64_t) st.wSecond * 1000 + st.wMilliseconds;
#else
    struct timeval tv;
    gettimeofday (&tv, NULL);
    return (int64_t) (tv.tv_sec * 1000 + tv.tv_usec / 1000);
#endif
}
  • 代码总的结构如下:

重头戏!ZeroMQ的管道模式详解:ZMQ_PUSH、ZMQ_PULL_套接字_02

  • 演示效果①,当只启用1个工作者时,效果如下:
    • 最左侧为发生器:其给工作者发送的时间时间为5032毫秒
    • 中间为工作者:从发生器那里拉取任务,打印从发生器那里处理的任务(打印秒数)
    • 最右侧为接收器:用来在工作者完成工作时打印工作的总时间,可以看到只有1个工作者时显示的是5050毫秒,与发生器指定的差不多

重头戏!ZeroMQ的管道模式详解:ZMQ_PUSH、ZMQ_PULL_管道模式_03

  • 演示效果②,当启用2个工作者时,效果如下:
    • 最左侧为发生器:其给工作者发送的时间时间为5098毫秒
    • 中间的2个为工作者:从发生器那里拉取任务,打印从发生器那里处理的任务(打印秒数)
    • 最右侧为接收器:用来在工作者完成工作时打印工作的总时间,可以看到有2个工作者时显示的是2687毫秒,说明有两个工作者并行工作时,时间被平分

重头戏!ZeroMQ的管道模式详解:ZMQ_PUSH、ZMQ_PULL_管道模式_04

  • 演示效果③,当启用3个工作者时,效果如下:
    • 最左侧为发生器:其给工作者发送的时间时间为5598毫秒
    • 中间的3个为工作者:从发生器那里拉取任务,打印从发生器那里处理的任务(打印秒数)
    • 最右侧为接收器:用来在工作者完成工作时打印工作的总时间,可以看到有3个工作者时显示的是1945毫秒,说明工作者越多,任务处理的越快

重头戏!ZeroMQ的管道模式详解:ZMQ_PUSH、ZMQ_PULL_消息队列ZeroMQ_05

五、模式总结
  • 工人向上连接到发生器,并且向下连接到接收器。这意味着你可以随意添加工人。 因此,发生器和接收器是架构的固定部分,而工人是动态部分
  • 我们必须同步开始同批次的所有工人的启动和运行。这是ZeroMQ中存在的一个相当普遍的疑难杂症,并没有简单的解决办法。connect方法需要一定的时间,所以当一组工人连接到发生器时,第一个成功连接的工人会在这短短的时间得到消息的整个负载,而其他工人仍在进行连接。如果不知何故批次的开始不同步,那么系统就将无法并行运行
  • 发生器的PUSH套接字将任务均匀地分配给工人。这就是所谓的负载均衡,以后还会详细介绍
  • 接收器的PULL套接字均匀地收集来自工人的结果。这就是所谓的公平排队(如下图所示)

重头戏!ZeroMQ的管道模式详解:ZMQ_PUSH、ZMQ_PULL_管道模式_06

管道模式也有类似“慢木匠”的现象

  • 它导致了对PUSH套接字不能正确地负载均衡的指责。如果你使用的是PUSH和PULL,并且你的某个工人得到比其他工人更多的信息,这是因为PULL套接字已比别人更快地连接,并在其他工人试图连接之前抓取了很多消息。

  • 我是小董,V公众点击"笔记白嫖"解锁更多【ZeroMQ】资料内容。

重头戏!ZeroMQ的管道模式详解:ZMQ_PUSH、ZMQ_PULL_消息队列ZeroMQ_07