文首,思考一个问题:为什么需要 RPC 服务?

在传统的开发模式中,我们通常将系统的各个服务部署在单台机器,随着服务的扩展,这种方式已经完全无法满足系统大规模的扩展需要,分布式系统由此诞生,在分布式系统中,最重要就是各个服务之间的 RPC 调用。

RPC 全称 Remote Procedure Call——远程过程调用,它是一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络技术的方式。简单一点就是:通过一定协议和方法使得调用远程计算机上的服务,就像调用本地服务一样。

通常来说,RPC 的实现方式有很多,可以基于常见的 HTTP 协议,也可以在TCP上层封装自定义协议,常见的 Web Service 就是基于 HTTP 协议的 RPC,HTTP 协议的优点是具有良好的跨平台性,特别适合异构系统较多的公司,但是由于 HTTP 报头较为冗长,性能较差,基于 TCP 协议的 RPC 可以建立长连接,速度和效率明显,但是难度和复杂程度很高。

RPC 的诞生让构建分布式应用更容易,极大的扩大系统的可扩展性,容错性。为复杂业务逻辑的系统进行服务化改造和高可用性升级提供了可能。

RPC 调用分类

RPC 调用的分类方式有很多种。

从通信协议层面可以分为:

基于 HTTP 协议的 RPC;

基于二进制协议的 RPC;

基于 TCP 协议的 RPC。

从是否跨平台可分为:

单语言 RPC,如 RMI, Remoting;

跨平台 RPC,如 google protobuffer, restful json,http XML。

从调用过程来看,可以分为同步通信RPC和异步通信RPC:

同步 RPC:指的是客户端发起调用后,必须等待调用执行完成并返回结果;

异步 RPC:指客户方调用后不关心执行结果返回,如果客户端需要结果,可用通过提供异步 callback 回调获取返回信息。大部分 RPC 框架都同时支持这两种方式的调用。

RPC 框架结构

RPC 服务方的主要职责是提供服务,供客户端调用访问,服务端会通过一个接收器接受客户端的调用请求,根据相应的 RPC 协议进行解码获取调用方法以及相关参数,当调用完成后,服务器端通过后台处理模块处理完成并将结果返回给客户端。

对于客户端来说,服务调用完全透明,像调用本地服务一样调用远程方法,客户端调用服务时候通过一个远程连接和服务端建立通道,并通过相应的协议进行编码,将调用的方法和相关参数发送给服务方。

上 手 篇

RPC 模块详解

下面我们根据上面的RPC的架构图,对图中的各个模块进行拆解,并解释每个模块的作用。

服务端(Server):RPC 服务的提供者,负责将 RPC 服务导出;

客户端 (Client):RPC 服务的消费者,负责调用 RPC 服务;

代理(Proxy):通过动态代理,提供对远程接口的代理实现;

执行器(Invoker):对于客户端:主要负责服务调用的编码,调用请求发送和等待结果返回;对于服务方:负责处理调用逻辑并返回调用结果;

协议管理(Protocol):协议管理组件,负责整个 RPC 通信协议的编/解码;

连接端口(Connector):负责维持客户方和服务方的长连接通道;

后台处理(Processor):负责整个调用服务中的管理调度,包括线程池,分发,异常处理等;

连接通道(Channel):客户端和服务器端的数据传输通道。

具体到 JAVA 平台来说,其中的3,4通常使用动态代理实现,5,6,7,8使用 NIO 或者一些高性能 NIO 框架,如 mina,netty 实现。

最简单的 RPC JAVA 实现

在进一步拆解了组件并划分了职责之后,这里以一个最简单 Java RPC 框架实现为例,对 RPC 具体逻辑进行分析。

RPC 框架服务发布代码:

服务端发布服务的代码如上,首先校验传入的端口和服务是否合法,然后开启一个 socket 监听,这儿为了简便,没有采用 NIO 方式,同时直接采用 java 的序列化方式,将传入的数据通过反射取出调用的方法和参数,本地执行后将运行结果通过 socket 套接字返回给客户端。

RPC 框架服务调用代码:

框架中客户端调用的代码中,首先校验对应的端口和主机是否合法,然后通过动态代理生成一个代理对象,在代理对象的方法中,拦截调用,通过建立 socket 连接,将方法和参数传递到远端执行并获取远程执行返回结果。

RPC 调用测试:

思 考 篇

自定义 RPC 协议

协议头

在上面的示例程序当中,我们仅仅是完成了一个基本的远程调用,并没有实现 RPC 框架中的很多组件功能,从最简单的代码版本中我们可以发现,发起一个 RPC 调用,需要传输的最基本数据如下:

接口方法:包括接口的名字和相应的方法名字;

方法参数:包括参数的类型和取值;

附件参数,包括调用接口版本,接口超时时间等等。

因此,如果要自定义协议实现 RPC,我们必须再协议的消息体中包含这部分数据,另外,我们需要定义一些协议元数据,这些元数据通常放在协议头中,和包含必要参数的协议体一期组成了自定义消息。

元数据通常会包含以下字段,大部分字段只需要1-2位:

magic: 魔数,方便协议解码

header_size: 协议头大小,便于解码,同时可用用于处理TCP粘包问题

id :消息 id,用来标示这次调用

version: 接口版本

type:消息类型,可用包括普通调用消息,心跳,控制消息

status:消息状态,是否首次处理或者已经处理

body_size: 消息体长度

serialize_type:消息体序列化类型

body:具体消息

具体消息

消息内容在网络上传输需要对其进行编码,这个编码的过程就是序列化过程,显然,对于网络传输的数据,在能够保证信息足够解码的情况下,序列化的大小越小,传输的开销就越小,效率就越高,目前 JAVA 平台常用的序列化方式有:xml,json ,binary(包括 thrift; hession; kryo 等)。

在 RPC 调用中我们推荐使用二进制方式进行序列化,在大部分的测试中,二进制方式序列化具有相当好的表现,另外一个比较有意思的地方是,每一次 JDK 版本的升级,JAVA 自带的序列化方式的效率都有提升。

服务端调用优化

从前面的示例代码中,我们仅仅简单的考虑了实现了组件中的服务端和客户端,并没有考虑效率问题,在一个完整的 RPC 框架中,我们需要考虑实现并优化调用的每一个地方,同时,为了符合业务需求,需要有很高的可靠性和容错机制。

具体来说,在动态代理模块,我们不会采用 java 自带的动态接口,而是会采用一些性能更高的三方库,在连接通道和连接模块,我们会采用更优秀的三方NIO,如 netty 来实现,在后端处理模块,我们也不会仅仅是执行结果并返回,要考虑更多的东西:

并发控制:当多个请求并发处理的时候,如何管理和控制线程池和超时等待时间;

版本隔离:当服务有多个版本的时候,如何让不同的调用者能够调用正确的服务;

服务路由:当服务提供者有多台机器的时候,如何提高系统负载均衡,路由到正确的服务端;

服务降级:当多个服务重要性有不同的时候,如果保证核心业务的稳定性,适当的降低非核心业务优先级;

服务监控和报警:服务出现异常情况时候,运维和对应的系统负责人能够第一时间得到告警和错误信息。

以上的思考大部分要结合运维层面一起考虑,但是 RPC 框架本身也要提供足够的支持才能保证它足够的健壮性。

需要注意的一些地方

虽然 RPC 有足够多的优点让你去使用,但是当真正转向服务化的时候,依然有很多需要考虑的地方:

网络问题:本地调用无需考虑是否能够执行问题,网络调用可能会因为各种外部网络环境,端口拦截,IP 受限等可能情况导致无法成功执行。所以 RPC 的服务端通常要考虑幂等性和容错性,接口需要较强的鲁棒性设计。

异常处理:RPC 和本地服务最大的不同就是 RPC 服务存在分布式一致性问题,当服务没有调用成功情况下,本地和远程的服务可能处于一个不一致的状态,如何进行异常处理和事物的回滚机制也是一个需要考虑的问题,是需要保障强一致性和最终一致性通常取决于具体的业务需求。

由于网络原因,RPC 服务通常会被本地服务处理慢一个数量级,在比较轻量级的业务和并发量很小的情况下,并不需要 RPC 服务,引入 RPC 服务后,无论是系统的调试,还是线上问题分析都会变得非常复杂,是否引入也需要权衡相关利弊。

文末小结

本文简单的介绍了 RPC 的基本知识和相关分析以供抛砖引玉,进一步的学习可以参考当前最主流的一些 RPC 框架,如dubbo, protobuff ,thrift 通过对其源码的深入学习,相信能获益匪浅。