目录

 

关于RPC

RPC基本原理

本地过程调用

远程过程调用带来的新问题

什么是gRPC

为什么用gPRC

gPRC的特性

基于HTTP/2协议标准

基于强大的IDL(Interface description language)


关于RPC

RPC是指远程过程调用,也就是说两台服务器A、B,一个应用部署在A服务器上,想要调用B服务器上应用提供的函数/方法,由于不在一个内存空间,不能直接调用,需要通过网络来表达调用的语义和传达调用的数据。

RPC基本原理

本地过程调用

RPC就是要像调用本地的函数一样去调远程函数。在研究RPC前,我们先看看本地调用是怎么调的。假设我们要调用函数Multiply来计算lvalue * rvalue的结果:

本地调用示例
 

int Multiply(int l, int r) {
   int y = l * r;
   return y;
}
int lvalue = 10;
int rvalue = 20;
int l_times_r = Multiply(lvalue, rvalue);

那么在倒1行时,我们实际上执行了以下操作:

将 lvalue 和 rvalue 的值压栈
进入Multiply函数,取出栈中的值10 和 20,将其赋予 l 和 r
执行第2行代码,计算 l * r ,并将结果存在 y
将 y 的值压栈,然后从Multiply返回
第8行,从栈中取出返回值 200 ,并赋值给 l_times_r
以上5步就是执行本地调用的过程。

远程过程调用带来的新问题

在远程调用时,我们需要执行的函数体是在远程的机器上的,也就是说,Multiply是在另一个进程中执行的。这就带来了几个新问题:

Call ID映射。

我们怎么告诉远程机器我们要调用Multiply,而不是Add或者FooBar呢?在本地调用中,函数体是直接通过函数指针来指定的,我们调用Multiply,编译器就自动帮我们调用它相应的函数指针。但是在远程调用中,函数指针是不行的,因为两个进程的地址空间是完全不一样的。所以,在RPC中,所有的函数都必须有自己的一个ID。这个ID在所有进程中都是唯一确定的。客户端在做远程过程调用时,必须附上这个ID。然后我们还需要在客户端和服务端分别维护一个 {函数 <--> Call ID} 的对应表。两者的表不一定需要完全相同,但相同的函数对应的Call ID必须相同。当客户端需要进行远程调用时,它就查一下这个表,找出相应的Call ID,然后把它传给服务端,服务端也通过查表,来确定客户端需要调用的函数,然后执行相应函数的代码。

序列化和反序列化。

客户端怎么把参数值传给远程的函数呢?在本地调用中,我们只需要把参数压到栈里,然后让函数自己去栈里读就行。但是在远程过程调用时,客户端跟服务端是不同的进程,不能通过内存来传递参数。甚至有时候客户端和服务端使用的都不是同一种语言(比如服务端用C++,客户端用Java或者Python)。这时候就需要客户端把参数先转成一个字节流,传给服务端后,再把字节流转成自己能读取的格式。这个过程叫序列化和反序列化。同理,从服务端返回的值也需要序列化反序列化的过程。

网络传输。

远程调用往往用在网络上,客户端和服务端是通过网络连接的。所有的数据都需要通过网络传输,因此就需要有一个网络传输层。网络传输层需要把Call ID和序列化后的参数字节流传给服务端,然后再把序列化后的调用结果传回客户端。只要能完成这两者的,都可以作为传输层使用。因此,它所使用的协议其实是不限的,能完成传输就行。尽管大部分RPC框架都使用TCP协议,但其实UDP也可以,而gRPC干脆就用了HTTP2。Java的Netty也属于这层的东西。

所以,要实现一个RPC框架,其实只需要把以上三点实现了就基本完成了。

  • Call ID映射可以直接使用函数字符串,也可以使用整数ID。映射表一般就是一个哈希表。
  • 序列化反序列化可以自己写,也可以使用Protobuf或者FlatBuffers之类的。
  • 网络传输库可以自己写socket,或者用asio,ZeroMQ,Netty之类。

什么是gRPC

gRPC是由Google提供的一个高性能、通用性强的RPC开源框架,它主要面向移动应用开发。

定义:(Google Remote Procedure Protocol)谷歌远程过程调用,根据官方文档对grpc的介绍,grpc可以让客户端程序直接调用服务端不同主机上应用的方法,就像调用本地方法一样,方便我们创建分布式应用和服务。

在gRPC里客户端应用可以像调用本地对象一样直接调用另一台不同的机器上服务端应用的方法,使得您能够更容易地创建分布式应用和服务。与许多RPC系统类似,gRPC也是基于以下理念:定义一个服务,指定其能够被远程调用的方法(包含参数和返回类型)。在服务端实现这个接口,并运行一个gRPC服务器来处理客户端调用。在客户端拥有一个存根能够像服务端一样的方法。

gRPC客户端可以再多种环境中运行与交互- 从Google内部的服务器到自己的笔记本,并且可以用任何gRPC支持的语言来编写。所以,你可以很容易地用Java创建一个gRPC服务端,用Go、Python、Ruby来创建客户端。此外,Google最新API将有gRPC版本的接口,使你很容易地将Google的功能集成到你的应用里。

gRPC默认使用protocol buffers,这是google开源的一套成熟的数据结构序列化机制(当然也可以使用其他数据格式如JSON)。正如你将在下方例子里所看到的,你用protocolfiles创建gRPC服务,用protocol buffers消息类型来定义方法参数和返回类型

总结:gRPC是一个高性能、通用的开源RPC框架,其由Google主要面向移动开发并基于HTTP/2协议标准而设计,基于protoBuf(Protocol Buffers)序列化协议开发,且支持众多开发语言。gRPC提供了一种简单的方法来精确地定义服务为iOS、Android和后台支持服务自动生成可靠性很强的客户端功能库。客户端充分利用高级流和连接功能,从而有助于节省宽带、降低TCP链接次数、节省CPU使用和电池寿命。

注:RPC的实现思路大同小异,以动态代理为例,定义好接口,用一个代理假装实现了这个接口(真正的实现放在服务端),供客户端调用,代理内部将该方法调用封装成一个网络请求发送到服务端。服务端根据参数找到对应的注册好的对象进行处理,返回给客户端。

在gRPC中,客户端应用程序可以就像调用本地对象方法一样直接调用不同服务器上的应用程序方法,使您更容易创建分布式应用程序和服务。与许多RPC系统一样,gRPC基于定义服务的思想,定义可以远程调用的方法,包括方法的参数和返回类型。在服务器端,服务器实现此接口并运行一个gRPC服务器来处理客户端调用。在客户端,客户端有一个“存根stub”(简称为某些语言的客户端),提供与服务器相同的方法。所有的数据传输都使用protobuf。

为什么用gPRC

它使用HTTP2协议,可复用链接,更充分的利用底层TCP传输协议,并以数据流的方式传输,比其他基于HTTP1的传输速率更高。
它基于Proto Buffer语言,对传输数据进行压缩、系列化和结构化,易于客户端与服务端数据的读写操作,并使数据量传输变得更小、传输效率更高。
基于以上及其他特性,使得基于gRPC的客户端和服务端更高效的利用流和链接,从而有助于节省宽带流量、降低链接次数、提高CPU使用效率和电池的使用寿命。

gPRC的特性

基于HTTP/2协议标准

  • 什么是HTTP/2协议?

HTTP 2.0即超文本传输协议2.0,是下一代HTTP协议(基于二进制的传输协议)。是由互联网工程任务组(IETF)的Bis(httpbis)工作小组进行开发。

  • HTTP/2的优点
  1. http2减少了网络往返传输的数量,并且用多路复用和快速丢弃不需要的流的办法来完全避免head of line blocking(线头阻塞)的困扰,降低延迟并提高安全性。
  2. 支持大量并行流,所以即使网站的数据分发在各处也不是问题。
  3. 合理利用流的优先级,可以让客户端尽可能优先收到更重要的数据。

gRPC基于HTTP/2标准设计,所以相对于其他RPC框架,gRPC带来了更多强大功能,如双向流、头部压缩、多复用请求等。这些功能给移动设备带来重大益处,如节省带宽、降低TCP链接次数、节省CPU使用和延长电池寿命等。同时,gRPC还能够提高了云端服务和Web应用的性能。gRPC既能够在客户端应用,也能够在服务器端应用,从而以透明的方式实现客户端和服务器端的通信和简化通信系统的构建。

基于强大的IDL(Interface description language)

gPRC基于ProtoBuf(Protocol Buffers)定义接口规范。

  • lProtoBuf是什么?

Protocol Buffers是google提供的一种轻便、高效、简单的数据存储语言,可以用于结构化、序列化数据。

  • 为什么要使用ProtoBuf?

适合应用场景:它很适合做数据存储或RPC数据交换格式。可用于通讯协议、数据存储等领域的语言无关、平台无关、可扩展的序列化数据结构。

  • 支持语言众多(提供了完善的API):Proto2提供了C++、Java、Python三种语言的API。目前语言版本Proto3提供了更多的语言支持,包括C++、C#、GO、JAVA、PYTHON。
  • 易学易懂:protoBuf语法非常简单,容易掌握,便于读写。