目录
OSI 的七层网络结构模型
RPC服务
RPC架构
同步调用与异步调用
流行的 RPC 框架
HTTP 服务
gRPC简介
重温RPC相关概念
gRPC是什么?
gRPC组成
gRPC的特性
gRPC的优点
典型的gRPC实现
测试gRPC的server
测试gRPC的client
性能测试
监控
Tracing
grpc gateway
最本质的区别就是 RPC 主要是基于 TCP/IP 协议的,而 HTTP 服务主要是基于 HTTP 协议的。HTTP 协议是在传输层协议 TCP 之上的,所以效率来看的话,RPC 当然是要更胜一筹啦!
OSI 的七层网络结构模型
Ps:实际应用过程中,五层协议结构里面是没有表示层和会话层的。应该说它们和应用层合并了。
它可以分为以下几层:(从上到下)
- 第一层:应用层。定义了用于在网络中进行通信和传输数据的接口。
- 第二层:表示层。定义不同的系统中数据的传输格式,编码和解码规范等。
- 第三层:会话层。管理用户的会话,控制用户间逻辑连接的建立和中断。
- 第四层:传输层。管理着网络中的端到端的数据传输。
- 第五层:网络层。定义网络设备间如何传输数据。
- 第六层:链路层。将上面的网络层的数据包封装成数据帧,便于物理层传输。
- 第七层:物理层。这一层主要就是传输这些二进制数据。
Ps:我们应该将重点放在应用层和传输层这两个层面。因为 HTTP 是应用层协议,而 TCP 是传输层协议。
RPC服务
从三个角度来介绍 RPC 服务,分别是:
- RPC架构
- 同步异步调用
- 流行的RPC框架
RPC架构
一个完整的 RPC 架构里面包含了四个核心的组件。
分别是:
- Client
- Server
- Client Stub
- Server Stub(这个Stub大家可以理解为存根)
分别说说这几个组件:
- 客户端(Client),服务的调用方。
- 服务端(Server),真正的服务提供者。
- 客户端存根,存放服务端的地址消息,再将客户端的请求参数打包成网络消息,然后通过网络远程发送给服务方。
- 服务端存根,接收客户端发送过来的消息,将消息解包,并调用本地的方法。
RPC 主要是用在大型企业里面,因为大型企业里面系统繁多,业务线复杂,而且效率优势非常重要的一块,这个时候 RPC 的优势就比较明显了。实际的开发当中是这么做的,Java项目一般使用 Maven 来管理。
比如我们有一个处理订单的系统服务,先声明它的所有的接口(这里就是具体指 Java 中的 Interface),然后将整个项目打包为一个 jar 包,服务端这边引入这个二方库,然后实现相应的功能,客户端这边也只需要引入这个二方库即可调用了。
为什么这么做?主要是为了减少客户端这边的 jar 包大小,因为每一次打包发布的时候,jar 包太多总是会影响效率。另外也是将客户端和服务端解耦,提高代码的可移植性。
同步调用与异步调用
什么是同步调用?什么是异步调用?同步调用就是客户端等待调用执行完成并返回结果。
异步调用就是客户端不等待调用执行完成返回结果,不过依然可以通过回调函数等接收到返回结果的通知。如果客户端并不关心结果,则可以变成一个单向的调用。
这个过程有点类似于 Java 中的 Callable 和 Runnable 接口,我们进行异步执行的时候,如果需要知道执行的结果,就可以使用 Callable 接口,并且可以通过 Future 类获取到异步执行的结果信息。
如果不关心执行的结果,直接使用 Runnable 接口就可以了,因为它不返回结果,当然啦,Callable 也是可以的,我们不去获取 Future 就可以了。
流行的 RPC 框架
目前流行的开源 RPC 框架还是比较多的。下面重点介绍三种:
①gRPC 是 Google 最近公布的开源软件,基于最新的 HTTP2.0 协议,并支持常见的众多编程语言。
我们知道 HTTP2.0 是基于二进制的 HTTP 协议升级版本,目前各大浏览器都在快马加鞭的加以支持。
这个 RPC 框架是基于 HTTP 协议实现的,底层使用到了 Netty 框架的支持。
②Thrift 是 Facebook 的一个开源项目,主要是一个跨语言的服务开发框架。它有一个代码生成器来对它所定义的 IDL 定义文件自动生成服务代码框架。
用户只要在其之前进行二次开发就行,对于底层的 RPC 通讯等都是透明的。不过这个对于用户来说的话需要学习特定领域语言这个特性,还是有一定成本的。
③Dubbo 是阿里集团开源的一个极为出名的 RPC 框架,在很多互联网公司和企业应用中广泛使用。协议和序列化框架都可以插拔是及其鲜明的特色。
同样的远程接口是基于 Java Interface,并且依托于 Spring 框架方便开发。可以方便的打包成单一文件,独立进程运行,和现在的微服务概念一致。
HTTP 服务
在接口不多、系统与系统交互较少的情况下,解决信息孤岛初期常使用的一种通信手段;优点就是简单、直接、开发方便,可以利用现成的 HTTP 协议进行传输。
对于大型企业来说,内部子系统较多、接口非常多的情况下,RPC 框架的好处就显示出来了,首先就是长链接,不必每次通信都要像 HTTP 一样去 3 次握手什么的,减少了网络开销。
其次就是 RPC 框架一般都有注册中心,有丰富的监控管理;发布、下线接口、动态扩展等,对调用方来说是无感知、统一化的操作。
RPC 服务和 HTTP 服务还是存在很多的不同点的,一般来说,RPC 服务主要是针对大型企业的,而 HTTP 服务主要是针对小企业的,因为 RPC 效率更高,而 HTTP 服务开发迭代会更快。
总之,选用什么样的框架不是按照市场上流行什么而决定的,而是要对整个项目进行完整地评估,从而在仔细比较两种开发框架对于整个项目的影响,最后再决定什么才是最适合这个项目的。
一定不要为了使用 RPC 而每个项目都用 RPC,而是要因地制宜,具体情况具体分析。
gRPC简介
重温RPC相关概念
试想这样一种场景,一个复杂系统中的两个模块之间需要互相调用,一般的做法是什么?
可能这两个模块是跑在同一个进程上,那么通信起来其实是非常方便的,也有可能这两个模块分别是跑在不同的进程之上,那么就涉及到复杂一点的跨进程通信的技术了。但这些都是模块部署在同一机器下的情景,大家想象起来也会比较容易。
更加深入一些,如果两个模块跑在不同的机器之间,那么模块之前的调用如何实现呢?这就需要使用RPC技术了。
RPC(Remote Procedure Call)— 远程过程调用,它是一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在,如TCP或UDP,为通信程序之间携带信息数据。在OSI网络通信模型中,RPC跨越了传输层和应用层。RPC使得开发包括网络分布式多程序在内的应用程序更加容易。
RPC采用客户端/服务器模式。请求程序就是一个客户端,而服务提供程序就是一个服务器。首先,客户端调用进程发送一个有进程参数的调用信息到服务进程,然后等待应答信息。在服务器端,进程保持睡眠状态直到调用信息到达为止。当一个调用信息到达,服务器获得进程参数,计算结果,发送答复信息,然后等待下一个调用信息,最后,客户端调用进程接收答复信息,获得进程结果,然后调用执行继续进行。
简单来说RPC需要server端和client端,server端定义一些函数,client端通过网络请求去调用这些函数拿到返回值。server端和client端跑在不同的机器上,结合微服务的概念就是server端就是一个独立的微服务,其他微服务需要通过启动client端来调用该微服务提供的服务。
gRPC是什么?
gRPC 一开始由 Google 开发,是一款语言中立、平台中立、开源的远程过程调用(RPC)系统。
在 gRPC 里客户端应用可以像调用本地对象一样直接调用另一台不同的机器上服务端应用的方法,使得您能够更容易地创建分布式应用和服务。与许多 RPC 系统类似,gRPC 也是基于以下理念:定义一个服务,指定其能够被远程调用的方法(包含参数和返回类型)。在服务端实现这个接口,并运行一个 gRPC 服务器来处理客户端调用。在客户端拥有一个存根能够像服务端一样的方法。
gRPC组成
典型的grpc实现有两端组成,分别是
- server
- client
gRPC的特性
- 由于client和server需要通过网络进行消息的传递,那么网络协议成了grpc里重要的一环。grpc协议是HTTP/2,这是一种优化过的http协议,实现了连接多路复用、双向流、服务器推送、请求优先级、首部压缩等机制。可以节省带宽、降低TCP链接次数、节省CPU,帮助移动设备延长电池寿命等。
- 服务端向外提供了一些可供调用的函数,这些函数的原型通过ProtoBuf协议来进行定义。ProtoBuf是由Google开发的一种数据序列化协议(类似于XML、JSON、hessian)。ProtoBuf能够将数据进行序列化,并广泛应用在数据存储、通信协议等方面。压缩和传输效率高,语法简单,表达力强。
- 支持多种编程语言。比如支持golang/java/c++/ruby/python/nodejs等。
gRPC的优点
- 使用protobuf进行消息的序列化,压缩率高,性能好,毕竟压缩的越小在网络上传播的速度就相对会更快一点
- 序列化反序列化直接对应程序中的数据类,不需要解析后在进行映射,其实除了可读性差之外,pb的使用方式跟json基本都差不多了
- 支持向前兼容和向后兼容,升级比较简单
- 支持多语言
典型的gRPC实现
典型的gRPC实现有3个部分,分别是
- 服务定义,使用protobuf的语法
- server端实现,可以使用任意支持的语言
- client端实现,可以使用任意支持的语言
这里我们简单演示一下如何使用python实现简单的grpc server和client。
服务定义:
// The greeting service definition.
service Greeter {
// Sends a greeting
rpc SayHello (HelloRequest) returns (HelloReply) {}
// Sends another greeting
rpc SayHelloAgain (HelloRequest) returns (HelloReply) {}
}
// The request message containing the user's name.
message HelloRequest {
string name = 1;
}
// The response message containing the greetings
message HelloReply {
string message = 1;
}
server端实现:
class Greeter(helloworld_pb2_grpc.GreeterServicer):
def SayHello(self, request, context):
return helloworld_pb2.HelloReply(message='Hello, %s!' % request.name)
def SayHelloAgain(self, request, context):
return helloworld_pb2.HelloReply(message='Hello again, %s!' % request.name)
...
client端实现:
def run():
channel = grpc.insecure_channel('localhost:50051')
stub = helloworld_pb2_grpc.GreeterStub(channel)
response = stub.SayHello(helloworld_pb2.HelloRequest(name='you'))
print("Greeter client received: " + response.message)
response = stub.SayHelloAgain(helloworld_pb2.HelloRequest(name='you'))
print("Greeter client received: " + response.message)
测试gRPC的server
其实跟接口测试的概念差不多,使用client stub去调用server,然后进行断言就好了。简而言之就是写代码去调用server端提供的函数,然后做断言。
测试gRPC的client
这一部分对大家来说可能不太好想象,有一种做法是mock client,实现client的一系列调用server的mock方法,然后把client代入正常的业务逻辑,最后做逻辑或流程正确与否的判断。
举个例子,比如有个微服务使用client调用了a和b两个函数,那么就mock掉a和b的client端实现,最后在正常的业务逻辑结束之后,断言client先调用了a再调用了b。这种mock的方式之前在做单元测试的时候非常的普遍,一般是用来mock掉网络请求或者是数据库连接,用在rpc的client测试上就显得比较有意思了。
性能测试
推荐使用ghz。
ghz · gRPC benchmarking and load testing tool,可参考:Grpc性能压测方法:用ghz进行压测By李佶澳
监控
一般可以使用下面的两种方案
- OpenCensus
- Prometheus
Tracing
因为微服务之前的调用链路很复杂,所以需要使用tracing来进行调用链的跟踪。这里可以简单的使用OpenCensus Jaeger exporter来实现,可参考:OpenCensus
grpc gateway
在测试和调式的时候,每次写client去调用server其实是一件比较麻烦的事情,grpc gateway提供了一种简单的方式把grpc转成restful形式的接口,这样就可以直接使用postman等工具进行调试和测试了。
但在实际使用过程中,grpc-gateway也存在一些问题:
1.灵活性不够,如果有一些比较特殊的需求,在grpc-gateway中能扩展的余地不大;
2.严重依赖protocol buffer,而且必须是protobuf 3
3.即使grpc服务的接口不变,只是修改HTTP接口定义,也必须重新生成代码,也就必须重新部署,重启服务
4.只支持JSON格式的输入,不支持传统的kv格式的参数
5.只支持grpc,但thrift也很普及,是不是?
6.grpc-gateway在错误处理等方面可能不够成熟,现在活跃度还挺高,应该好多了
参考: