一丶 简介
假设你正在为购物应用开发一个手机客户端,好像你需要实现一个产品详情页,用来展示任何给定的产品的详细信息。
举个例子,下图展示了你在Amazon的android手机客户端上滚动看到的产品详情页。
Amazon手机客户端上的产品详情页
即使这是一个智能手机上的应用,产品详情页一样展示了很多信息。例如,不仅有基本的产品信息(如名称、描述和价格),而且这个页面还展示了:
购物车中的商品数量
历史订单数
用户评论
低库存的预警
发货选项
各种推荐,包括经常和本产品一起被购买的其他产品,购买该产品的顾客购买的其他产品,还有购买该产品的顾客查看的其他产品
当你使用单体应用架构时,手机客户端可以简单地通过一个REST接口检索到该数据。一个负载均衡器将请求路由到N个相同的应用实例中的一个。然后这个应用实例查询多张数据库表,最后将数据响应给客户端。
相反,当我们使用微服务架构之后,在产品详情页上展示的数据来自多个微服务。这里是一些可能拥有产品详情页数据的微服务:
购物车服务 - 购物车中物品的数量
订单服务 - 历史订单
Catalog 服务 - 产品基本信息,如名称、图片和价格
评论服务 - 用户的评论
库存服务 - 低库存预警
邮寄服务 - 发货选项,期限,来自各个邮寄提供商的API的成本
推荐服务 - 推荐商品
来自多个微服务的数据
我们需要决定手机客户端如何访问这些服务,让我们看看有几种选择。
二丶 客户端和微服务直接交互
理论上来说,客户端可以直接请求每个微服务,每个微服务都有一个公共的端点(https://serviceName.api.company.name)。这个URL会被映射到微服务的负载均衡器上,然后它再分发请求到可用的应用实例上。为了检索产品详情,客户端需要向上面列出的所有微服务发送请求。
可惜,这种方法实现起来是有困难和限制的。一个问题是,客户端需求和每个微服务暴露的细粒度的API是不匹配的。在这个例子中,客户端需要分别发送七次请求,在更复杂的应用中可能需要请求更多次。例如,Amazon介绍说,在他们的产品详情页上涉及到数百个微服务。虽然客户端在局域网上可以发起这么多的请求,但是在公网上可能效率太低,这在移动网络上是不符合实际的。而且这种方法也会使客户端的代码特别复杂。
客户端直接调用微服务的另外一个问题是,一些微服务使用的协议不是web友好的。一个服务使用的是Thrift RPC的二进制协议,而另一个服务可能使用的是AMQP消息协议,这两个协议对浏览器和防火墙都是不友好的,最好是在内部使用。一个应用应该使用例如 HTTP 和 WebSocket 这样能穿透防火墙的协议。
这个方法的另外一个缺点是,它会使微服务的重构比较苦难。随着时间的推移,我们可能需要将某个系统拆分成服务。例如,我们可能将两个服务合并成一个,或者将一个服务拆分成两个甚至更多的服务。不管怎样,如果客户端和很多服务之间都是直接通信,这样的重构可能是极端困难。
由于以上这些问题,客户端很少会和微服务直接通信。
三丶API网关
通常情况下,更好的方法是使用所谓的API网关。API网关是一个系统的一个入口,它类似于面向对象设计中的外观模式。API网关封装了内部系统架构,为每个客户端单独提供一个API。API网关可能还有其他的职责,例如授权、监控、负载均衡、缓存、请求的修改和管理、静态响应的处理。
下图展示了一个API网关通常适合的架构:
API网关所适合的架构
API网关负责请求的路由、组合和协议转换,所有来自客户端的请求首先都要经过API网关,然后它再路由请求到合适的微服务。API网关处理请求的方式通常是,调用多个微服务,然后合并响应结果。API网关可以在web协议(如HTTP、WebSocket)和内部使用的web不友好的协议之间做转换。
API网关也可以为每个客户端提供一个特定的API,它通常会为手机客户端暴露一些粗粒度的API,例如在产品详情的场景下,API网关可以提供一个端点(/productdetails?productid=xxx),这样手机客户端发送一个请求就能检索到产品的所有信息。API网关处理这个请求调用了多个服务(产品信息、推荐、评论等),然后合并响应结果。
Netflix API 网关是一个非常好的例子,Netflix的流服务支撑着数百种设备,包括电视、机顶盒、智能手机、游戏系统、平板电脑等等。最初,Netflix试图给所有的设备提供统一的API服务,然而他们发现效果不是很好,因为各种各样的设备都有独特的需求。现在他们使用API网关为每种设备提供定制化的API,通过执行特定设备的适配器代码实现的。通常每个适配器处理一个请求平均要调用后端六七个服务。Netflix的API网关每天处理数十亿的请求。
四丶API网关的优点和缺点
正如你期待的那样,API网关既有优点也有缺点。使用API网关的一个主要优点就是,它封装了应用的内部架构,客户端不需要调用特定的服务,而只需要与网关通信。API网关给每一种客户端都提供了特定的API,这简化了客户端与应用之间的通信往返次数,也简化了客户端代码。
API网关也有一些缺点,这又是一个高可用的组件,需要开发、部署和管理。API网关成为开发的瓶颈,这也是有风险的。开发人员为了暴露每个微服务的端点必须更新API网关,更新API网关的过程尽量轻量化也是很重要的,否则开发人员将在更新API网关的过程上被迫排队。尽管有这么多的缺点,但是在现实中的应用上使用API网关还是有意义的。
五丶API网关的实现
我们已经看到了使用API网关的动机和一些利弊权衡,现在让我们看一下你需要考虑的各种设计问题。
性能和伸缩性
只有少数的公司有Netflix的运营规模,每天需要处理数十亿的请求,然而对于大多数的应用程序来说,API网关的性能和伸缩性是非常重要的。因此,在构建API网关的时候使用异步调用和非阻塞I/O是非常有意义的。有很多种不同的技术都可以用来实现可伸缩的API网关,在JVM平台中你可以使用Netty、Vertx、Spring Reactor 或者 JBoss Undertow等这些机遇NIO的框架,在非JVM的平台中流行的技术是Node.js,它是运行在chrome的JavaScript引擎中的,另一个选择是Nginx Plus,Nginx Plus提供了一个成熟的、可扩展的、高性能的Web服务器,并且还提供了易于部署、配置和编程的反向代理,Nginx Plus可以管理授权、访问控制、请求的负载均衡、响应的缓存,并提供了应用本身的健康检查和监控。
使用响应式编程模型
API网关处理一些请求的方式是,简单将他们路由到合适的后端服务;处理其它请求的方式是,调用多个后端服务,然后将它们的响应结果聚合在一起。对于某些请求,如产品详情的请求,它的后端服务都是彼此独立的,为了减少响应时间,API网关应该并行地执行这些独立的请求。然而,有时候一些请求之间是彼此依赖的。API网关在将请求路由到后端服务之前,可能需要调用身份验证服务来验证请求。类似地,在获取顾客需要的产品列表时,API网关必须首先检索顾客需要的产品概要信息,然后才能检索每个产品的详细信息。另外一个有趣的API组合的示例是 Netflix Video Grid。
使用传统的异步回调的方法编写API组合的代码,很快就会将你带到回调的地狱,代码将会变得混乱、难于理解并且易于出错。一个更好的实现API网关的方法是,使用响应式编程方法来实现声明式的API网关代码。响应式概念的例子有Scala中的Future,Java 8 中的 CompletableFuture,JavaScript中的 Promise。也还有Reactive Extensions,也叫 Rx 或者 ReactiveX,最初是微软为 .Net 平台开发的;Netflix创建了JVM平台的 RxJava,并将它使用在他们的API网关上;也有 JavaScript 上的 RxJS,它运行在浏览器或者Node.js上。使用响应式方法编写API网关的代码简单又高效。
服务调用
基于微服务的应用是一个分布式系统,必须使用进程间通信机制。进程间通信有两种方式:一种是异步的、基于消息的机制,有些是用消息中间件(JMS or AMQP)实现的,其它的是直接与服务通信的无中间件模式,如Zeromq;进程间通信的另外一种方式是采用同步机制,如HTTP或者Thrift。通常一个系统会同时使用同步和异步方式,甚至会使用每种方式的不同实现形式,因此API网关必须支持多种通信机制。
服务发现
API网关需要知道要调用的每个微服务的位置(IP地址和端口号),在传统的应用中,你可能需要硬性地配置各个微服务的位置,但现在的基于云的微服务应用中就很简单了。基础设施服务,例如消息中间件,通常都是一个静态的位置,可以通过操作系统的环境变量来指定。然而,确定一个应用服务的位置不是那么简单的,应用服务是动态分配位置的,并且一个服务的实例集合也是动态改变的,这是因为一些自动的扩缩容和升级。因此,API网关要像其他的服务客户端一样,需要使用系统的服务发现机制:ServerSide Discovery 或者 ClientSide Discovery。在后面的文章中,将详细地介绍服务发现。现在需要我们注意的是,如果系统使用的是客户端侧的发现,API网关必须能够查询到服务注册中心,它是所有微服务实例和对应位置的数据库存储。
部分失败的处理
在实现API网关的时候必须解决的一个问题是部分失败问题。这个问题在所有的分布式系统中都会出现,因为一个服务调用另外的服务时有可能响应慢或者服务不可用。API网关决不能由于等待下游服务而被无限期的阻塞下去,例如在产品详情的场景中,如果推荐服务未响应,API网关应该将其余的产品详情信息返回给客户端,因为这些东西仍然对用户是有用的,这时的推荐内容是空的或者被其他的内容代替,例如top 10的产品。但是如果产品信息服务未响应,API网关应该返回错误给客户端。
如果后端服务不可用,API网关也可以返回缓存数据,例如,因为产品价格是很少改变的,如果产品价格服务不可用,API网关可以返回缓存的价格数据。数据可以被缓存在API网关本身,也可以缓存在外部,如Redis或者Memcached。API网关在后端系统调用失败的时候通过返回默认数据和缓存数据来确保不影响用户体验。
Netflix Hystrix是一个在调用远程服务时非常有用的编码库,Hystrix调用时间超过某个设定的阈值,就是所谓的超时,它是实现了断路器模式的,这时它会阻止客户端对不响应的服务的不必要等待。如果一个服务的错误率超过指定的阈值,然后Hystrix就会触发断路器,然后所有的请求在一个时间区间内都会立即失败。Hystrix会让你定义一个请求失败后的返回函数,例如从缓存读取数据或者返回默认值。如果你正在使用JVM的平台,你应该考虑使用Hystrix。如果在使用非JVM平台你应该等效的类库。
编程的经验:
1、多写多敲代码,好的代码与扎实的基础知识一定是实践出来的
2丶 测试、测试再测试,如果你不彻底测试自己的代码,那恐怕你开发的就不只是代码,可能还会声名狼藉。
3丶 简化算法,代码如恶魔,在你完成编码后,应回头并且优化它。从长远来看,这里或那里一些的改进,会让后来的支持人员更加轻松。