分布式计算概述总结

  • 什么是分布式计算?
  • 广义定义
  • 中科院定义
  • 分布式计算的优缺点
  • 优点
  • 缺点
  • 并行计算与分布式计算的联系与区别
  • 并行计算
  • 分布式计算
  • 两者之间的区别
  • 分布式系统的CAP理论
  • 一致性
  • 可用性
  • 分区容忍性
  • CAP中的选择
  • 分布式计算的应用实例


什么是分布式计算?

分布式计算是一种计算方法,和集中式计算是相对的。
分布式计算是利用互联网上的计算机的中央处理器的闲置处理能力来解决大型计算问题的一种计算科学。

广义定义

分布式计算就是研究如何把一个需要非常巨大的计算能力才能解决的问题分成许多小的部分,然后把这些部分分配给许多计算机进行处理,最后把这些计算结果综合起来得到最终的结果。

中科院定义

在两个或多个软件互相共享信息,这些软件既可以在同一台计算机上运行,也可以在通过网络连接起来的多台计算机上运行。

·

分布式计算的优缺点

优点

  1. 低廉的计算机价格和网络访问的可用性
    现今的个人计算机拥有远超以往大型计算机的计算能力,同时体积和价格不断下降。再加上Internet连接了全世界,大量的互连计算机为分布式计算创造了理想环境。
  2. 稀有资源共享
    每个组织在面向网络提供共享稀有资源的同时也可以获取到其他组织所分享的稀有资源,利用分布式计算可以非常有效的汇集资源。
  3. 可伸缩性
    在单机计算中可用资源受限于单台计算机的能力,但分布式计算可以在多台计算机上平衡计算负载,增加资源需求可通过提供额外资源来有效解决。同时可以把程序放在最适合运行它的计算机上。
  4. 容错性
    与单机计算相比,分布式计算提供了容错功能。可以通过资源复制维持系统故障的情形下的资源可用性。

缺点

  1. 多点故障
    由于涉及多台计算机同时依赖网络通信,因此计算机或网络链路的故障都可能会导致分布式系统出现问题。
  2. 安全性低
    在集中式系统中,所有计算机和资源通常之受一个管理者控制,而分布式系统的非集中式管理机制包括许多独立组织,使安全策略的实现和增强变得更为困难。

·

并行计算与分布式计算的联系与区别

并行计算

并行计算是相对于串行计算的概念。通常并行计算是指同时使用多种计算资源解决计算问题的过程,是提高计算机系统计算速度和处理能力的一种有效手段。

其基本思想是用多个处理器来协同求解同一问题,即将被求解的问题分解成若干个部分,各部分均由一个独立的处理器来来并行计算。

分布式计算

分布式计算是相对于集中式计算的概念。分布式计算是把一个需要非常巨大的计算能力才能解决的问题分成许多小的部分,然后把这些部分分配给许多计算机进行处理。

其基本思想是利用多台互联网上的计算机的中央处理器的闲置处理能力来解决大型的计算问题。

两者之间的区别

并行计算强调任务的并发执行,而分布式计算则强调任务的分布执行。

·

分布式系统的CAP理论

分布式计算 docker 分布式计算技术_结点


CAP理论是源于伯克利加州大学的计算机科学家Eric Brewer在2000年的分布式计算原则研讨会(Symposium on Principles of Distributed Computing,PODC)上提出的一个猜想。

CAP理论指出对一个分布式计算系统来说,不可能同时满足以下3点:

一致性

一致性(Consistency,C):所有节点访问同一份最新的数据副本。在分布式系统中的所有数据备份,在同一时刻是否是同样的值。

可用性

可用性(Availability,A):对数据更新具备高可用性。在集群中一部分结点故障后,集群整体是否还能响应客户端的读写请求。

分区容忍性

分区容忍性(Partition tolerance,P):当集群中的某些结点无法联系时仍能正常提供服务。

CAP中的选择

在设计分布式应用系统时,3大要素最多只能同时实现2点,不可能三者兼顾。

  1. 选择分区容忍性和一致性(CP)
    即使结点故障,操作也必须一致,并能顺利完成。最好的方法就是将所有数据放到同一个结点中。但这种方式显然不满足可用性。如:BigTable、HBase
  2. 选择分区容忍性和可用性(AP)
    满足可用,就说明数据必须要在不同结点中有副本。如果还必须保证在产生分区的时候仍然可以完成操作,那么操作就无法保证一致性。如:Dynamo、SimpleDB
  3. 选择可用性和一致性(CA)
    有一致性和可用性的系统通常可扩展性能不高,不具有分区容错性,如传统的关系型数据库。

·

分布式计算的应用实例

  1. 解决较为复杂的数学问题,例如:GIMPS(寻找最大的梅森素数)。
  2. 研究寻找最为安全的密码系统,例如:RC-72(密码破解)。
  3. 生物病理研究,例如:Folding@home(研究蛋白质折叠,误解,聚合及由此引起的相关疾病)。
  4. 各种各样疾病的药物研究,例如:United Devices(寻找对抗癌症的有效的药物)。
  5. 信号处理,例如:SETI@Home(在家寻找地外文明)。