第一章 分布式计算的概述
分布式计算是计算机科学的重要研究内容,主要研究对象是分布式系统。简单地说,一个分布式系统是由若干通过互联网的计算机组成的软硬件系统,而且这些计算机相互配合以完成一个共同的目标。而分布式计算是两个或多个软件共享信息、协同工作(的过程)。这些软件既可以在同一台计算机上运行,也可在通过网络连起来的几台不同机器上运行。
分布式计算比起其它算法具有以下几个优点:
1、稀有资源可以共享。
2、通过分布式算可以在多台计算机上平衡计算负载。
3、可以把程序放在最适合运行它的计算机上。其中,共享稀有资源和平衡负载是计算机分布式计算的核心思想之一。
分布式计算的优点:
① 超大规模
② 虚拟化
③ 高可靠性
④ 通用性
⑤ 高可伸缩性
⑥ 极其廉价
⑦ 容错性
分布式计算的缺点:
① 多故障性:一台或多台计算的故障,或一条或多条网络链路的故障,都会导致分布式系统出现问题。
② 安全性:分布式系统为非授权用户的攻击提供了更多机会。
并行计算与分布式计算的联系与区别
并行计算
并行计算是相对于串行计算的概念。通常并行计算是指同时使用多种计算资源解决计算问题的过程,是提高计算机系统计算速度和处理能力的一种有效手段。其基本思想是用多个处理器来协同求解同一问题,即将被求解的问题分解成若干个部分,各部分均由一个独立的处理器来来并行计算。
分布式计算
分布式计算是相对于集中式计算的概念。分布式计算是把一个需要非常巨大的计算能力才能解决的问题分成许多小的部分,然后把这些部分分配给许多计算机进行处理。其基本思想是利用多台互联网上的计算机的中央处理器的闲置处理能力来解决大型的计算问题。
两者之间的区别
并行计算强调任务的并发执行,而分布式计算则强调任务的分布执行。
分布式系统的特征:可用性
① 可靠性
② 可扩展性
③ 高效性
④ CAP理论:源于伯克利加州大学的计算机科学家Eric Brewer在2000年的分布式计算原则研讨会(Symposium on Principles of Distributed Computing,PODC)上提出的一个猜想。
它对一个分布式计算系统来说,不可能同时满足以下3点:
① 一致性
② 可用性
③ 分区容忍性
布式计算的应用实例:
1.解决较为复杂的数学问题,例如:GIMPS(寻找最大的梅森素数)。
2.研究寻找最为安全的密码系统,例如:RC-72(密码破解)。
3.生物病理研究,例如:Folding@home(研究蛋白质折叠,误解,聚合及由此引起的相关疾病)。