可以把应用分为三种类型:处理器密集型、内存密集型和输入/输出密集型。
衡量WEB服务的两个重要指标是吞吐量(throughput)和响应时间(responsetime)。相同条件下,吞吐量越大,说明服务器同时处理请求的能力越强、响应时间越短,也就是说,服务器处理单个事物的速度越快。
- 虚拟化的关键技术
虚拟器件(virtualappliance)技术能很好的解决上述难题,虚拟器件技术是服务器虚拟化技术和计算机器件技术结合的产物。OVF(openvirtualizationformat)标准为虚拟器件的包装和发布提供了描述格式。OVF包是虚拟器件最终发布的打包格式,是一个以.ova为后缀的文件。OVF包里包含了一下几种文件:一个以.ovf为后缀结尾的OVF文件、一个以.mf结尾的摘要清单文件,一个以.cert结尾的证书文件,若干个其他资源文件和若干个虚拟器件的镜像文件。
镜像文件可以是虚拟器件的二进制磁盘文件,也可以是一个磁盘配置文件,它记录了下载二进制磁盘文件的URI地址。摘要清单文件记录了OVF包里面每个文件的哈希摘要值、所采用的摘要算法等信息。证书文件是对摘要清单文件的签名摘要,可用来对整个包进行认证。资源文件是一些与虚拟器件相关的文件,如ISO文件。OVF文件和镜像文件是必须的。
对镜像文件的元数据信息和文件内容分别处理。
镜像文件的实际内容会采用切片处理。
P2V(physicalto virtual)
流媒体技术:边下载文件,边播放已下载的部分
通过镜像流技术就可以无需下载整个虚拟机插件而即时启动虚拟机
虚拟器件的四类关键技术:集中监控、快捷管理、动态优化、高效备份
如果需要对数据短期备份,可以利用磁盘,如果长期备份,则需要用到磁带库
- 云计算概论
云计算是一种能够将动态伸缩的虚拟化资源通过互联网以服务的方式提供给用户的计算模式
资源在物理上以分布式的共享方式存在,但最终在逻辑上以单一整体的形式呈现
常见的并行计算机系统结构包含共享存储的对称多处理器(SMP),分布式存储的大规模并行机(MPP)和松散耦合的分布式工作站集群(COW)等
网格计算是一种分布式计算模式。网格计算的本质在于以高效的方式来管理各种加入了该分布式系统的异构松耦合资源,并通过任务调度来协调这些资源合作完成一项特定的计算任务。
效用计算:根据用户要求按需提供
多核技术可以在一枚处理器中集成多个完整的计算引擎,它的出现规避了仅仅提高单核芯片的速度而产生过多热量且无法带来相应的性能改善的问题。处理器位数的提高与总线技术的提升,使系统能够支持容量与吞吐量都更大的内存,使更多的任务可以同时运行。
- 、云架构
典型的云架构分为三个基本层次:基础设施层(基础设施即服务,infrastructureas a service)、平台层(平台即服务,platfromas a service,paas)和应用层(软件即服务,softwareas a service,saas)
资源模型有:虚拟机,集群,虚拟数据中心,云等
- 云技术的关键技术与挑战
如果想进一步提高云环境中虚拟机的部署速度,则需要考虑并行部署或者协同部署技术
并行部署会受限于有限网络带宽等
协调部署的核心思想是将虚拟机镜像在多个目标物理机之间的网络中传输,而不是仅仅在部署服务器和目标物理机之间传输,从而提高传输速度
Mapreduce框架从Lisp及很多类似的语言获得灵感,大多数分布式运算可以抽象为map和reduce两个步骤,从而实现可靠、高效的分布式应用。map步骤负责根据输入的键值(key/value)对生成中间结果,中间结果同样采用key/value对的形式。reduce则将所有的中间结果根据key进行合并,然后生成最终结果。开发者只需要实现map和reduce函数的逻辑,然后提交给mapreduce运行环境,计算任务便会由大量的计算机组成的集群自动、并行地调度执行
在异步消息通信中,客户端和服务端并不直接通信。
设计系统时要考虑开放的、标准的操作接口,并隐藏文件系统下层的负载均衡、冗余复制等细节。
可伸缩性管理的实现方法是垂直伸缩(scaleuo/down)和水平伸缩(scaleout/in)。垂直伸缩是指在现有服务节点上增加或减少资源,如CPU、内存、线程池和存储空间等。而水平伸缩指增加或减少服务节点。水平伸缩需要原有系统提供对多个服务器组成的集群的管理,包括数据同步、统一监控、负载均衡和性能调优等
基于应用历史记录、应用模式及预测模型预测出的可伸缩性调整,满足了可伸缩性管理的预动性需求