ROSE HA系统运作方式
※ 支持各种操作系统平台
※ 支持众多的UNIX平台(如:IBM、DEC、HP、NCR、SUN、SGI、NEC、SIEMENS等)
※ 支持众多的PC平台的Unix系统(如:SCO/Unix、Solraris X86等)
※ 支持各种数据库:MS-SQL、Oracle 、Informix、Sysbase、Excheng|、Lotus/Nose、DB2等
接管动作包括
※ 数据库( Database)
※ 网络地址( IP Address)
※ 应用程序(AP)
※ 系统环境(OS)
※ 容错备援运作过程
※ 主机网络
※ 主机操作系统
※ 数据库引擎及其它应用程序
※ 主机与磁盘阵列连线
1,双机相互备援模式
2,主从式备援模式
3,Hot Standby模式
4,双网卡,单网段类型
5,双网卡、双网段模式
6,多主机备援系统
用户定制模式
※ 双主机各自通过一条SCSI电缆线与RAID磁盘阵列相联
※ 双主机各自运行不同的作业,彼此独立,并相互备援
※ 主机A故障后,主机B自动接管主机A运行
※ 主机A的作业将在主机B上自动运行
※ 主机A的客户(client)要在主机B上重新登录
※ 主机A修复后,主机B将把A的作业自动交还主机A
※ 已经连到主机B上的A的客户需要在主机A上重新登录
※ 主机B故障时,主机A接管主机B的作业和数据
※ 主机B修复时,主机A再将原来接管的作业和数据交还主机B
※ 双主机通过一条TCP/IP网络线以及一条RS-232电缆线相联
※ 双主机各自通过一条SCSI电缆线与RAID相联
※ 主机A为Master,主机B为Slave
※ 主机A处理作业和数据,主机B作为热备份机
※ 主机A故障后,主机B自动接管主机A的作业和数据
※ 主机B同时接管A的主机名(Host)及网络地址(IP)
※ 主机A的作业将在主机B上自动运行
※ 主机A的客户(client)可继续运行,无需重新登录
※ 主机B现为Master,主机A修复后作为Slave,作为热备份机
※ 2个主机建议使用规格相同的主机
模式3---双机热备份(Hot Standby)
※ 双主机各自通过一条SCSI电缆线与RAID相联
※ 主机A为Master,主机B为Slave
※ 主机A处理作业和数据,主机B作为热备份机
※ 主机A故障后,主机B自动接管主机A的作业和数据
※ 主机B同时接管A的主机名(Host)及网络地址(IP)
※ 主机A的作业将在主机B上自动运行
※ 主机A的客户(client)可继续运行,无需重新登录
※ 主机A修复后,自动接管原来的作业和数据,主机B继续作备份机
※ 双主机各自运行不同的作业
※ 每一主机定义第一网口和第二网口
※ 主机A上第一网口在故障时由第二网口接管
※ 主机B上第一网口在故障时由第二网口接管
※ 主机A故障后,主机B自动接管主机A的作业和数据
※ 主机B同时接管A的主机名(Host)及网络地址(IP)
※ 主机A的作业将在主机B上自动运行
※ 主机A的客户(client)可继续运行,无需重新登录
※ 主机A同样可作B的备份机
※ 进行数机双工备份和网卡的备份
RoseHA for Windows
增加了对Team 类型网卡的支持。
增加了对磁盘阵列的硬件锁功能的支持。
修改了Volume资源的配置方式,以一个磁盘设备(Disk)作为基本卷单元进行配置。
增强了对共享卷的处理,在主机发生卷资源切换不成功时,会主动关机或重新启动,确保备机接管成功。
对于NT Server 类型的资源,增加了新的配置方式:除传统的直接选择NT Service方式进行配置外,还可以通过指定Start、Stop、Agent三个栏目(的程序)的方式进行配置。
在Userdefine类型资源中,增加了是否允许Agent程序出现运行窗口的选项。
增强了资源的修改编辑功能。
增加了共享盘盘符被占用的报警机制。
增加了对Switch或HUB断电的适应能力。
增强了对FileShare资源可用共享资源的处理。
增加了RoseHA界面中将各种配置信息保存到文本文件的功能。
增加了日志部分的内容信息。
重新设计了HOSTID机制,确保重新安装系统,硬盘重新分区不会改变HOSTID。
其它管理界面各个方面操作及显示上的修改完善。
手册针对相关功能进行了修改和补充。
新的基于Java2的GUI管理配置界面。
支持Intel网卡的iANS功能,Intel网卡必须使用Intel提供的e100, e1000的驱动程序。
配置界面中增加了GroupID的设定功能,可以更加轻松直观的将多个服务指定为一组,这些组中的服务将同时切换带入带出。
配置界面中提供了多个卷的配置方式,可以为一个Job配置一个以上的卷资源。
增加了管理界面的修改功能,可以在管理界面中直接修改处于BringOut状态的Job,无须删除后重新配置。
增加了新的磁盘系统监控机制,可以更加高效,准确,及时的监控磁盘阵列状态。
规范统一Agent的返回值,正常时返回0值,异常时非0值。
增强安全性,修改部分执行文件权限。确保root用户才能运行HA的相关程序。
新的基于Java2的GUI管理配置界面。
增加了新的磁盘系统监控机制,可以更加高效,准确,及时的监控磁盘阵列状态。
规范统一Agent的返回值,正常时返回0值,异常时非0值。
增强安全性,修改部分执行文件权限。确保root用户才能运行HA的相关程序。
更新HostID机制。通过安装RoseHA后,使用RoseHA提供的hostid工具获得申请License所需的hostid,不再使用UnixWare系统的SystemID作为hostid。确保重新安装操作系统,硬盘重新分区不会改变HOSTID
LifeKeeper 2.04 for WindowsNT为例加以说明:
LifeKeeper2.04保护起来的资源是:
卷、IP地址、共享文件、LAN(局域网)管理器服务器名称、应用程序、定义的用户、MSCS应用程序
心跳故障检测Heartbeat:
LifeKeeper在集群节点间保持着间歇的通信信号,也叫做心跳信号,是错误检测的一个机制.即通过每一个通信路径,在两个对等系统之间进行周期性的握手,如果连续没有收到的心跳信号到了一定的数目,LifeKeeper就把这条路径标示为失效(红色),如果你只定义了一条通信路径当LifeKeeper 把这唯一的一条通信路径标为失效时,LifeKeeper便立即开始恢复过程.然而,如果有冗余路径.LifeKeeper能够通过第二条路径确定是系统故障还是只是通信路径有问题。如果LifeKeeper开启优先级第二的通信路径并收到了心跳信号,它就不开始failover恢复,只需要把第一条通信路径标成红色(失效),作为信号告诉你需要修理一下有故障的路径。
一般情况下LifeKeeper 只在下列事件发生时,启动系统恢复功能:
所有的通信路径故障.如果所有节点都没能收到心跳信号.把所有通信路径都标为失效,Lifekeeper开始安全检查。安全检查失败.当所有通信路径故障时,LifeKeeper向整个网络发出安全检查信号.如果信号指出配对系统还"活"着的时候,LifeKeeper不启动Failover如果安全检查没从配对节点返回信号,LifeKeeper 就开始Failover。 因而,为了减少由于潜在的通讯错误所引起的不必要的系统切换,建议您使用不同介质的多条通信路径.
通信路径:
目前大多行业用户所面临和苦恼的问题包括:
1、关键业务的可靠性问题;
2、系统中多个关键业务的维护难度高的问题;
3、应用数据安全的问题;
4、业务系统停止服务会造成巨大损失的问题。
解决方案目标用户:
● 自主产权软件产品,支持功能定制;
● 集群配置安装维护简单;
● 管理员密码验证,安全级别高;
● 集群软件自我监控功能,确保守护进程健康运行;
● 对应用程序的灵活监控功能,可以对进程数量、特殊应用进行监控;
● 节点和任务的可伸缩性;
● 通过集群管理平台可以进行集中、远程的管理、监控;
● 理论上支持的节点数无限;
● 任务的备援规则可以灵活配置,资源利用更加合理;
● 基于系统级的集群实现应用级的集群;
● 保证了足够的集群系统综合处理性能;
● 集群工作方式灵活多样,支持多机互备、多备一、多备多等方式;
● 完善的日志记录和错误报警,便于错误跟踪;。
● 应用的无关性,支持几乎所有的数据库环境(Informix/oracle/Sybase等);
方案优势:
● 节省管理成本,集群中的节点统一管理,使管理变得轻松;
● 整合了环境中的应用,使之达到整体高可用;
● 方案性价比高,关键业务子系统越多、方案的平均投入越低,节省了设备的投资;
● 方案伸缩性好,集群中主机可以灵活增加、减少;
● 服务优势明显,借助联鼎服务平台,可以得到全方位、及时的技术服务
● Linux、Other Unix
● SCO OpenServer 5.0.4 or later
● SCO Unware 7.0 or later
● WindowsNT/2000 or later
● 服务器配置一个外部SCSI/FC接口
● SCSI/FC存储子系统
● 服务器配置两个以上全双工网卡
● 256M以上内存:
● 共享磁盘阵列子系统中需要划分单独的字符设备;
● 用于SCSI HeartBeat容量5M;
● LanderCluster需200K左右的内存;
● Oracle DataServer 7.x or later
● Sybase all released version
● DB2 7.x or later
其他:
● 用户可以根据实际环境定制功能
● 用户定制备援规则