最新消息: USBMI致力于为网友们分享Windows、安卓、IOS等主流手机系统相关的资讯以及评测、同时提供相关教程、应用、软件下载等服务。

惠普双机双控容错系统简介

IT圈 admin 27浏览 0评论

2024年3月6日发(作者:慕容翠柏)

惠普双机双控容错系统简介

近年来随着计算机技术的飞速发展,服务器的性能有了大幅度的提升,服务器作为处理关键性事物的业务主机已随处可见。对于要求有高可用性和高安全性的系统,比如金融、邮电、交通、石油、电力、保险、证券等行业,用户提出了系统容错的要求。惠普公司根据用户这一要求,推出了惠普双机双控容错系统方案。用二台服务器共同工作,当一台服务器的系统出现故障时,另一台服务器可确保系统正常运行,从而将系统风险降低到最低限度,保障了系统的高可靠性、高安全性和高可用性。

惠普双机双控容错系统技术基础为近年来成熟起来的Cluster集群技术。Cluster集群技术出发点是提供高可靠性、可扩充性和抗灾难性。惠普双机双控容错系统解决方案重点在提供高可靠性和高安全性,Cluster集群技术为此提供了技术上的保证。惠普公司为金融、邮电、交通、石油、电力、保险、证券等需要安全运行的系统度身定作了基于Cluster集群技术的双机双控容错系统方案。

Cluster集群技术

Cluster集群技术可如下定义:一组相互独立的服务器在网络中表现为单一的系统,并以单一系统的模式加以管理。此单一系统为客户工作站提供高可靠性的服务。

Cluster大多数模式下,集群中所有的计算机拥有一个共同的名称,集群内任一系统上运行的服务可被所有的网络客户所使用。Cluster必须可以协调管理各分离的组件的错误和失败,并可透明地向Cluster中加入组件。

一个Cluster包含多台(至少二台)拥有共享数据储存空间的服务器。任何一台服务器运行一个应用时,应用数据被存储在共享的数据空间内。每台服务器的操作系统和应用程序文件存储在其各自的本地储存空间上。

Cluster内各节点服务器通过一内部局域网相互通讯。当一台节点服务器发生故障时,这台服务器上所运行的应用程序将在另一节点服务器上被自动接管。当一个应用服务发生故障时,应用服务将被重新启动或被另一台服务器接管。当以上任一故障发生时,客户将能很快连接到新的应用服务上。 Cluster(群集)是紧密连接的一组计算机,用来持续性地提供高性能的计算服务。把一组计算机连在一起并非难事,但要让它们获得很高的性能就不那么容易了。Cluster的初衷在于以没有单点故障的体系结构来达到系统的高可用性和可伸缩性,而且要求采用通用标准的计算机,而不是特殊专用的计算机部件,从而能以较低的成本获得较好的可伸缩性。Cluster中的计算机应当具有非常好的协同性。如果其中一台发生故障,马上就有另一台去接替它的工作,如果一台计算机的性能不足以完成某项任务,其他的系统成员就会加入进来,共同执行这项任务。应用实践证明,由通用的计算机部件协同工作,完全可能使其运算能力超过大型主机、超级计算机和容错系统,而且具有更低的成本。

为什么选Cluster?

评估计算机系统体系结构的优劣的确不是一件容易的事。SMP(对称多道处理)、FT(容错)、MPP(海量并行处理)和Cluster(群集)以其各自的特色在市场上占有一席之地。MPP以系统的可伸缩性见长,FT的可用性比较高,而SMP和Cluster的结构在可伸缩性和可用性之间的兼顾与融合使其成为最成熟、适用范围最广的技术方案,在实际应用中可以满足绝大多数用户的需求。

可用性是指系统正常运行的比例,最高的理论指标值是100%,而常用的表征方法是"9"的数量。例如"3个9"就是指99.9%的可用性,"4个9"是指99.99%的可用性。一套具3个9"的可用性系统,只有0.1%的时间处于不能正常运行的状态。这看起来似乎不错,但实际上意味着在一年的时间里有9个小时系统不能正常工作。如果能够让这9个小时的停机时间都安排在非业务高峰时段,也许问题并不十分严重。但是如果一家零售商场的业务系统在春节前意外停机9个小时,那商场业主来说简直无异于一场噩梦。所以说,用户需要更多的"9"。对于不能停顿的关键业务应用,要达到更高的可用性就应该选择Cluster。因为即使是在最坏的情况下,严重的系统故障在Cluster之中也只会表现为几分钟内系统性能的略微降低,服务的反应速度稍微慢一点。

近年来,Cluster和RAS(Reliability、Availability和Serviceability)等相关领域的进步极大地改善了应用系统的可用性,减少了停机时间。Cluster技术越先进,计算部件成员之间配合就越默契,故障部件的接替与切换就更加平衡。例如多通道I/O特性使存储或网络控制器发生故障的节点可以方便地切换到其他备用控制器上。

在更先进的Cluster技术中,任何部件发生故障都不会影响到系统的正常运行,甚至是在备用部件或者系统总线发生故障的情况下,计算节点同样可以通过远程方式利用其他节点的存储控制器继续执行自己的任务。在各个计算节点都正常的情况下,也可以自动均衡所有计算资源上的负载,使整个系统的运行性能达到最佳状态。而且,与分别管理相同数量的独立单机相比,对于Cluster之中的节点进行管理要容易得多。

真正的Cluster减少系统停机时间,高可用性自然是功不可没。通过将单个的服务器连接成Cluster,有可能获得3个、4个甚至5个"9"的可用性,但同时又面临着一大堆复杂的技术细节问题--设备驱动程序、磁盘卷标、IP地址、故障接替路径、服务定义和控制脚本等等。随着Cluster中节点数量的增加,这类问题就会越来越复杂,常常使系统管理员望而生畏。事实上,有不少用户由于追求可用性而选择Cluster,但又由于系统的复杂性和管理上的困难而导致Cluster远远没有发挥其应有的效益。

所以说,Cluster要想凭借其高性能、高可用性和高可伸缩性而在当今的商业应用中担当重任,就必须改善自身在部署和维护方面的简便程度,让人们感到它并非高深莫测。负载平衡、多路故障接替、多通道I/O和管理集中化等功能应当成为操作系统理所应当的普通功能,这才是真正具有实用意义的Cluster。

群集系统特点

此种方案为企业应用提供一个安全级别较高的平台环境,真正实现计算机系统服务器99.99%的高容错,这样就大大减轻了系统的压力,使用户网络系统的吞吐能力和容错能力有了质的改变。

高度可用性,确保作业的连续性

群集系统中某个服务器由于硬件或软件失败而导致崩溃,群集系统中的备用服务器可以予以接管,以保证处理过程的继续。群集也可以对某些单独组件,如磁盘或适配器,或是单独应用程序的失败作出反应,通过隔离失败节点的错误,其它节点可以继续运行,保证整个群集系统的功能。

提升数据的安全容错级别至99.99%

群集系统中的磁盘阵列柜配置主要包括:控制器(其上自带CPU、缓存)、电源、风扇、磁盘存储子系统,其使用全硬件冗余方式保证数据的安全性,从而消除了群集系统的单点故障。

SCSI方案说明

最基本的共享SCSI存储集群系统配置方案,采用两台服务器,两个HP SmartArray 5i/532阵列卡,两根SCSI电缆,一个HP SmartArray

集群存储柜,是集群解决方案中的最低配置。HP SmartArray阵列卡的类型与服务器的型号有关。具有结构简单、安装方便、价格低廉等优点。缺点是用途光纤存储方案相比扩展能力、支持的传输距离和传输可靠性较为逊色,目前只能支持双机集群。

需要注意的是,本集群方案仅适用于Windows NT,Windows 2000,Novell netware 5.1,6.0以及Redhat 7.2,Suse SLES7集群环境。

● 服务器

使用2台,可根据应用的情况选配相应的服务器,如HP Proliant ML 370G3,ML 530G2 360 G3,DL 380G3,DL 580 G2,DL 760.

● 主机适配卡

2块HP SmartArray 5i/532 分别安装在2台服务器中,在本方案中该卡通过SCSI电缆连接到SmartArray集群存储柜的2个超高密(VHDC)SCSI接口上。

● 共享磁盘柜

HP SmartArray 集群存储柜标配1块控制器,如果考虑冗余可以额外配置另一块热插拔控制器。磁盘柜中安装4(最少)块硬盘(根据用户需求)。

● 外接SCSI电缆

SmartArray 集群存储柜标配带有2根SCSI电缆,分别2台服务器HP SmartArray 5i/532连接到SmartArray 集群存储柜的超高密度SCSI接口上。

Hp Smart Array Cluster Storage的性能和特点

· Hp Smart Array Cluster Storage 支持14块通用型Wide-Ultra3 SCSI 热插拔驱动器。

· 高性能阵列控制器,最高512MB可调整读/写缓存,支持RAID0,1,5,ADG,支持自动数据恢复和在线备份盘。

· 可无缝升级到光纤存储通道的MSA1000。

· 利用热插拔冗余电源和风扇、热插拔硬盘、以及对Microsoft Cluster Server集群 解决方案的支持,停机现象将一去不复返。

数据保护

RAID ADG(Advance Data Guarding)技术通过部署两个奇偶校验集,提供2个硬盘的容量存储来存储这些奇偶校验信息,来达到同时容忍两块硬盘出现故障的目标,突破了以往RAID级别只允许在同一时刻出现一块硬盘故障的限制。同时,RAID ADG通过把几块硬盘串连在一起创建一个的卷集,磁盘之间的连接既可以使用硬件的形式通过智能磁盘控制器实现,也可以使用操作系统中的磁盘驱动程序以软件的方式实现,全无停机或丢失数据的风险,大大提供了企业数据的可靠性。因为结合了这一技术,MSA1000在传统的入门级SAN产品中,性能明显胜出了一筹。

方案拓扑图

本方案由两台服务器共享Hp Smart Array Cluster Storage磁盘阵列柜组成,支持Microsoft Cluster Server。当集群中的一台服务器发生故障,另外一台服务器会检测到并进行自动切换,以保证应用的连续正常运行

2024年3月6日发(作者:慕容翠柏)

惠普双机双控容错系统简介

近年来随着计算机技术的飞速发展,服务器的性能有了大幅度的提升,服务器作为处理关键性事物的业务主机已随处可见。对于要求有高可用性和高安全性的系统,比如金融、邮电、交通、石油、电力、保险、证券等行业,用户提出了系统容错的要求。惠普公司根据用户这一要求,推出了惠普双机双控容错系统方案。用二台服务器共同工作,当一台服务器的系统出现故障时,另一台服务器可确保系统正常运行,从而将系统风险降低到最低限度,保障了系统的高可靠性、高安全性和高可用性。

惠普双机双控容错系统技术基础为近年来成熟起来的Cluster集群技术。Cluster集群技术出发点是提供高可靠性、可扩充性和抗灾难性。惠普双机双控容错系统解决方案重点在提供高可靠性和高安全性,Cluster集群技术为此提供了技术上的保证。惠普公司为金融、邮电、交通、石油、电力、保险、证券等需要安全运行的系统度身定作了基于Cluster集群技术的双机双控容错系统方案。

Cluster集群技术

Cluster集群技术可如下定义:一组相互独立的服务器在网络中表现为单一的系统,并以单一系统的模式加以管理。此单一系统为客户工作站提供高可靠性的服务。

Cluster大多数模式下,集群中所有的计算机拥有一个共同的名称,集群内任一系统上运行的服务可被所有的网络客户所使用。Cluster必须可以协调管理各分离的组件的错误和失败,并可透明地向Cluster中加入组件。

一个Cluster包含多台(至少二台)拥有共享数据储存空间的服务器。任何一台服务器运行一个应用时,应用数据被存储在共享的数据空间内。每台服务器的操作系统和应用程序文件存储在其各自的本地储存空间上。

Cluster内各节点服务器通过一内部局域网相互通讯。当一台节点服务器发生故障时,这台服务器上所运行的应用程序将在另一节点服务器上被自动接管。当一个应用服务发生故障时,应用服务将被重新启动或被另一台服务器接管。当以上任一故障发生时,客户将能很快连接到新的应用服务上。 Cluster(群集)是紧密连接的一组计算机,用来持续性地提供高性能的计算服务。把一组计算机连在一起并非难事,但要让它们获得很高的性能就不那么容易了。Cluster的初衷在于以没有单点故障的体系结构来达到系统的高可用性和可伸缩性,而且要求采用通用标准的计算机,而不是特殊专用的计算机部件,从而能以较低的成本获得较好的可伸缩性。Cluster中的计算机应当具有非常好的协同性。如果其中一台发生故障,马上就有另一台去接替它的工作,如果一台计算机的性能不足以完成某项任务,其他的系统成员就会加入进来,共同执行这项任务。应用实践证明,由通用的计算机部件协同工作,完全可能使其运算能力超过大型主机、超级计算机和容错系统,而且具有更低的成本。

为什么选Cluster?

评估计算机系统体系结构的优劣的确不是一件容易的事。SMP(对称多道处理)、FT(容错)、MPP(海量并行处理)和Cluster(群集)以其各自的特色在市场上占有一席之地。MPP以系统的可伸缩性见长,FT的可用性比较高,而SMP和Cluster的结构在可伸缩性和可用性之间的兼顾与融合使其成为最成熟、适用范围最广的技术方案,在实际应用中可以满足绝大多数用户的需求。

可用性是指系统正常运行的比例,最高的理论指标值是100%,而常用的表征方法是"9"的数量。例如"3个9"就是指99.9%的可用性,"4个9"是指99.99%的可用性。一套具3个9"的可用性系统,只有0.1%的时间处于不能正常运行的状态。这看起来似乎不错,但实际上意味着在一年的时间里有9个小时系统不能正常工作。如果能够让这9个小时的停机时间都安排在非业务高峰时段,也许问题并不十分严重。但是如果一家零售商场的业务系统在春节前意外停机9个小时,那商场业主来说简直无异于一场噩梦。所以说,用户需要更多的"9"。对于不能停顿的关键业务应用,要达到更高的可用性就应该选择Cluster。因为即使是在最坏的情况下,严重的系统故障在Cluster之中也只会表现为几分钟内系统性能的略微降低,服务的反应速度稍微慢一点。

近年来,Cluster和RAS(Reliability、Availability和Serviceability)等相关领域的进步极大地改善了应用系统的可用性,减少了停机时间。Cluster技术越先进,计算部件成员之间配合就越默契,故障部件的接替与切换就更加平衡。例如多通道I/O特性使存储或网络控制器发生故障的节点可以方便地切换到其他备用控制器上。

在更先进的Cluster技术中,任何部件发生故障都不会影响到系统的正常运行,甚至是在备用部件或者系统总线发生故障的情况下,计算节点同样可以通过远程方式利用其他节点的存储控制器继续执行自己的任务。在各个计算节点都正常的情况下,也可以自动均衡所有计算资源上的负载,使整个系统的运行性能达到最佳状态。而且,与分别管理相同数量的独立单机相比,对于Cluster之中的节点进行管理要容易得多。

真正的Cluster减少系统停机时间,高可用性自然是功不可没。通过将单个的服务器连接成Cluster,有可能获得3个、4个甚至5个"9"的可用性,但同时又面临着一大堆复杂的技术细节问题--设备驱动程序、磁盘卷标、IP地址、故障接替路径、服务定义和控制脚本等等。随着Cluster中节点数量的增加,这类问题就会越来越复杂,常常使系统管理员望而生畏。事实上,有不少用户由于追求可用性而选择Cluster,但又由于系统的复杂性和管理上的困难而导致Cluster远远没有发挥其应有的效益。

所以说,Cluster要想凭借其高性能、高可用性和高可伸缩性而在当今的商业应用中担当重任,就必须改善自身在部署和维护方面的简便程度,让人们感到它并非高深莫测。负载平衡、多路故障接替、多通道I/O和管理集中化等功能应当成为操作系统理所应当的普通功能,这才是真正具有实用意义的Cluster。

群集系统特点

此种方案为企业应用提供一个安全级别较高的平台环境,真正实现计算机系统服务器99.99%的高容错,这样就大大减轻了系统的压力,使用户网络系统的吞吐能力和容错能力有了质的改变。

高度可用性,确保作业的连续性

群集系统中某个服务器由于硬件或软件失败而导致崩溃,群集系统中的备用服务器可以予以接管,以保证处理过程的继续。群集也可以对某些单独组件,如磁盘或适配器,或是单独应用程序的失败作出反应,通过隔离失败节点的错误,其它节点可以继续运行,保证整个群集系统的功能。

提升数据的安全容错级别至99.99%

群集系统中的磁盘阵列柜配置主要包括:控制器(其上自带CPU、缓存)、电源、风扇、磁盘存储子系统,其使用全硬件冗余方式保证数据的安全性,从而消除了群集系统的单点故障。

SCSI方案说明

最基本的共享SCSI存储集群系统配置方案,采用两台服务器,两个HP SmartArray 5i/532阵列卡,两根SCSI电缆,一个HP SmartArray

集群存储柜,是集群解决方案中的最低配置。HP SmartArray阵列卡的类型与服务器的型号有关。具有结构简单、安装方便、价格低廉等优点。缺点是用途光纤存储方案相比扩展能力、支持的传输距离和传输可靠性较为逊色,目前只能支持双机集群。

需要注意的是,本集群方案仅适用于Windows NT,Windows 2000,Novell netware 5.1,6.0以及Redhat 7.2,Suse SLES7集群环境。

● 服务器

使用2台,可根据应用的情况选配相应的服务器,如HP Proliant ML 370G3,ML 530G2 360 G3,DL 380G3,DL 580 G2,DL 760.

● 主机适配卡

2块HP SmartArray 5i/532 分别安装在2台服务器中,在本方案中该卡通过SCSI电缆连接到SmartArray集群存储柜的2个超高密(VHDC)SCSI接口上。

● 共享磁盘柜

HP SmartArray 集群存储柜标配1块控制器,如果考虑冗余可以额外配置另一块热插拔控制器。磁盘柜中安装4(最少)块硬盘(根据用户需求)。

● 外接SCSI电缆

SmartArray 集群存储柜标配带有2根SCSI电缆,分别2台服务器HP SmartArray 5i/532连接到SmartArray 集群存储柜的超高密度SCSI接口上。

Hp Smart Array Cluster Storage的性能和特点

· Hp Smart Array Cluster Storage 支持14块通用型Wide-Ultra3 SCSI 热插拔驱动器。

· 高性能阵列控制器,最高512MB可调整读/写缓存,支持RAID0,1,5,ADG,支持自动数据恢复和在线备份盘。

· 可无缝升级到光纤存储通道的MSA1000。

· 利用热插拔冗余电源和风扇、热插拔硬盘、以及对Microsoft Cluster Server集群 解决方案的支持,停机现象将一去不复返。

数据保护

RAID ADG(Advance Data Guarding)技术通过部署两个奇偶校验集,提供2个硬盘的容量存储来存储这些奇偶校验信息,来达到同时容忍两块硬盘出现故障的目标,突破了以往RAID级别只允许在同一时刻出现一块硬盘故障的限制。同时,RAID ADG通过把几块硬盘串连在一起创建一个的卷集,磁盘之间的连接既可以使用硬件的形式通过智能磁盘控制器实现,也可以使用操作系统中的磁盘驱动程序以软件的方式实现,全无停机或丢失数据的风险,大大提供了企业数据的可靠性。因为结合了这一技术,MSA1000在传统的入门级SAN产品中,性能明显胜出了一筹。

方案拓扑图

本方案由两台服务器共享Hp Smart Array Cluster Storage磁盘阵列柜组成,支持Microsoft Cluster Server。当集群中的一台服务器发生故障,另外一台服务器会检测到并进行自动切换,以保证应用的连续正常运行

发布评论

评论列表 (0)

  1. 暂无评论