2024年1月23日发(作者:塔芷)
HP 分区技术解析
对于服务器而言(不管是PC服务器,还是UNIX服务器),单纯地提高单个处理器的运算能力和处理能力正在变得越来越难,虽然许多制造商从材料、工艺和设计等方面进行了不懈的努力,近期内仍然使得CPU保持着高速的增长势态,但高频之下的高功耗所引起的电池容量问题和散热问题等负面效应,以及这些负面效应对整机系统产生的电磁兼容性问题,又反过来将CPU运算能力的提升推到了暮年。显然,提高单个处理器速度和性能已是强弩之末,而研发多个CPU的并行处理技术,才是真正提高现代服务器处理能力和运算速度的有效途径。这也正是多处理器服务器不仅是UNIX服务器的专利,而且也是已经在PC服务器中普遍采用的原因。
而单机内CPU数量的增加也是有限的,CPU数量的增加必然会增加系统总线的压力,同时增加了系统管理和调度的复杂性,并反过来影响整机性能。
分区技术正是在这种两难的境况中诞生的。服务器分区技术可将服务器的CPU、内存、I/O等资源合理地进行分区和调配,不同分区内可以执行不同的操作系统或同一操作系统的不同版本,最大限度地挖掘了服务器的性能,一台服务器甚至可以当作几十台使用,提高了硬件利用率。并且,在任何某个分区发生故障时,都不会影响其他分区的运行,不同分区的应用之间保持独立性。
根据IDC的统计,目前分区技术主要分为四大类,即集群、物理硬件分区、虚拟逻辑分区和软件分区技术,而真正可以实现分区间故障隔离的只有集群和硬件分区技术。如下图所示:
分区技术源于大型机,惠普公司率先将该技术引入到开放系统中,于2000年在HP9000 Superdome上利用HP-UX11i实现了上述全部四种分区技术,并陆续将该技术推广到惠普全线UNIX小型机上。目前惠普中高档UNIX服务器,包括RP7410、RP8400以及Superdome支持全部四种分区技术,中低档如RP54XX系列和RP24XX系列支持集群、虚拟逻辑分区和软件分区三种分区技术。
目前各厂商均紧随惠普公司,在其开放系统中引进分区技术,如IBM在AIX5.X操作系统中引入逻辑分区,SUN在其SUN Fire系列服务器中引入硬件分区技术。但是由于各厂家产品体系结构的不同,产品发展策略各异,因此引入和实现分区功能的程度也各不相同,如下图所示:
一、 集群分区
集群(Cluster)技术是近几年兴起的发展高性能计算机的一项技术。目前各主流厂商包括微软均有自己非常成熟的解决方案。该技术的出现是由于当时技术所限,单节点主机无法承担大规模计算应用的需要,因此提出将多台小规模计算主机,通过高速背板互连及相应软件技术连接成一个计算集群,共享所有计算资源,提供大规模计算能力。集群中的每一个节点均为一台独立主机,可实现独立主机的全部功能。
集群是一组相互独立的计算机,利用高速通信网络组成一个单一的计算机系统,并以单一系统的模式加以管理。其出发点是提供高可靠性、可扩充性和抗灾难性。一个集群包含多台拥有共享数据存储空间的服务器,各服务器通过内部
局域网相互通信。当一台服务器发生故障时,它所运行的应用程序将由其他服务器自动接管。在大多数模式下,集群中所有的计算机拥有一个共同的名称,集群内的任一系统上运行的服务都可被所有的网络客户使用。采用集群系统通常是为了提高系统的稳定性和网络中心的数据处理能力及服务能力。
集群技术由于采用共享存储设备,所以增加了外设费用。
二、 硬件分区
硬件分区,是将一台服务器的硬件分割成多个分区的体系结构。将服务器配置的处理器、内存和I/O控制器等硬件资源分配给多个分区,让各分区上运行不同的OS,也就是提供“分区功能”。利用系统的硬件分区能力,系统可同时为多种不同操作系统提供支持,从而满足客户对相同物理硬件不断增长的需求。系统分区最初是静态的,当资源从一个分区移到另一个分区时,这两个分区中的应用和操作系统需要停止,在操作控制台对系统重新配置后,应用和操作系统才可以重新启动。随着操作系统进一步完善,操作系统在支持热插拔和热添加能力的同时,也为动态分区提供了所需要的支持基础,这就是说,资源可以在各个分区之间移动,而不会影响这一分区中的应用运行。
惠普公司的中高端服务器采用目前最先进的体系结构 —CCNUMA,
CCNUMA是全新的Crossbar结构,即点对点数据交换技术,而不是共享总线。在内存访问上,单个Cell是SMP方式(对称多处理),而对于整个服务器,是立体交换技术(Crossbar)方式,硬件分区功能是cc-NUMA体系结构所带来的直接利益,硬件分区强大的灵活性与高可用特性已经在各行各业用户的生产实践中得到了广泛的应用与认同,并逐渐成为用户选型的基本准则之一。
HP UNIX环境添加了大型机式的分区功能,即硬件分区——允许单一服务器系统在同一服务器被物理地划分成多个独立系统,这些独立系统可用来有效地在单一服务器上拆分资源、合并应用、灵活地进行资源管理,并提高可用性和可扩展性。在其核心,硬件分区支持资源的用户定义灵活分区,并可隔离软硬件错误。
一个分区由一或多个单元组成,它们在高带宽、低延迟交叉结构上相互通信。单元被分组成称为节点的物理结构。每个分区运行自己的独立操作系统。不
同分区可以执行操作系统的相同或不同版本,它们也可执行不同的操作系统(如HP-UX、NT、Linux)。
每个分区都有自己独立的CPU、内存和由构成分区的单元资源组成的I/O资源。资源可从一个分区删除并添加至另一分区,这其中无需物理操作硬件,只需使用属于系统管理界面的命令即可。而且使用动态重新配置的相关功能(如在线添加、在线删除),可向分区添加新资源,而且可在分区持续运作的同时删除和更换故障模块。
不同的硬件分区可运行相互隔离的操作系统,使用户的不同应用可完全独立地运行于不同硬件分区,任何硬件分区的故障都被有效隔离,不会对相邻分区造成任何影响。这种服务器内部硬件分区的功能非常适合于大型的系统整合项目。可以有效的利用服务器的处理资源,同时减少用户投资,用户不再需要配置多台独立的服务器,未来根据业务需要可采用一台高端服务器内部分区的方式,实现应用系统整合。
cc-NUMA体系结构的出现成为在大、中型服务器级别上取代传统SMP体系结构的必然趋势。目前在业界大多数厂商的中高档服务器上,已被广泛采用从而成为技术发展主流,如:HP rp7410/rp8400/SuperDome、CPQ GS80/160/320、SUN Fire3800/4800/6800/12000/15000等,而唯独IBM p系列的各款服务器仍然沿用传统的SMP体系结构。由于SMP体系结构所存在的总线竞争、不易扩展等问题,严重限制了主机资源扩充时系统性能的线性增长;因此,IBM p系列高端服务器在CPU数量的扩展上比较受限,因此IBM p系列服务器的性能提升目前只能靠不断提高单个CPU的性能来实现。
IBM p系列服务器仍然沿用传统的SMP体系结构,因此全线p系列服务器产品无硬件分区功能。IBM实际上也早已意识到了NUMA体系结构的卓越性能优势,IBM在1998年收购Sequent(思群)公司就是为了获得其NUMA-Q系列服务器的体系架构技术。然而非常遗憾的是,四年来的整合并未将NUMA技术引入到p系列服务器之中。
三、 虚拟逻辑分区
虚拟逻辑分区(LPAR)在资源分组以及形成分区的方式上不同于硬件分区。
他不按照物理建筑模块分组,而是从可用系统资源所组成的全部资源池中选择组件。虚拟逻辑分区在单一内存配置域内工作,所以它可以用在简单的SMP内而无须特殊的建筑模块结构。所有的操作系统映像都在同一内存映射中运行,但通过硬件上特殊的地址访问控制机制相互保护,系统中还可以加入特殊的固件以支持操作系统。
惠普的虚拟逻辑分区Virtual Partitioning由整个系统或者一个nPartition范围之内的一个或者多个CPU组成,可借助软件命令建立。虚拟分区不受内部物理系统板的限制,处理器、内存和I/O插槽可以分配给任何分区而无须涉及其物理位置。不同的虚拟分区上允许存在多种版本的HP-UX操作系统。虚拟分区可以独立启动,每个分区都执行自己的HP-UX操作系统,可以在完全隔离的情况下驻留自己的应用。在多个分区中,资源可从一个分区删除并添加至另一分区,这个过程无需硬件的物理操作,只需在系统管理界面上进行相应的配置即可。如系统管理员可以将CPU从一个虚拟分区动态删除并添加到另一个,而无需系统重新启动。
传统的UNIX系统,其对CPU和内存资源的分配是根据进程优先级动态分配的,而没有考虑生成这些进程的用户优先级。如果系统出现满负荷运行,所有的进程都出现等待,而不论该进程的用户是关键的或非关键的。如果非关键用户有意或无意生成大量进程,这些进程将抢占大量的CPU资源,从而阻塞关键用户和关键应用,HP虚拟分区技术可实现动态的资源调整。
HP在2001年9月开始提供虚拟分区的功能,即在一个HP 9000服务器硬分区上启动多个HP-UX 11i内核。不同的虚拟分区之间在软件上都是隔离的,可安装不同的应用系统,数据库系统。不同的虚拟分区还可以实施MC/ServiceGuard高可用性群集。惠普已能够在整个高、中、低档服务器产品线上提供这种分区功能。
IBM逻辑分区功能的推出,是其为填补其没有硬件分区技术所带来的负面影响而采纳的方法,具备此功能的前提必须为采用Power4芯片并运行AIX5L操作系统;因此,只有p系列中的新款p690/p670/p650服务器具备逻辑分区功能,而p系列中其他大部分服务器不具备逻辑分区功能。目前, AIX 5.1操作系统上
还不能进行逻辑分区动态地资源调配,只在最新的AIX 5.2操作系统上支持动态资源调配。并且IBM的WLM只能控制CPU使用率、内存使用率,不能控制I/O使用率。
pSeries 690支持一台服务器上可以同时存在最多16个逻辑分区。一个分区必须包括一些基本资源,比如至少一个处理器、1GB内存和充足的I/O容量等。pSeries 690实现的分区物理资源可以不受内部物理系统板的限制而分配给一个分区,处理器、内存和I/O插槽可以分配给任何分区而无须涉及其物理位置。比方说,同一个Power4硅芯片上的两个处理器就可以分配给不同的分区使用。PCI插槽单独分配给分区,而内存以固定的增量为单元进行分配。每个分区都运行在自己的AIX操作系统上并且同其他分区的任何活动隔离。
但是由于分区是通过划分单一服务器得以创建的,所以某些硬件组件将被所有的分区共享,这意味着某些组件在出现故障的情况下可能影响系统上多个分区。
四、 资源软件分区
资源分区技术指为工作量管理建立的独特分区。资源分区一般运行于同一个操作系统内,由称为资源管理器的管理软件予以控制,系统管理员根据当前待处理任务的优先等级,为不同的任务动态地划分不同比例的资源。在每个虚拟分区内,可借助Process Resource Manager(PRM)或HP-UX Workload Manage(WLM)等解决方案建立和使用多达64个资源分区。
HP 的负载管理软件(Workload Manager)和资源管理软件PRM可以提供更高层的管理,通过检测CPU、内存等资源的利用率,根据用户的优先级,动态地在虚拟分区间进行调整,从而保证关键用户和关键应用的响应时间。例如规定用户任务的完成时间,即基于目标的定义,Workload Manager就自动对系统资源进行调度,无须手工配置。
2024年1月23日发(作者:塔芷)
HP 分区技术解析
对于服务器而言(不管是PC服务器,还是UNIX服务器),单纯地提高单个处理器的运算能力和处理能力正在变得越来越难,虽然许多制造商从材料、工艺和设计等方面进行了不懈的努力,近期内仍然使得CPU保持着高速的增长势态,但高频之下的高功耗所引起的电池容量问题和散热问题等负面效应,以及这些负面效应对整机系统产生的电磁兼容性问题,又反过来将CPU运算能力的提升推到了暮年。显然,提高单个处理器速度和性能已是强弩之末,而研发多个CPU的并行处理技术,才是真正提高现代服务器处理能力和运算速度的有效途径。这也正是多处理器服务器不仅是UNIX服务器的专利,而且也是已经在PC服务器中普遍采用的原因。
而单机内CPU数量的增加也是有限的,CPU数量的增加必然会增加系统总线的压力,同时增加了系统管理和调度的复杂性,并反过来影响整机性能。
分区技术正是在这种两难的境况中诞生的。服务器分区技术可将服务器的CPU、内存、I/O等资源合理地进行分区和调配,不同分区内可以执行不同的操作系统或同一操作系统的不同版本,最大限度地挖掘了服务器的性能,一台服务器甚至可以当作几十台使用,提高了硬件利用率。并且,在任何某个分区发生故障时,都不会影响其他分区的运行,不同分区的应用之间保持独立性。
根据IDC的统计,目前分区技术主要分为四大类,即集群、物理硬件分区、虚拟逻辑分区和软件分区技术,而真正可以实现分区间故障隔离的只有集群和硬件分区技术。如下图所示:
分区技术源于大型机,惠普公司率先将该技术引入到开放系统中,于2000年在HP9000 Superdome上利用HP-UX11i实现了上述全部四种分区技术,并陆续将该技术推广到惠普全线UNIX小型机上。目前惠普中高档UNIX服务器,包括RP7410、RP8400以及Superdome支持全部四种分区技术,中低档如RP54XX系列和RP24XX系列支持集群、虚拟逻辑分区和软件分区三种分区技术。
目前各厂商均紧随惠普公司,在其开放系统中引进分区技术,如IBM在AIX5.X操作系统中引入逻辑分区,SUN在其SUN Fire系列服务器中引入硬件分区技术。但是由于各厂家产品体系结构的不同,产品发展策略各异,因此引入和实现分区功能的程度也各不相同,如下图所示:
一、 集群分区
集群(Cluster)技术是近几年兴起的发展高性能计算机的一项技术。目前各主流厂商包括微软均有自己非常成熟的解决方案。该技术的出现是由于当时技术所限,单节点主机无法承担大规模计算应用的需要,因此提出将多台小规模计算主机,通过高速背板互连及相应软件技术连接成一个计算集群,共享所有计算资源,提供大规模计算能力。集群中的每一个节点均为一台独立主机,可实现独立主机的全部功能。
集群是一组相互独立的计算机,利用高速通信网络组成一个单一的计算机系统,并以单一系统的模式加以管理。其出发点是提供高可靠性、可扩充性和抗灾难性。一个集群包含多台拥有共享数据存储空间的服务器,各服务器通过内部
局域网相互通信。当一台服务器发生故障时,它所运行的应用程序将由其他服务器自动接管。在大多数模式下,集群中所有的计算机拥有一个共同的名称,集群内的任一系统上运行的服务都可被所有的网络客户使用。采用集群系统通常是为了提高系统的稳定性和网络中心的数据处理能力及服务能力。
集群技术由于采用共享存储设备,所以增加了外设费用。
二、 硬件分区
硬件分区,是将一台服务器的硬件分割成多个分区的体系结构。将服务器配置的处理器、内存和I/O控制器等硬件资源分配给多个分区,让各分区上运行不同的OS,也就是提供“分区功能”。利用系统的硬件分区能力,系统可同时为多种不同操作系统提供支持,从而满足客户对相同物理硬件不断增长的需求。系统分区最初是静态的,当资源从一个分区移到另一个分区时,这两个分区中的应用和操作系统需要停止,在操作控制台对系统重新配置后,应用和操作系统才可以重新启动。随着操作系统进一步完善,操作系统在支持热插拔和热添加能力的同时,也为动态分区提供了所需要的支持基础,这就是说,资源可以在各个分区之间移动,而不会影响这一分区中的应用运行。
惠普公司的中高端服务器采用目前最先进的体系结构 —CCNUMA,
CCNUMA是全新的Crossbar结构,即点对点数据交换技术,而不是共享总线。在内存访问上,单个Cell是SMP方式(对称多处理),而对于整个服务器,是立体交换技术(Crossbar)方式,硬件分区功能是cc-NUMA体系结构所带来的直接利益,硬件分区强大的灵活性与高可用特性已经在各行各业用户的生产实践中得到了广泛的应用与认同,并逐渐成为用户选型的基本准则之一。
HP UNIX环境添加了大型机式的分区功能,即硬件分区——允许单一服务器系统在同一服务器被物理地划分成多个独立系统,这些独立系统可用来有效地在单一服务器上拆分资源、合并应用、灵活地进行资源管理,并提高可用性和可扩展性。在其核心,硬件分区支持资源的用户定义灵活分区,并可隔离软硬件错误。
一个分区由一或多个单元组成,它们在高带宽、低延迟交叉结构上相互通信。单元被分组成称为节点的物理结构。每个分区运行自己的独立操作系统。不
同分区可以执行操作系统的相同或不同版本,它们也可执行不同的操作系统(如HP-UX、NT、Linux)。
每个分区都有自己独立的CPU、内存和由构成分区的单元资源组成的I/O资源。资源可从一个分区删除并添加至另一分区,这其中无需物理操作硬件,只需使用属于系统管理界面的命令即可。而且使用动态重新配置的相关功能(如在线添加、在线删除),可向分区添加新资源,而且可在分区持续运作的同时删除和更换故障模块。
不同的硬件分区可运行相互隔离的操作系统,使用户的不同应用可完全独立地运行于不同硬件分区,任何硬件分区的故障都被有效隔离,不会对相邻分区造成任何影响。这种服务器内部硬件分区的功能非常适合于大型的系统整合项目。可以有效的利用服务器的处理资源,同时减少用户投资,用户不再需要配置多台独立的服务器,未来根据业务需要可采用一台高端服务器内部分区的方式,实现应用系统整合。
cc-NUMA体系结构的出现成为在大、中型服务器级别上取代传统SMP体系结构的必然趋势。目前在业界大多数厂商的中高档服务器上,已被广泛采用从而成为技术发展主流,如:HP rp7410/rp8400/SuperDome、CPQ GS80/160/320、SUN Fire3800/4800/6800/12000/15000等,而唯独IBM p系列的各款服务器仍然沿用传统的SMP体系结构。由于SMP体系结构所存在的总线竞争、不易扩展等问题,严重限制了主机资源扩充时系统性能的线性增长;因此,IBM p系列高端服务器在CPU数量的扩展上比较受限,因此IBM p系列服务器的性能提升目前只能靠不断提高单个CPU的性能来实现。
IBM p系列服务器仍然沿用传统的SMP体系结构,因此全线p系列服务器产品无硬件分区功能。IBM实际上也早已意识到了NUMA体系结构的卓越性能优势,IBM在1998年收购Sequent(思群)公司就是为了获得其NUMA-Q系列服务器的体系架构技术。然而非常遗憾的是,四年来的整合并未将NUMA技术引入到p系列服务器之中。
三、 虚拟逻辑分区
虚拟逻辑分区(LPAR)在资源分组以及形成分区的方式上不同于硬件分区。
他不按照物理建筑模块分组,而是从可用系统资源所组成的全部资源池中选择组件。虚拟逻辑分区在单一内存配置域内工作,所以它可以用在简单的SMP内而无须特殊的建筑模块结构。所有的操作系统映像都在同一内存映射中运行,但通过硬件上特殊的地址访问控制机制相互保护,系统中还可以加入特殊的固件以支持操作系统。
惠普的虚拟逻辑分区Virtual Partitioning由整个系统或者一个nPartition范围之内的一个或者多个CPU组成,可借助软件命令建立。虚拟分区不受内部物理系统板的限制,处理器、内存和I/O插槽可以分配给任何分区而无须涉及其物理位置。不同的虚拟分区上允许存在多种版本的HP-UX操作系统。虚拟分区可以独立启动,每个分区都执行自己的HP-UX操作系统,可以在完全隔离的情况下驻留自己的应用。在多个分区中,资源可从一个分区删除并添加至另一分区,这个过程无需硬件的物理操作,只需在系统管理界面上进行相应的配置即可。如系统管理员可以将CPU从一个虚拟分区动态删除并添加到另一个,而无需系统重新启动。
传统的UNIX系统,其对CPU和内存资源的分配是根据进程优先级动态分配的,而没有考虑生成这些进程的用户优先级。如果系统出现满负荷运行,所有的进程都出现等待,而不论该进程的用户是关键的或非关键的。如果非关键用户有意或无意生成大量进程,这些进程将抢占大量的CPU资源,从而阻塞关键用户和关键应用,HP虚拟分区技术可实现动态的资源调整。
HP在2001年9月开始提供虚拟分区的功能,即在一个HP 9000服务器硬分区上启动多个HP-UX 11i内核。不同的虚拟分区之间在软件上都是隔离的,可安装不同的应用系统,数据库系统。不同的虚拟分区还可以实施MC/ServiceGuard高可用性群集。惠普已能够在整个高、中、低档服务器产品线上提供这种分区功能。
IBM逻辑分区功能的推出,是其为填补其没有硬件分区技术所带来的负面影响而采纳的方法,具备此功能的前提必须为采用Power4芯片并运行AIX5L操作系统;因此,只有p系列中的新款p690/p670/p650服务器具备逻辑分区功能,而p系列中其他大部分服务器不具备逻辑分区功能。目前, AIX 5.1操作系统上
还不能进行逻辑分区动态地资源调配,只在最新的AIX 5.2操作系统上支持动态资源调配。并且IBM的WLM只能控制CPU使用率、内存使用率,不能控制I/O使用率。
pSeries 690支持一台服务器上可以同时存在最多16个逻辑分区。一个分区必须包括一些基本资源,比如至少一个处理器、1GB内存和充足的I/O容量等。pSeries 690实现的分区物理资源可以不受内部物理系统板的限制而分配给一个分区,处理器、内存和I/O插槽可以分配给任何分区而无须涉及其物理位置。比方说,同一个Power4硅芯片上的两个处理器就可以分配给不同的分区使用。PCI插槽单独分配给分区,而内存以固定的增量为单元进行分配。每个分区都运行在自己的AIX操作系统上并且同其他分区的任何活动隔离。
但是由于分区是通过划分单一服务器得以创建的,所以某些硬件组件将被所有的分区共享,这意味着某些组件在出现故障的情况下可能影响系统上多个分区。
四、 资源软件分区
资源分区技术指为工作量管理建立的独特分区。资源分区一般运行于同一个操作系统内,由称为资源管理器的管理软件予以控制,系统管理员根据当前待处理任务的优先等级,为不同的任务动态地划分不同比例的资源。在每个虚拟分区内,可借助Process Resource Manager(PRM)或HP-UX Workload Manage(WLM)等解决方案建立和使用多达64个资源分区。
HP 的负载管理软件(Workload Manager)和资源管理软件PRM可以提供更高层的管理,通过检测CPU、内存等资源的利用率,根据用户的优先级,动态地在虚拟分区间进行调整,从而保证关键用户和关键应用的响应时间。例如规定用户任务的完成时间,即基于目标的定义,Workload Manager就自动对系统资源进行调度,无须手工配置。