Q1:容错技术的核心是什么?
A1:名词解释:容错,Fault Tolerant。
广义地说,容错技术涵盖很广,内存的ECC校验、网络的奇偶校验、CLUSTER集群、UPS不间断电源、热插拔板卡,RAID磁盘阵列,这些都可以算作容错技术或相应产品。
狭义上讲,按目前业界约定俗成的理解,此间所指的容错主要是指服务器的容错。
容错服务器面向关键业务,主要部件采用冗余配置的方式,在发生掉电、CPU、内存、网卡甚至主板崩溃等意外故障时,服务器上的作业程序能自动切换到备件上并继续运行。
容错技术的核心:从用户的角度说得最明了:作业不停顿,数据不丢失!
- 作业不停顿:故障发生时自动进行切换,客户端服务(如交通收费、银行储蓄、证券买卖,等)实现无死机无等待的连续。
- 数据不丢失:不仅是已处理后存盘的数据不能丢,而且在故障发生时正在处理的当前数据也不能丢失。
容错服务器的最高境界是:零秒无间隙切换,内存数据不丢失。
客户在设计配置容错服务器时,可以以此二条标准作为容错服务器性能的基本要求。
Q2:服务器容错技术是最新出现的技术吗?它的发展历程是什么?
A2:服务器容错技术最早出现于上世纪80年代。
容错技术大致走过了以下三段历程:
1)容错技术诞生于上世纪八十年代。
上世纪八十年代,随着西方信息化建设的普及,服务器容错技术率先在美国登场。
当时有Tandem和Stratus这两家美国公司主要从事硬容错业务,美国Sequent公司则从事和容错相关的集群技术。硬容错系统进入中国已是就是九十年代初期。
2)容错技术在九十年代后期迅速走向消亡。
容错技术的消亡并不是容错技术本身没有生命力,而是硬容错技术的先驱们太不把市场和用户当回事了。
当时硬容错技术可谓是阳春白雪,一套硬容错服务器系统或集群系统动辄上百万美元,真是皇帝女儿不愁嫁,一年不开张,开张吃三年。
但是这样昂贵的代价以及繁杂的技术怎么可能在越来越普及的IT市场上普及呢?除此以外,这些硬容错系统还有一个致命的缺点,那就是系统的封闭性。硬件结构和操作系统甚至是CPU都是各自为政,用户购买了这样的系统回去后还要花费大量的时间做软件移植。
昂贵的价格,封闭的系统,繁杂的操作,在IT标准逐渐规范统一开放的今天就显得太不合时宜了。为了维持高利润而反市场之道行之,最后的结果只能是"自作孽,不可活"。当年高高在上的Tandem、Stratus、Sequent这三家公司在九十年代末都没有逃脱破产或被收购的命运。
3)千禧年之后,容错技术浴火重生柳暗花明。
2000年前后,日本NEC公司重新研究容错技术,有了容错技术一波三折的前车之鉴,NEC这次致力于在通用的Intel 和Microsoft平台上设计容错服务器产品,并在2003年获得成功,在保证硬件容错性能的同时,单套容错服务器的价格也从上世纪的数百万美元下降到数万美元。
容错技术至此终于走出阳春白雪,走进千家万户,开启了一个容错的春天。
Q3:HA双机容错系统是怎么回事?
A3:名词解释:HA,是High Availability的缩写,意即高可用性。
上世纪九十年代末,在容错技术上出现了一个尖锐的矛盾:
一边是基于Intel CPU和Microsoft Windows的通用服务器迅速普及,一边是传统的容错系统坚持使用专有的操作系统和非主流的CPU芯片。换言之,当时在通用平台上(Intel + Microsoft)没有容错服务器的选择。
但是应用系统又不断地投入使用,银行债券等关键业务对容错技术的需求越来越强烈。
在这种需求和技术的冲突局面下,HA双机容错技术诞生了。
HA系统的结构其实很好理解,两台服务器通过链路定期相互侦测,所谓链路一般是指网络或RS串口,两台服务器事先通过容错软件做好脚本配置,当一台服务器发生故障时,另一台服务器可以接管应用继续运行。
HA双机容错系统有很多名称和变种,如双机热备系统、双机双工系统、双机冗余系统,也有商家将两台服务器装在一个大机壳里称之为冗余服务器。
HA双机容错系统的代价不过是两台服务器再加上容错软件(当然,所需要的系统软件或应用软件也需要双份),成本不超过五万人民币。1995-2005年是HA双机系统的黄金时期,铁路、证券、银行、医院等陆续装备了大量的HA双机系统。
HA看上去很美,但却是心酸无奈的选择。业界曾有人将HA双机系统称为穷人的容错机,其原因有二:
一是当时在低端通用平台上的确没有硬容错系统的选择;
二是HA双机系统是一柄双刃剑,价格的确低廉,平台也还通用,但是其痼疾也是一枚定时炸弹。
我们再回到容错系统的定义:运行不间断,数据不丢失。
双机系统在这两点上革命都不彻底。当然,HA 双机系统也不可能彻底做到。因为HA双机系统主要是基于一套容错软件来完成侦测切换的。这套软件是运行在操作系统之上的,CPU故障必然导致操作系统瘫痪,所以故障服务器上的HA软件此时已无法运行,此时根本不可能管理CPU指令和内存数据的同步。
从容错性能上说,HA双机系统和硬容错服务器是两代产品。硬容错服务器推出后,因其容错的彻底性和价格的亲民性,使得HA双机容错系统完成了它的历史使命, 在2005年后HA双机系统在全球逐步退出了历史舞台。
Q4: 如何解读容错服务器的成本构成?
A4:硬容错服务器好在哪里?什么说它比单机服务器和双机容错发生了质的飞跃?关于这个问题,我们换一个角度去谈反而会看得更明白:硬容错服务器为什么价格较传统服务器要高?
容错的最高境界是两台服务器中指令同步,内存不丢失。
单机服务器因为没有处理冗余单元,所以也谈不到容错能力。
HA双机系统因为是基于应用软件来解决容错,所以也不可能追踪到CPU指令或内存数据管理。
真正意义上的容错是100%无间隙的容错,这只有通过硬件完成。
在容错服务器内部,所有部件,包括CPU,内存,主板,网卡,硬盘、电源等部件不仅配备了两套,更核心的是还专门开发了相应的ASIC (Application Specific Integrated Circuit)芯片组以及配套电路,当然也包括相应的底层软件,使之可以在线监控两套系统的运行并完成无间隙在线切换。芯片级的硬件研发是相当困难的,需要大量的资金,技术和时间。对比看看我国"龙芯"芯片的艰难的诞生历程就可想而知了。
另外,业界流行的CPU是Intel的,业界流行的操作系统是微软的,容错硬件,尤其是芯片和底层驱动的开发要涉及Intel CPU和微软的Windows的诸多核心技术,这些技术都是非开放的专利。购买专利昂贵的代价是造成容错系统成本增加的又一个主要原因,目前容错服务器在全球销量还远低于普通服务器,造成开发成本摊薄缓慢,这是容错服务器降价缓慢的另一个原因。
但是考虑到容错服务器只需要配备一套软件即可,如Windows操作系统或Oracle数据库,相对HA双机系统,容错服务器在这方面有了很大的成本节约空间,另外,容错服务器100%的容错性能也对其性价比有很大提升。所以, 在综合成本上容错服务器已和以前的HA双机容错系统处于同一数量级。
Q5:如何从容错角度比较单机服务器、HA双机服务器和容错服务器?
A5:从容错的角度来看,普通服务器、HA双机服务器和硬容错服务器这三者之间不是从低到高的排列,而是三个时代的产品。
1995年之前,普通服务器时代;
1996-2005:双机容错服务器年代;
2006年以后:硬容错服务器年代。
作为用户,如果要辨别三者之间的区别其实也很简单:
普通服务器和双机容错的区别:看看是否有两套CPU/内存配置。这种区别是表象的,所以很容易了解。
双机容错系统和硬容错服务器的区别:看看是否能做到CPU指令同步和内存数据切换。
其实用一个生活中简单的实例比较可以直观地看出三者的性能。
如果把容错性能比做行进速度,普通服务器相当于步行,(5公里/小时),双机容错服务器相当于自行车,(25公里/小时)硬容错服务器相当于汽车。(120公里/小时)
Q6:世界上有哪些容错服务器的制造商和销售商可供选择?
A6:目前全球范围只有两家硬容错服务器硬件生产商,三家品牌销售商。
硬件生产:日本NEC,美国惠普。
品牌销售商:日本NEC/Stratus(美国容错), 美国惠普。
日本NEC主要制造基于Intel CPU 的通用容错服务器,操作系统一般为Windows,VMware或Linux。
日本NEC制造的容错服务器除了NEC 直接销售外, Stratus(美国容错)根据与NEC达成的合同制造协议,也可冠以自己的品牌标识自行销售。
HP的Non Stop服务器是在HP收购传统的容错公司Tandem后发展出来的一款具有容错功能的高端产品。但Non Stop主要面向HPC高性能计算(High Performance Computing)。 如HP的NonStop S系列产品,系统采用RISC CPU, 最多可扩展到4000颗以上,基于HP的ServerNet专用架构,核心操作系统NSK(Non Stop Kernel)为HP专有,一般配置都在人民币百万元以上,属于高端计算产品。
Q7:日本NEC和美国Stratus的产品为什么是一样的?
A7: 容错服务器硬件由日本NEC工厂生产,美国Stratus(美国容错)自己并不设厂制造容错服务器。但NEC和Stratus两家达成合同制造协议,Stratus也可以将NEC工厂生产的容错服务器冠以自己的品牌销售,于是出现了这样一个戏剧化的局面:一台Made in Japan的硬容错服务器,NEC 销售时叫做NEC 5800/ft, 美国容错公司销售时则变成了Stratus ft/server。
Q8:在配置和购买容错服务器时应该注意什么?
A8:
1)平滑移植,兼容性无虞
因为容错服务器基于Intel CPU和微软的Windows操作系统,容错切换对用户是透明的。在兼容性上就像IBM,DELL联想的服务器互换一样,在软硬件移植和兼容问题上无需做额外考虑。
2)容错服务器的三个主要配置指标依然是CPU数目,内存,硬盘。
因为容错服务器的主要目的是为了容错而不是为了快速计算,所以一般选择1-2颗CPU的容错服务器即已敷使用。内存一般在4~256GB即可,硬盘可使用容量可在1-10TB之间根据需要选配,千兆网卡已属标配。
需要注意的是,以上参数一经选择,因为容错服务器的冗余结构,其实都已是选择了双份配置。
3)选购时特别注意容错服务器和双机容错系统的区别,这是完全不同的两代产品。目前市场上的容错服务器只有NEC和美国容错(Stratus)两个品牌,别无分店。
而HA 双机容错系统则有很多名称和变种。如双机热备、双机双工、冗余服务器等。
区分两者的关键技术指标是故障时CPU指令可否同步,内存数据可否切换。
4) 因为容错服务器的特殊性,其售后服务显得尤为重要。
当故障发生时,虽然作业和数据当即发生了切换,没有停顿和丢失,但是如果故障部件不能及时更换,此时的容错服务器就褪变成了单机服务器,存在单点故障可能,蕴藏着很大风险,此后如再发生故障,必将造成灾难性的结果。如何管控容错服务器备件的及时性是容错服务器采购时的一个关键问题。
解决这个问题可从外部和自身两个方面着手。
对外,不能让厂家免责。
容错服务器的采购一般都是经过集成商承包商,但这些公司并不是原厂家,他们的采购源也都来自于容错服务器的中国代理商。一个较大的行业或客户此时应该寻求与厂商NEC或Stratus签订框架服务协议,由厂家对备件的提供时限和年限做出承诺并附以违约处罚条款,这样就可以进一步保证容错服务器备件长期及时的提供。
对内,可做少量备件准备。
在批量采购容错服务器时,可按三比一或五比一的比例,对容错服务器的一些常用部件,如硬盘、电源等做一些未雨绸缪的备件采购以备不时之需。
Q9:容错技术未来的走向是什么?
A9:从容错性能来说,单机服务器没有冗余配置和切换机制,所以无法和容错服务器相比。
从容错的彻底性来说,HA双机系统因为不能做到指令级别的连续,也不能保护切换内存数据,所以HA双机系统和硬容错服务器是两代产品。
单从价格考虑,今天的硬容错服务器还略高于HA双机容错系统,但从性能价格比角度综合考量,硬容错服务器已远高于HA 双机容错,而且硬容错服务器价格会随着普及度进一步趋低。
技术大潮滚滚向前,产品的更新换代也不可避免。就像数字手机终结了当年的BP机一样,容错服务器也是HA双机容错的终结者。
容错服务器将来的发展方向可以预期有以下几点:
1)配置更高的容错服务器
目前因为成本原因,容错服务器最多只是两路CPU配置(共计4颗CPU,两两冗余),随着容错技术的发展,多核多CPU的更高性能的容错服务器有望陆续面世。
2)价格更亲民的容错服务器
装机数量是价格的主要因素。随着容错技术的普及,容错服务器开发成本摊薄进一步加快,售价可以期望会不断降低。
3)可靠性更高的3度容错服务器
目前容错服务器内部硬件都是双冗余配置,这在容错技术上称为2度容错(FT Degree3)在不远的将来,对业务特别关键的应用,或许有三冗余配置的更可靠的容错服务器。三冗余服务器特别强调在备件无法当即提供的情况下,即便发生故障,系统依然具有容错性能。
Q10:和容错技术有关的一些名词解释和对比。
A10:MTBF, HA
1)MTBF, 即平均故障间隔时间,英文全称是"Mean Time Between Failure"。
MTBF是衡量一个产品(尤其是电器产品)的可靠性指标,单位为"小时"。我国对MTBF平均无故障工作时间的规定是4000小时。
我们以联想天启服务器45000小时的MTBF时间为例,解读一下普通服务器的可靠性。
45000小时约为五年。 45000小时的MTBF时间并不是说该种服务器每台均能工作5年不出故障。而应该理解为5年里至少会出一次故障,换言之,即该服务器的平均年故障率为20%,或者说,一年内,平均100台服务器有20台会出故障。
另一个关于MTBF有点尴尬的话题就是MTBF数据的来源。
一个IT产品最新发布的时候,其MTBF数值往往也被厂家同时公布了,而此时该产品不过是零岁而已。MTBF不是经过实际考核而是厂家经过测试推算的,所以可信度还需要仁者见仁智者见智。
2)HA,即高可用性,英文全称是"High Availability"。
HA是衡量一个系统的持续运行能力,一般用百分比表示。 在HA双机容错产品中经常出现这个指标,如99.99%, 99.999%, 99.9999%等。
这一连串的"9"和黄金的含金量不一样。黄金的含金量是经过公开测算度量的,放之四海而皆准,否则就成了假冒伪劣了。但是HA可用性指标是厂家测算的,无法复现度量。各个厂家都有自己的估算办法,所以这一连串的"9"的可测性和可信度甚至低于MTBF。
有些项目标书上曾出现对HA百分数的要求,如要求达到"四个九"、"五个九"等,这其实是不太科学的,无法复现和测度的指标是不能用来做为评判标准的。
----------------------------------------------------------------------------------------------------------------------------
这篇文章以近三十年IT技术的发展历程为背景,介绍了容错技术曲折起伏的发展道路,对容错服务器的核心技术以及HA双机系统的先天不足做了深入探究,同时对目前市场上容错服务器的竞争格局进行了分析。
----------------------------------------------------------------------------------------------------------------------------