磁盘阵列柜的设计挑战

2008-9-4  选择字号:  | |
打印本文章

  一个SCSI 硬盘的平均故障间隔时间(MTBF, Mean Time Between Failure),都在数万小时以上,在正常使用情况下,要坏掉一个硬盘已经很不容易了。在同一系统内,两个磁盘驱动器同时坏掉的机率,更是微乎其微。但是,如果把磁盘驱动器放在布满杀手的环境内,就另当别论了。

  构建一个磁盘阵列存储系统,可靠度远比速度来的重要。因此,不但要选一个高性能的阵列控制器,更要慎重地挑一个高可靠度的磁盘阵列柜。因为,宝贵的数据不是存在数组控制器里,而是存放在磁盘驱动器里;而磁盘驱动器又是放在磁盘阵列柜内。所以,要仔细挑选一个可靠的磁盘阵列柜,来当磁盘驱动器的神盾,千万不要挑一个磁盘驱动器杀手!

  磁盘阵列柜的设计挑战

  由于磁盘驱动器的技术以及传输接口的技术不断的发展,磁盘阵列系统的设计随时都面临新的挑战,以便符合与日俱增的要求。一个优质的磁盘阵列柜,必须在设计阶段,就要考虑到其规格必须符合更大容量、更高转速磁盘驱动器的需求,提供:稳定、高容量、容错的电源供应系统;可靠、高性能、容错的冷却系统,能够克服震动的机械结构,支持SCA2 热抽换接头之被动背板,一体成型、无主动组件之磁盘载盒,数组柜环境监控与警示功能,直接热抽换且方便的维护操作功能,最佳的空间利用。

  以下我们就针对这些规格和功能,提供一些建议。

  稳定,高容量,容错的电源供应系统

  如果各位仔细看看磁盘驱动器的规格书,您会发现磁盘驱动器马达启动时,需要很大的启动电流〈约2A〉,约为平常读写时〈约0.66A〉的3倍;磁盘驱动器在SEEK时,需要很大的瞬间电流(约2.1A),约为读写时(约0.66A)的3倍。因此,电源供应系统必须能提供足够、稳定之瞬间电流,否则会造成磁盘驱动器无法启动,甚至造成数据写入错误(此为导致RAID磁盘驱动器被RAID 制器判定为Down,但磁盘驱动器送回原厂测试却无故障之原因)。当磁盘驱动器转速越来越快,SEEK 速度也越来越快时,电源供应器必须提供足够的容量,以因应将来扩充的需求。

  具备容错,热抽换、负载分享之双电源供应器,是不可或缺的,更重要的是,如果电源供应器发生故障,要能不必下螺丝就能热抽换电源供应(使用螺丝起子解螺丝会造成震动及摇摆,会损害工作中之磁盘驱动器)。

  有了双电源供应器,更要具备两组电源输入,一个接到市电,一个接到UPS。如此,无论突然断电,或UPS故障,都不会造成 RAID 当机。

  好的电源供应系统,还须具备交流电压与频率自动选择及调整,以适用不同电压及频率,更重要的是,要能克服电压及频率不稳之状况。在用电尖峰时段,市电电压可能降到100伏特以下,而在非用电尖峰时段,市电电压可能升到120伏特以上,因此电源供应系统必须能够容忍这些电压变化,提供磁盘驱动器稳定的电压和电流,否则可能造成磁盘驱动器故障,甚至数据写入错误。磁盘阵列柜的电源供应系统,最好能够提供从85到260伏特无段自动调整,如此,无论插到哪种插座,市电品质如何变化,都不会影响磁盘阵列的功能。

  可靠,高性能容错的冷却系统

  在许多案例中,我们发现冷却系统设计不完善的磁盘阵列柜,只能装设7200转的磁盘驱动器,若使用10,000 转的磁盘驱动器,系统就会过热。现在,Seagate已经推出15,0000转的磁盘驱动器了,如何挑选一个具备可靠、高性能、容错之冷却系统的磁盘阵列柜,就更显得重要了。

  一般磁盘阵列柜之设计,在每个磁盘驱动器载具上加装小风扇,整个系统再装数个大风扇,用边吸边吹的方式散热,不但散热效果不好,而且是产生磁盘驱动器故障的潜在因素,它带来的危害有以下这些:

  1,产生大量气流将粉尘吹入系统,污染磁盘驱动器及风扇本身造成故障。

  2,采用一般PC用小风扇,且数量多〈转动机械零件越多,故障机率越高〉,系统可靠度因而巨幅降低。

  3,一旦有一个小风扇故障,相关磁盘驱动器便无法获得足够散热而故障。

  一个优质磁盘阵列柜之冷却系统的设计,必须完全符合热力学理论之全方位冷却:热传导、热对流及热辐射之三相散热方式,才能更有效率、可靠度更高:

  1,磁盘驱动器载盒必须采用黑色、高导热系数之金属〈如铝合金〉,并与载盒紧密接触固定,如此可以最快最有效地将磁盘驱动器之热能传导至整个载盒,然后以最大辐射面积与最佳辐射颜色〈黑色〉,将热能辐射至机体内空气中,再以中央系统涡轮抽风机将热空气以对流方式排出。

  2,磁盘驱动器载盒不能使用风扇,及其它任何主动组件,以免本身故障而损及磁盘驱动器。

  3,系统采用中央抽风排热设计,须使用两个以上之工业用涡轮抽风机〈不可用一般PC用风扇〉,以提高可靠度与排热效率。由于工业用涡轮抽风机本身可以防止轴承被粉尘污染,且抽气效率极高,可将机体内热空气抽出,并在机体内产生很大的相对低压,冷空气便可由经过精密设计之对流孔,均匀地进入机体内,达到最佳对流散热效果。

  4,中央系统涡轮抽风机必须具备热抽换功能,且能够自动温控转速,以达到最佳之排热性能与能源使用效率只需一部涡轮抽风机就足以维持系统散热之最低限度。工业用涡轮抽风机之出气口面积只有一般PC用风扇1/10,因此即使有任何风扇因故停止运转,也不致影响整个系统之热对流结构。
  
  防震机械结构

  由于磁盘阵列的特性,当存取阵列中的数据时,阵列中所有的磁盘驱动器的磁头,都几乎在同时,往同一个方向SEEK,又几乎同时在相同的位置煞车,其惯性动量非常之大。因此造成很大的震动问题。如果磁盘阵列柜的机械结构不能克服这些震动问题,轻则造成Re-Seek,严重的话,会导致碟面受损,数据遗失。

原文出处:http://www.ciotimes.com/infrastructure/storage/b/storage200805010800.html?currentPage=2
来源:CIO时代网    
Storwize全球市场部副总裁Peter Smails列出了四个主存储具备的条件:如果你认为你所做的努力是值得的,必须做一个高平均数据缩减……
业内分析师和存储专家们均认为,Kryder定律指出的增长率在当前这种硬盘技术水平下是不可能实现的。 在过去的三年中,硬盘密度的年增长率一直维持在30%到40%之间……
英特尔公司承诺,其下一代固态硬盘(SSD)接口的速度将更快,而且持续时间更长,但是从短期来看,笔记本电脑将继续使用串行ATA(SATA)接口。
中等规模的公司虽然能很容易地部署中端存储平台,但是,在选择磁盘阵列产品时,仍应仔细考虑成本、性能和管理等因素……
SanDisk本周表示已经针对固态盘开发出了一种闪存文件系统,该系统将极大地提高现有产品的写速度。SanDisk公司将这种技术命名为ExtremeFFS,该产品将于明年上市。
几年前持续数据保护(CDP)出现时,人们都认为这种产品能够取代传统的备份软件。当时CDP供应商预测IT管理人员都会放弃原来的备份软件,因为它们需要每周一次完全备份、每天一次增量备份……
公司要采购各种各样的设备,在采购的过程中会有很多的技巧。了解这些技巧对我们来说是非常重要的,必要时可以起到事半功倍的效果。
交换机在应用中会出现很多问题,为了在网络中能够满足更多的存储平台或主机服务器,交换机需要定期扩展或替换。交换机通过升级可以达到更好的性能,增强网络的有效性,限制网络流量并提供智能化功能,比如对网络的虚拟化。
最新更新
专家答疑
技巧
Pierre Dorion
我们要购买5TB SATA存储系统,这个系统可以升级到50TB,并且可以和SATA、FATA共用。它也应该能支持多重OS和RAID级别,哪一个对于我们的需求是最好的套件呢?
Jo Maitland
SaaS存储服务会减少存储设备总数和购买的存储容量吗?近期看来没有什么显著的不同。但是从长期看,随着越来越多的服务建立在云计算上……
Greg Schulz
我们有两个负载均衡网络服务器,都是可用的,正在尽力访问SAN上的相同的LUN。我们在操作系统和EMC SAN上用Windows2003标准版本。我们如何实现并行写入SAN……