RAID5两快盘出现黄灯后的恢复

2007-12-10  选择字号:  | |
打印本文章

  问:RAID5两快盘出现黄灯后的恢复

  环境:IBM P610主机+4channel scsi raid 卡,4个18Gdisk作raid5,没有hotspare.

  第一天:客户说有一个盘黄灯亮

  第三天:另外一个盘黄灯亮

  #lspv的时候输出只有

  hdisk0 000b85cdf79f0ec5 rootvg

  而做完RAID后的disk没有了

  #lsdev -Cc disk

  hdisk0 Available 10-60-00-0,0 16 Bit LVD SCSI Disk Drive

  hdisk1 Defined 20-60-00-0,0 SCSI Disk Array RAID 5

  VG不能varyon

  diag运行出现下面的错误.

  The Service Request Number(s)/Probable Cause(s)

  (causes are listed in descending order of probability):

  66D-111: The disk has been failed by the adapter.

  FRU: n/a [18CCH/ID 2B

  Physical Disk

  66D-111: The disk has been failed by the adapter.

  FRU: n/a [18CCH/ID 2C

  Physical Disk

  答:恢复操作步骤:

  1\#smitty pdam

  List PCI SCSI Disk Arrays

  Create a PCI SCSI Disk Array

  Delete a PCI SCSI Disk Array

  Configure a Defined PCI SCSI Disk Array

  Change/Show a PCI SCSI Disk Array

  Reconstruct a PCI SCSI Disk Array

  Revive a FAILED Drive in a PCI SCSI Disk Array

  Fail a Drive in a PCI SCSI Disk Array

  Change/Show PCI SCSI RAID Drive Status

  Perform Consistency Check

  Display Status of Adapter Write Cache

  Recovery Options\

  选择List PCI SCSI Disk Arrays

  7mscraid0 Available 20-60 PCI 4-Channel Ultra3 SCSI RAID Adapter[出现选择]

  hdisk1 Defined Raid 5 20-60-00-0,0 52072 MB Status DEAD

  hdisk1 2A Channel 2 ID A ONLINE

  hdisk1 2B Channel 2 ID B FAILED DRIVE

  hdisk1 2C Channel 2 ID C FAILED DRIVE

  hdisk1 2D Channel 2 ID D ONLINE

  2\#smitty pdam

  Revive a FAILED Drive in a PCI SCSI Disk Array[目的强行将硬盘给online[/color:67f1065d61]]

  2B Channel 2 ID B FAILED DRIVE

  2C Channel 2 ID C FAILED DRIVE

  选择2B Channel 2 ID B FAILED DRIVE

  PCI SCSI Disk Array hdisk1

  Channel ID C2B

  会车后出现下面的提示

  Continuing may delete information you may want

  to keep. This is your last chance to stop

  before continuing. [26;19HPress Enter to continue.

  Press Cancel to return to the application

  敲会车键继续[ 确认命令完成是ok的 ]

  3\通过List PCI SCSI Disk Arrays查看RAID的状态

  出现scraid0 Available 20-60 PCI 4-Channel Ultra3 SCSI RAID Adapter[进行选择]

  hdisk1 Defined Raid 5 20-60-00-0,0 52072 MB Status DEGRADED

  hdisk1 2A Channel 2 ID A ONLINE

  hdisk1 2B Channel 2 ID B ONLINE

  hdisk1 2C Channel 2 ID C FAILED DRIVE

  hdisk1 2D Channel 2 ID D ONLINE

  注意在这是2B已经是online.

  4\执行diag命令进行诊断,结果显示入下

  The Service Request Number(s)/Probable Cause(s)

  causes are listed in descending order of probability):

  66D-111: The disk has been failed by the adapter.

  FRU: n/a CH/ID 2B

  Physical Disk

  5\#varyonvg datavg

  此时datavg能够varyon,同时文件系统可以mount上,

  6\换上2CChannel上的硬盘,RAID进行数据重建.重建完成后ok

  #smitty pdam

  List PCI SCSI Disk Arrays

  结果如下:

  hdisk1 Available Raid 5 20-60-00-0,0 52072 MB Status OPTIMAL

  hdisk1 2A Channel 2 ID A ONLINE - 17357Meg

  hdisk1 2B Channel 2 ID B ONLINE - 17357Meg

  hdisk1 2C Channel 2 ID C ONLINE - 17357Meg

  hdisk1 2D Channel 2 ID D ONLINE - 17357Meg

  7\#varyonvg datavg[结果显示ok]

  8\#fsck -y /dev/datalv

  ** Checking /dev/rdatalv (/orada)

  ** Phase 0 - Check Log

  log redo processing for /dev/rdatalv

  ** Phase 1 - Check Blocks and Sizes

  Block count wrong, Inode=16388 (ADJUSTED)

  Fragment allocated to file larger than 32k (Inode=16664)

  Fragment allocated to file larger than 32k (Inode=16665)

  Fragment allocated to file larger than 32k (Inode=16666)

  Fragment allocated to file larger than 32k (Inode=16670)

  Fragment allocated to file larger than 32k (Inode=16671)

  Unknown file type I=16785 owner=root mode=0

  size=0 mtime=Jan 18 21:05 1970 (CLEARED)

  .......

  .......

  .......

  size=0 mtime=Jan 01 08:00 1970 (CLEARED)

  ** Phase 5 - Check Inode Map

  Bad Inode Map (SALVAGED)

  ** Phase 5b - Salvage Inode Map

  ** Phase 6 - Check Block Map

  Bad Block Map (SALVAGED)

  ** Phase 6b - Salvage Block Map

  map agsize bad, vm1->agsize = -16385 agrsize = 16384

  map agsize bad, vm1->agsize = -16385 agrsize = 16384

  map agsize bad, vm1->agsize = -16385 agrsize = 16384

  map agsize bad, vm1->agsize = -16385 agrsize = 16384

  map agsize bad, vm1->agsize = -16385 agrsize = 16384

  map agsize bad, vm1->agsize = -16385 agrsize = 16384

  map agsize bad, vm1->agsize = -16385 agrsize = 16384

  map agsize bad, vm1->agsize = -16385 agrsize = 16384

  map agsize bad, vm1->agsize = -16385 agrsize = 16384

  map agsize bad, vm1->agsize = -16385 agrsize = 16384

  map agsize bad, vm1->agsize = -16385 agrsize = 16384

  map agsize bad, vm1->agsize = -16385 agrsize = 16384

  -1 blocks missing

  -1 blocks missing

  Superblock is marked dirty (FIXED)

  -430 files 70114432 blocks 53128488 free

  ***** Filesystem was modified *****

  9\#mount /oradata

  进行读些测试,结果ok.

  在os一级ok,文件系统能正常进行读些.

 


RAID 5
 RAID-1 vs. RAID-5
 RAID4 vs. RAID5
 RAID5配置
 如何提高RAID5数据恢复成功率
 如何计算RAID5上的可用空间
 在RAID5中的最大磁盘数目有多少
 在RAID5中如何计算可用磁盘空间
 扩充RAID5储存容量的小窍门
 RAID5两快盘出现黄灯后的恢复
 RAID6与RAID5数据安全性对比(二)
 RAID6与RAID5数据安全性对比(一)
 3PAR的快速RAID 5
 RAID 5数据恢复图解
 RAID 5EE 阵列级别简介

来源:论坛    作者:佚名    
中等规模的公司虽然能很容易地部署中端存储平台,但是,在选择磁盘阵列产品时,仍应仔细考虑成本、性能和管理等因素……
过去几年来,RAID 6不断推广,已成为购买RAID控制器时必须考虑的一项特性。本文将探讨人们对该技术兴趣不断提高背后的一些原因……
IBM日前发表了最新的存储系统XIV,该产品是由去年并购的以色列公司XIV技术衍生而来,是一种可串连的丛集式存储系统,完全抛弃RAID架构……
RAID技术的应用范围非常广泛,它还可以有效地预防各种类型的系统故障,比如说,凡是在数据写入的过程中发生的错误,一般只有在该数据被调用时才能被监测到。
迄今为止,RAID-6通过SATA技术在现实世界中获得了巨大成功。存储行业分析专家表示,未来的12~18个月将会出现SATA用户的采纳高峰期。
几年前持续数据保护(CDP)出现时,人们都认为这种产品能够取代传统的备份软件。当时CDP供应商预测IT管理人员都会放弃原来的备份软件,因为它们需要每周一次完全备份、每天一次增量备份……
公司要采购各种各样的设备,在采购的过程中会有很多的技巧。了解这些技巧对我们来说是非常重要的,必要时可以起到事半功倍的效果。
交换机在应用中会出现很多问题,为了在网络中能够满足更多的存储平台或主机服务器,交换机需要定期扩展或替换。交换机通过升级可以达到更好的性能,增强网络的有效性,限制网络流量并提供智能化功能,比如对网络的虚拟化。
最新更新
专家答疑
技巧
Pierre Dorion
我们要购买5TB SATA存储系统,这个系统可以升级到50TB,并且可以和SATA、FATA共用。它也应该能支持多重OS和RAID级别,哪一个对于我们的需求是最好的套件呢?
Jo Maitland
SaaS存储服务会减少存储设备总数和购买的存储容量吗?近期看来没有什么显著的不同。但是从长期看,随着越来越多的服务建立在云计算上……
Greg Schulz
我们有两个负载均衡网络服务器,都是可用的,正在尽力访问SAN上的相同的LUN。我们在操作系统和EMC SAN上用Windows2003标准版本。我们如何实现并行写入SAN……