
1. 服务器数据恢复故障描述
服务器型号: HP P2000
服务器操作系统: VMWARE ESX
服务器文件系统: VMFS
磁盘阵列级别: RAID-5

需要恢复数据的服务器上装有8个硬盘,以形成RAID-5磁盘阵列,其中磁盘4是热备用磁盘,并且在服务器正常运行期间,两个硬盘均处于打开状态. ×××故障灯由用户打开并维护. 经人事检查,故障硬盘应该是物理故障,表现为: 序列号无法读取,SAS扩展卡上硬盘无法识别. 需要将数据还原到RAID磁盘阵列

2. 硬盘物理故障修复
由于服务器严重故障,必须首先确定raid阵列的磁盘断开连接的原因. 收到用户服务器后,工程师将优先考虑raid阵列中的两个断开连接的磁盘,并将故障磁盘连接到外部SAS扩展. 当插卡上电并经过测试时,磁头不会跟踪. 工程师分离了PCB,并检查了硬盘的HDA组件. 发现有一些氧化. 清洁操作后,再次打开电源后仍无法找到轨迹. 因此,工程师进行非常复杂的磁盘维修工作(在洁净室中禁止拍照. 没有磁盘维修过程的图片)
由于热备用磁盘是普通硬盘,因此可以用作备用磁盘. 因此,硬件工程师打开备件磁盘(即RAID阵列中的磁盘4),卸下PCB并将其安装在故障磁盘上,以更换故障磁盘的PCB进行维修,然后卸下ROM芯片. 将故障磁盘PCB更换为新的PCB. 硬盘硬件维修完成后,可以再次对故障硬盘进行测试,并可以正常旋转,磁头寻声正常,但敲击声明显. 由于4号磁盘的磁头与发生故障的磁盘不匹配,因此在找到其他附件后更换磁头可以正常识别硬盘并成功镜像发生故障的数据.

3. 重新整理RAID-5磁盘阵列
使用数据恢复工具打开7个磁盘,并发现所有硬盘的0扇区均带有“ 55 AA”标记. 0x01C2H表示分区的类型. 此处显示“ 05”,表示这是扩展分区. 因此,从扇区0看,这是一个异常的MBR分区结构.
按照此方法,我们继续搜索并在第7和第8个磁盘上找到“ 55 AA”标记. 8号磁盘查询的结果如下. 这是一个正常的MBR分区,值为0x01C6表示所指向的下一个扇区是GPT的头部.

对磁盘7的查询结果如下. 0x01C6处的值表示它指向下一个扇区. 但是下一个部门显然不是GPT的负责人.


可以确定磁盘8是第一个磁盘,而磁盘7可能是最后一个磁盘. GPT分区所在的扇区从扇区172032开始,因此初步确定LUN的起始扇区为172032.
知识补充课: 条带化也是raid阵列块,它是RAID处理数据的基本单位. 不同的RAID阵列具有不同的条带大小. RAID-5的一个条带组中只有一个奇偶校验区域. 根据该规则,可以分析raid-5阵列,并且也可以通过比较方法确定条带大小. 例如,条带组中的检查区域可能与此条带组中的非检查区域明显不同. 您可以通过检查并与WinHex比较来找到带材尺寸. 工程师分析了服务器的RAID阵列,发现条带大小为1024个扇区.
根据1024个扇区进行拆分,使一个记录的大小变成一个条带的大小,如图5所示. 然后有7个磁盘跳到同一记录283123.


将7个磁盘放在同一位置时,可以通过比较判断奇偶校验区域的方向,然后可以判断整个RAID-5的方向. 已经判断出第8个磁盘是之前的第一个磁盘. 将第8个磁盘放在第一位置,并确保RAID-5位于左侧,并且磁盘顺序为8、2、3、4、1、7、5.

工程师最初确定LUN的起始扇区为172032扇区. 使用数据恢复工具跳至172032扇区以观察硬盘的使用情况. 通常情况下,该扇区所属条带中的5号磁盘应该是验证区域,但在实际情况下,该验证区域将显示为8号磁盘. 根据突袭向左的规则,磁盘5的验证区域应在扇区172032-1024 = 171008中,这是最后一个条带. 跳转到扇区171008,发现验证区域为磁盘5. 因此,可以确定LUN的起始扇区为扇区171008.
使用数据恢复工具重组团队并根据确定的磁盘顺序添加团队,如图所示. 选择RAID-5,条带大小512KB,保持异步状态.

点击构建以重新组织. 分组后,由于数据从1024 * 8 = 8192个扇区开始,因此,如果恢复工具不具有跳转到该扇区的功能,则必须使用文件再次重建新组装的RAID. RAID起始扇区(起始扇区)选择8192,此文件可以任意选择起始扇区和大小(计数扇区),下图显示了重组后的raid5磁盘阵列.

4. 服务器数据恢复结果
客户已验证RAID-5磁盘阵列的重建并通过验证,服务器数据恢复成功.
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/dianqi/article-304886-1.html
毕竟有几百万人去取外国新娘了
但发展方向是对的