沈阳凯文数据恢复中心 服务器数据恢复 各类数据库修复 小型机数据恢复 13386848847 024-31065488 地址:沈阳市和平区三好街同方广场A座10楼1012写字间

RAID/服务器/NAS故障恢复

RAID/服务器/NAS故障恢复
    Pic_20131220001.png
       如果您的服务器(Raid阵列)已出现上述故障中的一项或多项,为了您的数据安全,请及时将服务器(Raid阵列)关机。服务器为了提高性能,通常采用高转速(10000RPM甚至15000RPM)SAS硬盘,如果硬盘由于物理原因离线而不及时对服务器进行断电保护,损坏的磁头可能与碟片长时间接触,将其划伤,影响数据恢复效果,甚至可能导致数据完全无法恢复。
服务器LOGO.jpg
      凯文数据恢复中心支持惠普、IBM、戴尔、浪潮等品牌Raid-0、Raid-1、Raid-4、Raid-5、Raid-6级别及其衍生Raid级别的服务器(Raid阵列)出现故障时的数据恢复。
1、什么是RAID?
      Raid(独立冗余磁盘阵列)是大数据时代最好的存储手段,它既解决了单块硬盘容量无法达到使用要求的缺陷,又提供了不同级别的灾备措施,用户可根据需要灵活定制适用的阵列模式来存储大容量数据,常见的阵列方式有以下几种:
raid.jpg

级别

最少盘数

安全性

性能

适用范围

Raid-0

2

★★★★

Raid-0提供极佳的读写性能,磁盘利用率很高,但未提供任何冗余手段,任何一块成员盘故障,都会导致Raid失效,数据丢失,它在所有阵列模式中,安全性最差。

适用于对存储速度和容量要求较高,但数据重要性较低的企业和个人,例如婚纱影楼等。

Raid-1

仅可2块

★★★★★

Raid-1俗称镜像,两块成员盘同步进行操作,其中一块出现故障,不影响数据安全,但其性能和磁盘利用率最低,适用于存储极为重要的数据,例如企业财务数据、网站数据库等。

Raid-5

3

★★★

★★★★

Raid-5是最常用的一种阵列模式,它提供了一组冗余信息(P校验-校验值通过成员盘异或运算得出),允许其中一块成员盘掉线而不影响阵列的正常运行,同时兼顾了阵列的容量与性能,这使得Raid-5适用范围非常广,广泛应用于企业、政府、军队的大型存储中。

Raid-6

4

★★★★

★★★

Raid-6是Raid-5的加强版,它提供了两组冗余信息(P、 Q校验),最多允许两块成员盘掉线,安全性更高,当性能比Raid-5稍差,适用于对安全性要求更高的行业。

HP双循环

3

★★★

★★★★

惠普双循环是惠普服务器上特有的一种阵列模式,其整体为Raid-5(或Raid-6),但在Raid-5(Raid-6)下又包含了Raid-4,提供了一组冗余信息,其性能及安全性与单纯的Raid-5(Raid-6)相差不多,只搭载在惠普服务器上。

JBod/Big

2

★★

★★

严格意义上说,JBod不是一种阵列模式,它仅将几块硬盘首尾相连,所以不存在条带、循环方向等Raid特性,容量为所有成员盘相加,这种阵列模式由于性能和安全性均不佳,在实际中较少被采用。

二、Raid/服务器故障表现
      Raid提供了不同级别的容灾措施,但它并不是万无一失的,即使是最安全的Raid-1也可能由于不可预见的原因导致数据彻底丢失。从我们接触的实际案例看,恰恰是阵列提供商所宣传的安全性,放松了用户的安全意识,最终造成数据丢失。例如Raid-5允许一块成员盘掉线而不影响正常使用,实际案例中,90%以上的Raid-5故障均表现为两块以上成员盘掉线,且其中一块往往已掉线很久。这说明,当第一块故障盘亮灯报警后,用户并未及时发现并排除故障,当第二块硬盘离线,Raid失效后才开始补救,为时已晚。
      那么Raid为什么会出现故障?Raid安全性的基础是成员盘的安全可靠,由于机械硬盘存储密度的大幅提升以及厂商对成本的压缩控制,现在硬盘的质量已大不如前,很多硬盘仅仅使用几个月甚至更短时间即出现物理故障,当过多的硬盘出现故障,Raid的安全性就成了空谈。为提高性能,阵列上常常采用性能更高的服务器硬盘,这种硬盘可提供10000-15000rpm的转速,性能极佳。但它们在出现磁头损坏后,如不及时发现并断电,磁头很可能长时间与碟片接触,将碟片严重划伤,致使存储介质的磁粉脱落,造成无法挽回的损失。

故障原因

故障表现

1

逻辑故障

1.     阵列中部分数据丢失或数据无法正常打开(文件系统损坏或文件结构破坏)

2.     阵列中某种格式(Office文档、压缩文件)无法正常打开(病毒破坏特定文件)

3.     在系统下,阵列未初始化(MBR损坏或分区表故障)

4.     阵列卷无法打开或提示格式化(文件系统损坏)

5.     误将阵列中一块多多块硬盘进行格式化操作

6.     Raid重建(将Raid-1重建为Raid-0或反操作,将Raid-5重建为Raid-0或反操作等)

2

成员盘物理故障

1.     多块成员盘指示灯报警

2.     Raid管理器中多块硬盘离线或丢失

3.     阵列从系统下丢失并无法访问

4.     阵列呈现未初始化状态

5.     阵列重启后无法正常启动

6.     阵列同步过程中又有其它成员盘离线

3

阵列卡损坏

1.     阵列信息丢失,所有硬盘均呈现离线状态

2.     阵列在系统下无法识别

3.     无法进入Raid管理界面或查看Raid信息时死机

4

不恰当的阵列扩容

1.   多块成员盘指示灯报警

2.   阵列呈现未初始化状态,无法正常访问

3.   扩容后容量不正常,或发生卷丢失

4.   扩容后部分或全部文件丢失

5

盘序标记错误

1.   阵列无法正常启动

2.   在Raid管理中,阵列呈现未初始化状态

三、RAID发生故障后如何避免数据丢失?
       服务器(磁盘阵列)出现故障后,为了最大程度避免数据丢失,您应该这样做:
Pic_20131222001.png
      1. 及时关机,切勿长时间开机运行。由于服务器(Raid阵列)多采用高性能SAS硬盘,转速可达10000RPM甚至15000RPM,在实际案例中,经常遇到用户不及时断电,导致碟片与磁头长时间接触,使磁粉脱落,造成数据无法恢复的重大损失。因此,服务器(Raid阵列)发生故障后,应及时关机,切勿反复开机尝试。
      2. 切勿反复重启。Raid(尤其Raid-5或Raid-6)无法运行时,故障现象通常表现为两块或多块硬盘离线,而其中一块硬盘往往已离线很久,有时这块硬盘是由于逻辑原因离线,而重启后,该硬盘上线参与同步操作,造成阵列数据"污染"。
      3.  切勿盲目进行硬盘替换、同步操作。由于Raid的容灾机制,及时将故障硬盘替换后,Raid会自行完成同步操作。但实际案例中,往往同步没有完成,又有硬盘离线。
      4. 硬盘扩容前,应先备份重要数据。当阵列容量满足不了使用需求时,将其扩容是很好的选择,但扩容前,应先确保重要数据已备份。由于扩容过程中,操作人员失误、扩容失败等情况时有发生,这就可能引起重大数据丢失。

 

留言列表