数据恢复者Rss 2.0
您当前位置:一盘数据 >> 技术文库 >> 技巧经验 >> 浏览文章

就怕硬盘伤,谈硬盘维修与数据恢复(2)

时间:2008年12月09日 信息来源:大众硬件 点击:收藏此文 【字体:

【形形色色的硬盘维修】

在《硬盘损坏全分析》中已经分析过硬盘故障的种类,这里就专门针对日常使用中最常见的几种来逐一分析,概括地说明一下专业硬盘维修的一些具体方法。

1.逻辑坏道

这是日常使用中最常见的硬盘故障,实际上是磁盘磁道上面的校验信息(ECC)跟磁道的数据和伺服信息对不上号。出现这一故障的原因,通常都是因为一些程序的错误操作或是该处扇区的磁介质开始出现不稳定的先兆。一般在操作中的表现就是文件存取时出错,或者硬盘克隆的时候到了出错的地方就弹出出错信息,不能再继续下去。消除这些逻辑坏道的方法其实比较简单,最常用的方法就是用系统的磁盘扫描功能。在DOS下面用Scandisk扫描,系统可以把逻辑出错的扇区标出来,以后在进行存取操作时就会避免操作这些扇区。当然,如果单单是软件的错误操作造成的,也可以用原厂的工具进行全盘低格来重新恢复所有有逻辑错误的地方。也有的人利用HDD Regenerator、效率源之类的软件消除扇区错误,重新激活这个扇区。不过对于那些因为是该扇区的磁介质不稳定造成的错误,这里还是不推荐使用重新激活的方式,以免在储存了重要信息后再次出错。


MS的Scandisk
(图4,MS的Scandisk,非常经典的画面)

2.物理坏道

这个也是比较常见的硬盘故障,实际上是因为震荡、划伤等原因导致一些扇区的磁介质失去磁记忆能力而造成的。通常这样的损坏修复都比较麻烦,因为在硬盘内部的磁道列表中,这个扇区是被标记为正常的,是真实的物理存在,所以它不能通过扫描、格式化、低级格式化或者激活扇区的方法消除,而必须把这个扇区加入到设置在硬盘内部的系统保留区内,由工厂设置的缺陷列表(G列表和P列表)中去,才能在硬盘控制系统的可见范围内消除这个坏道。当然,这样做需要专门的软件(目前能够比较容易找到,而且已经经过长时间市场实践检验的就是PC-3000),价格也非常高,如果大家想要这样做,只能找具有这样设备的专门维修商来修理了。对普通用户的价格大概是每个硬盘100~150元,是否值得就让大家自己考虑了。

不过,这里有必要提醒大家一下,请多多关注各大硬盘厂商的网站,有些厂商提供的原厂工具也可以对少量物理坏道进行处理,把它们加入G列表甚至P列表。譬如IBM/日立的DFT和西部数据的Data LifeGuard Diagnostics。这些原厂的工具软件都是作为向购买该厂硬盘的消费者提供的售后服务而免费提供的,不但扫描速度快,而且辨别准确率高,能够对比较普遍出现的硬盘问题作出相应的处理。对硬盘内部进行操作毕竟是比较危险的,还是原厂的东西比较可靠。除非碰上原厂工具不能解决的问题,否则不推荐大家使用第三方工具软件。

相对于上面那种比较高级的隐藏方式,也有一些要求不高的用户,不需要这样高级的隐藏方式,那么他们可以通过FBDisk和Disk Genius这一对软件的组合来把坏道所在的位置做成隐藏分区隐藏起来。具体的操作并不复杂,即使是稍有计算机经验的“中鸟”也应该可以很容易掌握,这里就不再细说了。

Disk Genius
(图5,Disk Genius)

FBDisk
(图6,FBDisk)

(小技巧:加入坏道列表和隐藏分区这两种方法在效果上的区别有两点,第一是隐藏分区方式会减少硬盘的可使用容量,而加入坏道列表则不会;第二,在坏道比较分散的情况下,需要使用多个隐藏分区才能全部屏蔽坏道,造成分区过多,影响硬盘使用效果;第三,坏道列表的数量是有限制的,坏道数量不能超过一定的值,如果坏道数量大而相对集中,隐藏分区不失为一种好办法。这里介绍另外一种折中的方式,类似于隐藏分区,但又不会因为分区过多而影响使用。不管三七二十一,先按照你自己的需要对有坏道的硬盘分好区,然后准备一个500KB左右大小的文件——我觉得一张JPG图片就不错,不断复制,生成许多同样的副本,用编号来为这些文件命名,从1开始一直下去——用ACDSee的批量编号命名功能就很好。然后,开始一个一个复制到有坏道的硬盘里面去,碰到有咔咔声响、或者复制速度突然变得很慢的地方,就是坏道了,记下当时这个文件的编号,如此不断继续,一个分区完了就进行另一个分区。把整个硬盘都填满以后,所有被记下编号的文件就是硬盘坏道的地方了,把这些文件设置成“只读”、“隐藏”,其他全部删除。这样,只要你不去动这些剩下的文件,磁头就不会去动那些个坏道了,非常方便,比隐藏分区要好。如果你的系统设置是可以看到隐藏文件的,而你又恰恰是一个完美主义者,觉得这些文件的存在还是太碍事,那么新建一个文件夹,把文件都拖到里面去,用超级兔子之类的工具隐藏掉这个文件夹,那就“整个世界都清净了”。)

3.大面积物理坏道

这样的硬盘就算是重病缠身,能继续用多久就要看天意了。如果有几块不同的大面积物理坏道,而且分布在不同的盘面上,那么我劝大家别花这个力气了。如果是虽然有大面积坏道,但全部都聚集在一个盘面上,那么你的运气比较好,真要修的话还是可以的,但是要损失硬盘容量。方法就是通过专门的软件,把有坏道的盘面整个屏蔽掉(其实就是把负责读取这个盘面的磁头停掉,并且在硬盘保留区的控制信息中抹去这个磁头的信息,当作没有这个磁头存在),这样就等于像做肿瘤切除手术一样,把这个有大面积坏道的盘面整个切除。如果是单片双面的硬盘,这样要损失一半的容量,双面三片损失1/3,双面四片损失1/4。给硬盘做这样的“手术”同样需要找具有这种设备的专门维修商,至于值不值得这样做就不是我能决定的了。

一面有大面积坏道

(图7,只有一面有大面积坏道)

多个面有大面积坏道
(图8,多个面有大面积坏道)

4.磁头定位不准

这个问题也经常可以碰到,其实就是磁头因为装配上的轻微误差,导致在硬盘长时间使用后问题恶化;又或者是硬盘的磁头长期工作后出现疲劳现象导致这种情况的发生。有时候一些硬盘读写特别慢,拷贝一个文件老半天没有反应,或者有时候会听到轻微的咔咔声,也许就是磁头定位不准而产生的问题。对于这样的问题,还是需要找专门的专业软件或者找有这些专业软件的维修人员,通过软件对磁头的控制程序做出轻微的调整,一般就可以恢复正常使用。不过如果硬盘已经有一定的“年纪”了,或者平时就是不间断、大负荷使用的话,磁头就确实已经疲劳或者老化了,即使经过调整暂时把问题掩盖起来,还是会在不长的时间内再次出现的。

5.磁头变形

这个跟磁头定位不准是不一样的,即使是微小的变形,对于读取数据所需要的精度来说也已经是太多了,用软件调整的方法不一定可行。处理这样的问题,最简单直接的方法就是像处理大面积坏道一样,把这个磁头停掉。这同样会损失这个磁头所负责读取的盘面的那一部分容量。

6.控制芯片或者电路板烧坏

这样的问题没说的,一般最直接的方法都是找另一块同样型号的硬盘的电路板,把坏的电路板换下来(维修的人管这个叫“换板”)。或者找一块相同型号的芯片,写进同型号硬盘的芯片信息,然后换到电路板上去。

说句实在话,其实硬盘保留区的信息和内部指令,是由硬盘厂商开发出来的,也受到知识产权和专利的保护,那些专业软件通过破解内部信息和指令的方法来维修,从严格的法律意义上来说,并不是一种正确的途径。而且,对于硬盘维修这个行业,硬盘厂商心里面肯定是蛮不舒服的——要是所有人在硬盘坏了的时候第一时间都是考虑先试着修一下,将就着用,那么谁还会去买新硬盘呢?在这个微利时代,厂商的盈利要建立在大量出货的基础上,如果销售量上不去,那么对硬盘厂商的打击是相当大的。尽管如此,但是他们嘴上却不能有任何表示——不让消费者维修,逼着他们买新的,这个罪名可没人担当得起。于是,硬盘厂商只能在暗中采取一系列措施来防止硬盘保留区的信息和指令被破解。

首先是不断开发新的信息格式和新的指令集。不同厂商的硬盘内部的信息格式和指令固然不同,就算是同一个厂商的不同型号硬盘,内部的信息和指令也有可能是不同的,这样就无形中增加了破解的难度——为了能维修不断增加的新的硬盘型号,开发这些专业软件的公司就必须不断研究新的硬盘。

其次是采用芯片和硬盘内部信息结合的方式来杜绝换板。现在的硬盘,在控制芯片内部和硬盘保留区内都有一个唯一的串号,每一个硬盘的串号都是不一样的。在硬盘启动时,硬盘内部控制程序会先把在芯片中的串号和保存在磁盘上面的串号作对比,两者一致才继续初始化;如果两者不一致,就挂起。这样,即使更换了同样型号的硬盘电路板和芯片,也会因为内部串号校验的时候不能通过而无法启动硬盘。

最后一个方法是“釜底抽薪”,从根本上扼杀这些靠破解指令生存的公司的空间。其实,以前很多硬盘厂商提供的工具里面是有盘片扫描、加入坏道列表等功能的,像希捷的Disk Technician Factory Test。只是后来因为厂商希望加快硬盘的生命循环周期,才把这些功能去掉了。但是现在,一些厂商又开始在最新版的原厂工具里面重新加入这些功能(像IBM/日立和西部数据),有的甚至还加入了对硬盘固件(BIOS或Firmware)进行简单修复的功能。当然,为了避免这些工具真的会有“起死回生”的能力,厂商们在功能上都作了一定的限制,避免功能太强,但即便是这样,也足够应付日常产生的绝大部分问题。原厂的工具绝大多数是免费的,而其他公司的工具价格都是上万元,用户们用脚趾头都可以作出选择,这就从根本上扼杀了这些第三方公司的软件的生存空间。

不过对于硬盘维修,最近国内业界发生了一些事,使我觉得有不吐不快的感觉。目前能称为专业级的软件,一般都是来自俄罗斯和乌克兰,如PC-3000、Mhdd、HDD、HRT等等,国内目前能放上桌面的大概就是效率源了。根据效率源的宣传资料,他们说是可以“修好”物理坏道,让硬盘“完全跟新的一样”,这样的话就比较值得认真探讨一下了。真的是可以“完全跟新的一样”吗?其实磁盘表面的物理损坏,无非来自两种原因——磁介质不稳定和表面破损。一个扇区的磁介质不稳定,对相邻的其他扇区的磁介质影响非常非常微小,因此屏蔽掉后确实不会影响使用;而且只要其他的扇区磁介质仍然有足够的稳定性,这个硬盘还可以继续稳定使用一段较长的时间。但是构成物理坏道的原因,差不多90%来自因为碰撞、磁头划伤而导致的盘片表面破损。这种破损对周边扇区的影响是非常大的,破损处表面的磁介质晶体处于碎裂和疏松状态,在硬盘盘片以5400转/分或者7200转/分的转速高速旋转时,该处的破损晶体要承受多大的内应力、多大的离心力、多大的空气摩擦力、多大的热张力,都是有定律可遵循、有公式可计算的。在多种力的作用下,这个伤痕就会慢慢向四周蔓延,导致周围的扇区也出现坏道,并且越来越多。因此,类似效率源这样的宣传其实是不科学,也不负责任的,硬盘虽说是高科技产品,但总还是地球人造出来的,还是要遵守地球上的物理定律的吧?还有,最近效率源推出了全新的版本,据说是全面改进了维修方式,比外国产品还要先进。通过一些朋友的帮助和其他渠道,我找到了他们的试用版,在试用以后,发现这个软件在设计上存在非常大的问题,一是对芯片组的兼容性有很大漏洞,在我的MVP3机器上运行昆腾模块就出现挂起不能启动的错误;第二是出现漏查和把好盘修坏的错误,在一块被效率源迈拓模块修好了的迈拓盘上,用Mhdd扫描仍然发现有错误,而在经PC-3000扫描过的迈拓硬盘上,效率源却说有坏道并且大肆修复一番,把缺陷列表改得不成人形了。看来,这个版本的推出实在是过于匆忙了,连作为软件产品的基本稳定性都还没有具备。另一方面,应该是效率源为了缩短扫描时间(如果按照Mhdd的默认扫描方式,一块有5000个坏道的40GB硬盘扫描1个星期大概还不能完成),采用了简化算法来扫描,结果快是快了,但也出现了很多漏查和错误判断。这个问题也凸现出在程序设计的基础理念、总体控制、查错算法和对硬盘内部信息的理解上,国内的技术员跟国外相比还是有很大的差距啊。

其实,从总体上说,用软件来维修硬盘,本身就是层次比较低、成本也比较低的维修方法。因为用软件修,毕竟还是需要硬盘可以转动、机器可以认出硬盘型号和参数、磁头仍然可以运动并读写等等先决条件,一旦碰到一些死得特别彻底的(如硬盘哐哐响,盘体明显变形等),软件也就根本没有办法了,所以财大气粗的老美就对软件维修硬盘这个玩意儿不大感冒(这也是一众硬盘厂商没有对破解硬盘信息的公司采取决定性法律措施的原因之一),但是老美却具备世界上最尖端、也是最高成本的维修技术。至于他们拿这些技术干什么用的,下面很快就会提到。下面先讲一下成本比较高,可以修一些已经本身不能动、机器认不出、可以说已经判了“死刑”的硬盘的方法——开盘维修。

通常,普通的老美用户都不修东西,硬盘坏了就扔掉换一个。类似象上面那些层次的损坏,除了逻辑错误,他们都是不去修的。但是,也确实有一些非要维修不可的时候,对于一些有盘体变形、磁头松脱、盘片偏心、马达损坏等问题的硬盘,却非要修的时候,他们通常会采取开盘维修法,拆开硬盘,矫正或者更换盘体、磁头,矫正盘片转轴、更换马达等等。不要以为这样很简单,因为开盘维修需要无尘程度非常高的无尘工作台甚至无尘工作间,光是配置一个这样的工作环境就不是普通公司可以承受的。目前国内能达到100级的无尘工作台或者超净工作室已经不多了,而对于维修这些损坏种类的硬盘来说,需要更高级别的无尘工作空间。单单是维持这样一个工作环境就已经所费不菲,难道老美们都疯了,要把钱往海里扔?当然不是,因为不单单在美国,在俄罗斯或者其他国家,同样有具备这样先进的技术和设备的维修公司,来对那些非修不可的硬盘进行维修。

说句实在话,一个硬盘才多少钱?值得那样大动干戈?确实,单单是维修硬盘本身的话就实在是太不符合成本效益原则了,但这些公司的目标明确得很,只有一个字——利!所谓“利之所在,趋之若慕”,他们之所以舍得下这样的本钱,当然是背后存在着比这个本钱更大的利益,而这个利益就是——数据恢复!

我有话说