服务器|磁盘阵列系列
小型机系列
NAS系列
SQL Server 修复
Oracle 恢复
联系南通数据恢复
硬盘常见故障判断及处理
(1)硬盘故障的分类
硬盘故障分为物理故障和软故障两类,其诊断的依据主要是根据系统上电后的现象及屏幕上出现的提示信息来判断。当硬盘出现故障后,应仔细分析故障现象,判断是属软故障还是物理器件损坏。千万不要盲目拆盖、拔插控制卡或轻易将硬盘进行低级格式化,使问题变得更加复杂化。有时还会由于维护操作不当,不仅没有把故障修复好,反而引起新的故障。
1、硬盘的物理故障
硬盘常见的物理故障现象有如下几种:
①硬盘电路故障
主轴电机失速,引起啸叫,伴随有硬盘批示灯不断闪烁,自检时显示出错信息:
“1701” 或者 “Hard Disk Error”这说明硬盘控制电路部分有故障。硬盘电路故障在硬盘故障统计中占的比例不大,一般都是暴露在自检过程中,且故障现象较为单一。读和写控制电路的故障会同时发生,几乎没有只能读(不能写)或只能写(不能读)的现象。
②硬盘腔体故障
机器加电后,硬盘腔体异常响声,自检过程中有明显的“哒哒哒”的长时间磁头“撞车”声,说明硬盘腔体内有机械故障。这大多是磁头步进钢带松动或断裂,故障起因于盘体受到严重撞击或振动。
③硬盘适配器或接插件故障
系统加电自检到硬盘子系统时,自检不能通过,且硬盘批示灯不亮同时屏幕显示如下一些信息:
“1701,Hard Disk Error”
或者 “HDD Controller Error”
该故障现象如果不是硬盘的主引导记录损坏就是硬盘子系统的硬件故障。例如,硬盘适配卡、硬盘驱动器损坏,或者硬盘适配卡与主板Ⅰ/O插槽和与硬盘驱动器之间连接的接插件和电缆损坏或接触不良。
④硬盘0柱面损坏
硬盘经较长时间自检后,在引导时显示:
“Disk Boot Failure TRACK 0 BAD”
如果在此后立即死机至使引导失败,可能是磁盘0柱面损坏。其结果是导致硬盘主引导扇区,或者DOS引导扇区被破坏以致硬盘不能使用。该故障虽然属于物理故障的范畴,但是可用软件的方法来进行修复。
2、硬盘的软故障
软故障的含义是指硬盘上一些重要的和有着特殊意义的数据丢失、损坏或被修改而旨起的自举引导失败或读写故障。这是硬盘软故障的主要内容,因其绝大多数发生于磁盘的系统信息区内,县城盘中的大量文件或数据并没有丢失,故排除这类软故障显得尤为重要。引起硬盘不能自举的原因大多是由于系统区信息损坏、CMOS参数丢失或病毒入侵造成的。一般说来,用户都可以根据屏幕上出现的提示信息来判断引起故障的原因。这些原因概括起来可分为:CMOS数据参数丢失、硬盘主引导区损坏、硬盘DOS引导区出错(含DOS三个系统文件损坏或丢失)三种。下面分别叙述这三类故障的现象、原因及处理方法:
①若开机后屏幕上该出错住处一肌是由于系统板上用以维持CMOS信息的电池损坏,使得CMOS内容丢失造成的。对于这种故障,只需更换好电池后,重新设置CMOS参数(特别是硬盘类型参数及三个基本逻辑格式化参数),即可从硬盘正常启动了。
②在系统启动时,屏幕上出现如下一些提示信息:
“Invalid drive specification
Invalid partition table”出现提示信息"DeviceError”这些提示信息,一般是硬盘主引导区记录出错。引起这类错误的原因可能是:没有指定主引导分区为活动分区(无自举标志)、几个分区均无可自举标志或有多个自举标志、主引导记录结束标志(55AA)丢失、主引导记录因用户意外操作或病毒入侵被破坏。
③在系统启动时,屏幕上出现如下提示信息:
“Error load operation system
Missing operation system
Non-system disk or disk error
Disk book failure”
这类错误信息一般是由于DOS引导扇区的错误引起的。在系统的启动过程中,当硬盘的主引导分区检查正确后,根据可自举分区中指出的分区起始地址读DOS系统引导扇区,若读操作失败,则给出“Error load operation system”的出错信息;若能正确读出DOS引导扇区,则系统将检查引导扇区的最后两个字节是否为有效标志“55AA”,若不是,则给出“Missing operation system”的出错信息;如果DOS引导扇区中隐含文件名信息被破坏,或者说引导程序从磁盘根目录的开始扇区读取的前两个文件名不是当前DOS版本的两个系统隐含文件,则给出“Non-system disk or disk error”的出错信息;如果DOS引导扇区记录格式或系统文件因某种原因被破坏,被引导程序读内存时发生读操作错误,则给出“Disk book failure”的出错信息。对于这类故障的排除,可使用DOS命令“SYS C:”,或者PCTools、Norton等工具软件进行修复。
(2)硬盘物理故障的一般处理方法
如果硬盘盘体物理损坏,一般而言,除更换硬盘以外没有更好的方法。硬盘驱动器除具有较复杂的电路外,还具有大量的极其精密的机械部分。当硬盘密封头、盘组件等部分发生故障时,要在100级净化环境中才能打开机盖进行检查与处理。因而,硬盘物理故障的维修难度较大,一般原非专业维修人员也很难对付硬盘的器件故障进行检测和维修。但是,硬盘系统的物理故障并非仅仅是由于盘体的运动部件或集成电路损坏引起的,也许是由于硬盘外部接插件的接触不良或其它的一些原因。
1、硬盘故障分析与处理步骤 下面仅简要介绍物理故障的分析与一般的处理步骤:
①首先检查CMOS SETUP是否丢失了硬盘配置信息。测量主板上COMS RAM电路是否为电池有故障,或元器件(如二极管、三极管、电阻、电容等)损坏能原因而CMOS中的硬盘配置参数出错。
②通过加电自测,若屏幕显示错误信息“1701”或“Hard Disk Error”,说明硬盘确实有故障。但也可能是硬盘适配卡未插好、或者硬盘与硬盘适配器的插接处未插好、或者硬盘适配器有故障等。
③关机,拆开机盖,测+5V、+12V电源是否正常,电源盒风机是否转动。以此来判断是否外电路缺电。
④检查信号电缆线,插头与硬盘适配卡是否插好,有无插反或接触不良。可尝试交换一些电缆插头试一下。
⑤采用“替代法”来确定故障部件。找一块好硬盘适配卡(或多功能卡)与该硬盘适配卡比较,判断是硬盘适配卡还是硬盘驱动器本身有问题。
⑥观察步进电机端止档销是否卡死,如卡死,用手拨回起始位置。
以上几个步骤,用户需要仔细检查、测试、分析,找出坏的元器件进行修理,或者更换硬盘适配卡。
经以上的处理后,只要不是硬盘盘体本身损坏,仅仅是一般性的接插件的接触不良或外电路故障则多数能够迅速排除。
2、硬盘子系统硬件故障的处理方法
如果经过以上的处理仍然不能解决问题,则有可能是硬盘子系统有器件损坏。此时,可运用以下的方法继续检测:
①替换法
替换法是用备份的好插件板、好器件替换有故障绺的插件板或器件,或者把相同的插件或大伯互相交换,然后观察故障变化的情况,依此来帮助用户判断寻找故障原因的一种方法。当POST自检后屏幕显示错误信息“1701”或“Hard Disk Error”,或使用高级诊断确定故障在硬盘适配器卡或某几块集成片时,可采用替换法来逐步缩小故障的查找范围。例如,用正常的插卡代替怀疑有故障的插卡,将被怀疑的集成电路芯片从管座上拔下,插上新的芯片试一试。如果某个器件插换后正常即说明换下的插卡或芯片面性故障。
②测电阻法
该测量方法一般是用万用表的电阻档测量部件或元件的内阻,根据其阻值的大小或通断情况,分析电路中的故障原因。一般元器件或部件的输入引脚和输出引脚对地或对电源都有一定的内阻,用普通万用表测量,有很多情况都会出现正抽电阻小,反向电阻大的情况。一般正向阻值在几十欧姆至100欧姆左右,而反向电阻多在数百欧姆以上。但正向电阻决不会等于0或接近0,反向电阻也不会无穷大,否则就应怀疑管脚是否有短路或开路的情况。当断定硬盘子系统的故障是在某一板卡或几块芯片时,则可用电阻法进行查找。关机停电,然后测量器件或板卡的通断、开路短路、阻值大小等,以此来判断故障点。若测量硬盘的步进电机绕组的直流电阻为24欧,则符合标称值为正常;10欧左右为局部短路;0欧或几欧为绕组短路烧毁。
硬盘驱动器的扁平电缆信号线常用通断法进行测量。硬盘的电源线既可拔下单测也可在线并测其对地阻;如果无穷大,则为断路;如果阻值小于10欧,则应怀疑局部短路,需做进一步的检查。
③测电压法
该测量方法是在加是怕情况下,用万用表测量部件或元件的各管脚之间对地的电压大小,并将其与逻辑图或其它参考点的政党电压值进行比较。若电压值与正常参考值之间相差较大,则青蛙该部件或元件有故障;若电压正常,说明该部分完好,可转入对其它部件或元件的测试。一般硬盘电源与软盘插线一样,四个线头分别为+12V、+5V、-5V和地线。硬盘步进电机额定电压为+12V。硬盘启动时电流大,当电源稳压不良时(电压从12V下降到10.5V),会造成转速不稳或启动困难。
Ⅰ/O通道系统板扩展槽上的电源电压为+12V、-12V、+5V和-5V。板上信号电压的高电平应大于2.5V,低电平应小于0.5V。硬盘驱动器插头、插座按照引脚的排列都有一份电压表,高电平在2.5-3.0V之间。若高电平输出小于3V,低电平输出大于0.6V即为故障电平。逻辑是怦的测量可用试波器测量或者用逻辑笔估算。
④测电流法
如果有局部短路现象,则短路元件会升温发热并可能引起保险丝熔断。将万用表串入故障线路,核对电流是否超过正常值。硬盘驱动器适配卡上的芯片短路会导致系统析负载电流加大,驱动电机短路或驱动器短路会导致主机电源故障。硬盘电源+12V的工作电流应为1.1A左右。当硬盘驱动器负载电流加大时,会使硬盘启动时好时坏。电机短路或负载过流轻则保险熔断,重则导致电源块、开关调整管损坏。在加大电流回路中可串入流假负载进行测量。如有保险的线路,则可断开保险管一头将表串入进行测量。在印刷板上的某芯片的电源线,可用刻刀或钢锯条割断铜泊引线串入万用表测量。电机插头、电源插头可从卡口里将电源线起出来串入表测量。
⑤信号寻迹法
如果条件许可,可送入测试信号源至故障部位进行测试。
用逻辑笔或示波器按逻辑图进行检测,如果被检测部分出现波形延迟过大、相痊不对、波形畸变等现象,则说明故障点就在此部分,应对此进行进一步的仔细检查。
当输入端送入测试信号,可用逻辑笔寻迹器或示波器查找信号输出的踪迹,按逻辑图查对电平变化。例如,如果连接硬盘驱动器的接口线输入端有信号,输出端无信信号输出级无信号输出,则可断定故障出在第三级上。
用逻辑笔寻踪粗糙一些,准确测量脉冲波形和幅值还得用示波器。对主要测试点的控制信号、选通脉冲、接口信号进行分析比较,以确定故障点。
(3)硬盘软故障的一般处理方法
随着电子技术的进步和制造技术的提高,硬盘的物理故障率大为降低。然而,也随着在硬盘上存储的软件系统和数据信息的复杂化和大型化,硬盘的软故障率却呈上钷的趋势。这些软故障虽然不会造成硬盘的元器件的损坏,却会使硬盘上的信息系统遭到破坏,而使用户蒙受巨大损失。所以硬盘的软故障处理和日常数据的维护工作日愈显得重要。一般说来,硬盘的软故障大多是由于使用不当或维护不当造成的,它们大都能够根据用户的
用机经验和屏幕上的提示信息准确地判断故障的性质和类别,运用软件的手段加以
修复,使系统恢复正常,挽回损失。即使是诸如硬盘0磁道物理介质被划伤而损坏的“硬”故障,也仍然可以用软件的方法进行修复,使系统恢复正常。如果硬盘出现故障,用户首先要判断硬盘故障类型,分清楚是“硬”故障或是“软”故障以及故障的原因,然后才能设计维修方案。而且,在一般情况下,确诊硬盘故障的工作总是伴随着修复工作同时进行的。修复工作切不可盲目进行,要对用户盘中数据尽可能保护为修复工作的前提。具体实施可按以下的步骤和方法进行:
1、若加电自检到硬盘子系统时,立即出“1701”或“HDD Controller Error”且硬盘批示灯闪烁及软硬盘适配卡无接触问题时:用DM(Disk Mananger)软件执行:DM/M,看是否能批示出该硬盘的磁道数、磁头数和每道扇区数。若有,则招待低级格式化并做fdisk和format处理。在做fdisk的过程中,可以试着检查分区情况,看有无挽救盘中数据的希望。若系统根本不承认硬盘的存在,则挽救盘中的数据可能性很小。可以基本得出结论:硬盘适配卡坏或硬盘损坏,不属软故障范畴,无软件修复的可能。
2、以286以上档次机,若提示“c:driver error”或明确指出“CMOS Configuration Check Error”。这时故障原因多是CMOS中SETUP的硬盘参数设置错误,这时可按硬盘的正确参数,重新设置CMOS相关参数。在兼容机中使用的40MB以上容量的硬盘的类型有很多是TYPE 47(USER TYPE),用户须对磁道数、磁头数、写预补偿、启停区、每道貌岸然扇区数是不能有错的,用户应事先记录下来以便出现故障时恢复原参数。
3、系统自检后显示BASIC(ROM BASIC)或“死机”。若用软盘启动DOS后再转C盘,此时若提示“Invalid driver pecification”,执行FDISK,若显示“Disk error reading”则意味着硬盘INT 19H引导模块执行出错,这时盘中数据已无法挽救了。只能进行低级格式化、分区和高级格式化。
4、系统自检后进行系统自举时,若提示“Invalid partition table”或“Missing operation system”,软盘启动后使用FDISK查看分区表,此时有两种可能:
①指示“No partition table exit”。
②所列出的分区表混乱,主分区属性为“Non DOS”。
这说明DOS分区表和主引导程序坏,但不必盲目对硬盘进行低级格式化。如果用户已经使用PCTools、Norton等工具软件对硬盘引导区、分区表、FAT表等系统信息区数据在软盘上进行了备份,则可方便地恢复硬盘上的系统信息,迅速排队故障,保护硬盘中原有数据资料;如果没有进行备份,可找一台与故障机硬盘相同(最好是盘、卡均相同)且DOS版本也相同的正常微机,用DEBUG恢复分区三及DOS引导程序。
5、在恢复了分区后,如果硬盘仍然不能自举和读写,可再按以下步骤检查:
①首先用FDISK查看第一分区是否是活动分区。若不是,则可用FDISK的(Change active partition)功能激活。
②若仍不能引导则仍然可用Norton6.0-8.0的工具软件NDD(磁盘医生)或PCTools6.0-9.0中的DiskFix进行修复。
NDD或DiskFix可对用户硬盘进行测试,然后确定分区表、引导记录、文件分配表、目录区文件结构的完整性,并进行纠错。纠错前对错误情况进行描述并征求确认,它能最大限度地保证磁盘数据的完整性。
6、若屏幕显示“Disk boot failure”或“Non system disk”后死机。
此时用FDSIK查看分区情况应正常,可用PCTools之类的工具软件查看DOS的三个主引导文件:IBMBIO.COM、IBMDOS.COM及COMMAND.COM文件是否存在,是否正常。是否有这三个文件的版本不一致的情况。经处理好硬盘分区和三个DOS系统文件后,系统应该恢复政党若故障仍未消除(不能自举),则只能从低级格式化重新做起。当然,用户应先将盘中的文件备份(此时硬盘是可以读写的)。
7、若上述方法仍不能从硬盘上引导系统,则说明硬盘存在着磁介质损坏。
对于0磁道上的硬盘主引导扇区(MBR)物理性操作的处理方法,有人提出将0道1扇区的主引导信息改放在1道1扇区或2道1扇区以避开损伤的0磁道,但这种方法的结果仍然是要用一张软盘启动,且需修改FDISK和IBMBIO文件或重写硬盘卡上的ROM(EPROM),这样做后硬盘仍是一个数据盘而不能是引导盘。而且这种方法较为麻烦,若业余维修者限于水平或设备环境,要重写硬盘卡上的EPROM也很困难。如果不是硬盘的主引导扇区(MBR)损坏,而仅仅是DOS引导扇区(DBR)损坏,较为简单的做法是:执行FDISK建立DOS分区时,不是将整个磁盘划归DOS使用,而是硬盘的总柱面数减1,相应的起始柱面号设置为1(或5),激活活动分区后再进行格式化即可。此法简单而有效,其代价仅是牺牲一个柱面的磁盘空间而已。