希捷NAS一直启动中?别急,先看看我这个老工程师的排查思路
“师傅,我的希捷NAS昨天晚上还好好的,今天就一直卡在启动中,转圈圈转了俩小时了……里面全是项目资料啊!”——这电话我接得不少。说实话,听到“希捷NAS一直启动中”这个描述,我脑子里会瞬间闪过至少五种可能性。而且,很多时候不是单纯的硬件坏,是软硬结合的“假死”或“真锁”。今天我就随便聊聊,从一次出诊经历说起吧。 www.fixhdd.cn
那天去客户现场,一台希捷(Seagate)Business Storage 4-bay NAS
客户说本来想远程看看,结果发现设备IP ping不通,走到机柜前面一看——电源灯亮着,硬盘灯全绿,但前面板LCD显示“Starting... 5 minutes”……实际上它已经“Starting”了快三个小时。我第一反应是:先别断电!直接断电可能会让正在写的文件系统元数据彻底乱掉。但客户已经拔过一次电了,状态更糟。这时候我判断大概率是系统分区损坏或者某个硬盘的SMART信息卡住了系统初始化流程。
技王数据恢复

后来我用了串口线接上去看启动日志(你们未必有这条件,但可以学个思路),发现循环卡在mdadm组装RAID阵列的那一步,具体是其中一块硬盘的超级块校验。嗯,这就符合“希捷NAS一直启动中”但硬盘灯全亮的情况——硬盘本身能通电、能识别,但RAID成员之间的元数据不一致,系统无法继续加载。 www.fixhdd.cn
先说说,“一直启动中”到底有哪几种常见表现?
- 无限重启/启动循环: 启动动画走几秒,又黑屏重启。这种多数是电源模块老化或主板上某个电容鼓包,偶尔也夹着系统分区引导扇区损坏。
- 卡在“Starting…”进度条不动: 类似我上面遇到的,网络服务没起来,LED灯正常。通常是文件系统、RAID配置、或者某个服务(比如SMB、iSCSI)启动时挂死。
- 启动后只亮电源灯,硬盘灯不闪: 这往往是引导加载程序找不到内核,要么是Bootloader挂了,要么是系统盘彻底坏了。
客户最怕的是第三种,但实际工作中,“希捷NAS一直启动中”这个现象里最常见的其实是第二种——而且很多时候问题并不在硬盘数据本身,而在系统分区。希捷原厂系统(本质是嵌入式Linux)会把OS装在内部一个小分区或者一块单独的DOM盘上,一旦这个分区出现逻辑坏块或者分区表错乱,就会出现无限“启动中”。 技王数据恢复
一个容易被忽略的点:系统盘可能是USB DOM或SD卡
希捷很多家用NAS(比如个人云系列)用的是内置USB闪存盘来装系统,那个玩意儿寿命有限。如果它坏了,你换硬盘都没用。我之前遇到一个案例,用户换了四块新硬盘,希捷NAS一直启动中,发现是原厂那个TF卡(系统卡)坏了。我直接换了张新的TF卡,重刷系统镜像,数据全在(因为数据盘是独立的)。这种案例我一般会提一句:要备份数据的话,可以先把硬盘插到Linux主机上用mdadm --assemble --scan试着挂载。多数用户没这动手能力,找了我们技王数据恢复帮忙。 技王数据恢复
排查步骤:从易到难,别一上来就拆机
以下是我自己用的顺序,未必100%正确,但能减少无谓操作。 www.fixhdd.cn
- 第一步:等15分钟,听硬盘声音。 如果听到有规律的“咔嗒”声或金属摩擦声,马上就停——那是物理坏道或磁头损坏。别再给电了,直接考虑专业开盘。没有异响就继续。
- 第二步:拔掉除系统盘以外的所有数据硬盘,只留一块空盘或系统盘。 如果单独启动系统能进管理界面,那就说明是某块数据盘拖累了初始化——大概率那块盘的RAID信息损坏或文件系统有异常。
- 第三步:用网线直连电脑,设静态IP,然后访问NAS的调试页面或SSH。 希捷官方有一些隐藏端口:比如8080、8443。如果连这个都ping不通,那系统真的没起来。
- 第四步:如果手上有USB转TTL线,可以接上主板看串口日志。 这是我判断具体卡在哪里的黄金方法。输出一行通常就是问题所在,比如“Waiting for array /dev/md0 to appear”就是RAID无法组装。
经验分享:有一次客户说“希捷NAS一直启动中,我已经重置过系统了。”我问他“重置是按了后面那个小孔吗?”他说对,长按10秒。实际上希捷的“重置”只是恢复网络配置,并不是重装系统。他以为重置了,其实系统分区里面的坏块还在。后来我还是通过串口把它弄出来了,数据都在,只是系统分区需要修复。
www.fixhdd.cn
如果上述方法都试过,依然卡在启动界面,那就别自己折腾了
很多用户喜欢反复插拔硬盘、随便换电源,结果导致RAID降级甚至崩溃。我见过最离谱的是用金属螺丝刀去短接主板上的BIOS跳线,直接把芯片短路烧了。这时候你需要的不是教程,是专业的数据恢复服务。特别是当数据价值远大于设备本身时,立刻断电、保持现状,然后找靠谱的机构。 www.fixhdd.cn
我所在的技王数据恢复团队,每个月都会接到十几台希捷NAS的案例,其中“希捷NAS一直启动中”占六成以上。我们一般先通过硬盘镜像工具(比如PC-3000或R-Studio)把每块硬盘做成完整镜像,再在镜像上重组RAID。绝大部分情况下数据都能救回来,除非硬盘有物理坏道且超过读写极限。遇到这种案子,我常常跟客户说:你那个系统卡死了,但数据盘的底层数据大概率还是完整的——别慌。
如何预防?日常该注意什么
- 定期备份系统配置: 希捷NAS可以在web界面导出完整的系统设置(包括用户、共享权限)。一旦系统挂了,重装后导入配置就行,不用重新设置。
- 监控系统盘健康: 用第三方工具(如CrystalDiskInfo)定期检查内置闪存盘或TF卡的SMART信息,一旦出现坏块或重映射扇区及时更换。
- 不要直接拔电: 即使它“一直启动中”,也请长按电源键4秒以上正常关机(如果长按没用再拔电源)。非正常断电会加剧文件系统碎片化。
- 存储池用RAID1/5/6,但也别当成备份: RAID只防硬盘物理损坏,不防文件系统逻辑错误或勒索病毒。重要数据还是得另备一份离线冷存储。
说一个反转案例
上个月有个用户说“希捷NAS一直启动中”,送来的时候我都准备开盘了。结果接上串口一看,日志里反复出现“Failed to mount /dev/sda1: No such device”。我仔细一看设备号——它系统盘是/dev/sda,但用户之前手误在Web管理界面上把系统盘分配给了存储空间,导致系统分区被格式化成了数据分区。实际上NAS根本没坏,只是系统找不到引导分区了。我直接用U盘启动Linux,把系统分区重新恢复回去,然后修复了GRUB,前后不到半小时。客户目瞪口呆,说还以为要损失全部数据。
说啊,“希捷NAS一直启动中”这个现象,病因千奇百怪。你可能遇到的是最坏的情况(比如盘体损坏),也可能只是软件层面的bug。作为数据恢复工程师,我建议你:先冷静,做最小破坏的尝试,如果两次重启无果,立刻寻求专业帮助。 要知道,每一次无意义的通电都有可能让数据离你更远一步。
本文由资深数据恢复工程师撰写,文中案例来自真实工作记录,部分细节已脱敏处理。如需进一步交流,欢迎联系技王数据恢复团队。