技术新讯 > 信息存储应用技术 > 一种固态硬盘故障定位方法、装置、设备及可读存储介质与流程  >  正文

一种固态硬盘故障定位方法、装置、设备及可读存储介质与流程

  • 国知局
  • 2024-07-31 19:58:19

本技术涉及存储,特别是涉及一种固态硬盘故障定位方法、装置、设备及可读存储介质。

背景技术:

1、固态硬盘(ssd,solid state drives)的主控工艺越来越复杂,在生产阶段对控制器的焊接和物料要求也越来越高。生产过程中,在进行smt(surface mounted technology,表面组装技术)时,比较明显的不良现象如翘脚、倾斜、本体变形、较明显的枕焊可以通过aoi(automated optical inspection,自动光学检测)检测出来。

2、但是,随着主控内部硬件单元的增多、控制器bga(ball grid array,焊球阵列封装)工艺和硬盘pcb(printed circuit board,印刷线路板)板结构越来越复杂,还有相当多的工艺制程不良和主控物料本身不良,无法通过aoi和x-ray(x光检测)检测出来,从而才能确保盘片出货到客户时主控功能的正常,避免批量问题的出现。

3、综上所述,如何有效地解决固态硬盘故障定位等问题,是目前本领域技术人员急需解决的技术问题。

技术实现思路

1、本技术的目的是提供一种固态硬盘故障定位方法、装置、设备及可读存储介质,能够有效对固态硬盘的故障定位,能够有效保障产线产出的盘片质量。

2、为解决上述技术问题,本技术提供如下技术方案:

3、一种固态硬盘故障定位方法,包括:

4、在生产产线上确定的故障盘插入服务器后,进行pcie设备识别;

5、若未识别到pcie设备,则输出所述故障盘存在主控焊接或供电电源的故障定位信息;

6、若识别到pcie设备,则向所述故障盘烧录固件后,进行闪存存储器识别;

7、若未识别到闪存存储器,则获取所述故障盘的盘片日志,并利用所述盘片日志确定故障点,并输出所述故障盘存在该故障点的故障定位信息;

8、如果识别到闪存存储器,则获取所述故障盘的带宽状态,并利用所述带宽状态确定故障点,并输出所述故障盘存在该故障点的故障定位信息。

9、优选地,利用所述盘片日志确定故障点,并输出所述故障盘存在该故障点的故障定位信息,包括:

10、利用所述盘片日志确定所述故障盘的控制器内部的所有硬件单元是否均已启动;

11、如果否,则确定所述故障点为主控本体不良,并输出所述故障盘存在主控本体不良的故障定位信息;

12、如果是,则检查主控对所述闪存存储器的初始化是否异常,若出现对某通道的所述闪存存储器初始化失败,则输出所述故障盘存在该异常通道的故障定位信息。

13、优选地,利用所述带宽状态确定故障点,并输出所述故障盘存在该故障点的故障定位信息,包括:

14、判断所述带宽状态与所述故障盘的标准带宽状态是否匹配;

15、如果匹配,则确定所述带宽状态正常;

16、如果不匹配,则确定所述带宽状态异常,则确定所述故障点为主控焊接或pcie链路硬件连接,并输出所述故障盘存在主控焊接或pcie链路硬件连接的故障定位信息。

17、优选地,判断所述带宽状态与所述故障盘的标准带宽状态是否匹配,包括:

18、判断所述带宽状态中的带宽与所述标准带宽状态中的标准带宽,及所述带宽状态中的速率与所述步骤带宽状态中的速率是否均一致;

19、如果是,则确定所述带宽状态与所述标准带宽状态匹配,并对所述故障盘进行io测试,进行故障定位处理并输出故障定位信息;

20、如果否,则确定所述带宽状态与所述标准带宽状态不匹配;

21、相应地,确定所述带宽状态异常,则确定所述故障点为主控焊接或pcie链路硬件连接,并输出所述故障盘存在主控焊接或pcie链路硬件连接的故障定位信息,包括:

22、若所述故障盘的速率小于所述标准带宽状态中的标准速率,则确定所述故障点为主控焊接,并输出所述故障盘存在主控焊接的故障定位信息;

23、若所述故障盘的带宽小于所述标准带宽状态中的标准速率,则确定所述故障点为pcie链路硬件连接,并输出所述故障盘存在pcie链路硬件连接的故障定位信息;

24、其中,所述pcie链路硬件连接包括从连接器到主控的pcie链路的硬件连接。

25、优选地,若所述带宽状态正常,还包括:

26、对所述故障盘进行io测试;

27、在io测试过程中,在掉盘出现丢失闪存存储器的情况下,重启设备并重新进行闪存存储器识别;

28、若识别到闪存存储器,则输出所述故障盘存在pcie链路硬件连接异常的故障定位信息,并对pcie链路硬件连接进行检测,确定虚焊对象或物料不良对象,将所述虚焊对象或所述物料不良对象确定为故障点,并输出所述故障盘存在所述虚焊对象或所述物料不良对象的故障定位信息;

29、若未识别到闪存存储器,则输出所述故障盘存在控制器异常的故障定位信息。

30、优选地,若未识别到闪存存储器,则输出所述故障盘存在控制器异常的故障定位信息,包括:

31、在io测试过程中,若未识别到闪存存储器,抓取控制器中与闪存存储器交互的硬件单元寄存器;

32、检查所述硬件单元寄存器中与主控对应的目标寄存器是否正常;

33、如果否,则输出所述故障盘存在控制器中寄存器值异常的故障定位信息;

34、如果是,则获取当前的盘片日志,利用当前的盘片日志确定控制器是否出现硬件单元崩溃;若出现硬件单元崩溃,则输出所述故障盘存在控制器中硬件单元崩溃的故障定位信息。

35、优选地,若未出现硬件单元崩溃,还包括:

36、抓取当前的盘片日志中控制器硬件单元的不可纠错误关键字,并判断是否出现不可纠错误;

37、如果是,则输出所述故障盘存在控制器异常的故障定位信息。

38、一种固态硬盘故障定位装置,包括:

39、pcie识别模块,用于在生产产线上确定的故障盘插入服务器后,进行pcie设备识别;

40、第一故障定位模块,用于若未识别到pcie设备,则输出所述故障盘存在主控焊接或供电电源的故障定位信息;

41、闪存存储器识别模块,用于若识别到pcie设备,则向所述故障盘烧录固件后,进行闪存存储器识别;

42、第二故障定位模块,用于若未识别到闪存存储器,则获取所述故障盘的盘片日志,并利用所述盘片日志确定故障点,并输出所述故障盘存在该故障点的故障定位信息;

43、第三故障定位模块,用于如果识别到闪存存储器,则获取所述故障盘的带宽状态,并利用所述带宽状态确定故障点,并输出所述故障盘存在该故障点的故障定位信息。

44、一种电子设备,包括:

45、存储器,用于存储计算机程序;

46、处理器,用于执行所述计算机程序时实现上述固态硬盘故障定位方法的步骤。

47、一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述固态硬盘故障定位方法的步骤。

48、应用本技术实施例所提供的方法,在生产产线上确定的故障盘插入服务器后,进行pcie设备识别;若未识别到pcie设备,则输出故障盘存在主控焊接或供电电源的故障定位信息;若识别到pcie设备,则向故障盘烧录固件后,进行闪存存储器识别;若未识别到闪存存储器,则获取故障盘的盘片日志,并利用盘片日志确定故障点,并输出故障盘存在该故障点的故障定位信息;如果识别到闪存存储器,则获取故障盘的带宽状态,并利用带宽状态确定故障点,并输出故障盘存在该故障点的故障定位信息。

49、在本技术中,生产产线上确定的故障盘插入服务器后,首先对该故障盘进行pcie设备识别,若无法识别到pcie设备,则说明该故障盘存在主控焊接问题或供电电源问题,可直接输出故障盘存在主控焊接或供电电源的故障定位信息,便于基于故障定位信息对故障盘进行盘查和故障问题处理。当识别到pcie设备的情况下,进一步进行闪存存储器识别,如果无法识别到闪存存储器,则可基于盘片日志进行故障点,并输出故障盘存在该故障点的故障定位信息;如果可以识别到闪存存储器,则可获取该故障盘的带宽状态,并利用带宽状态来确定故障点,并输出故障盘存在该故障点的故障定位信息。

50、技术效果:通过将故障盘插入服务器进行一系列的设备识别,信息获取判断等,可以确定出故障盘中的具体故障点,并输出故障点对应的故障定向信息。可以有效的提高固态硬盘中控制器问题的定位效率,方便维修人员进行高效率的定位和维修,对于异常主控问题可进行后续分类,能够及时发现批量问题。

51、相应地,本技术实施例还提供了与上述固态硬盘故障定位方法相对应的固态硬盘故障定位装置、设备和可读存储介质,具有上述技术效果,在此不再赘述。

本文地址:https://www.jishuxx.com/zhuanli/20240731/184826.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。