2023年11月24日发(作者:)
NVMeSSD硬盘的弹出状态指⽰的⽅案
116 ?电⼦技术与软件⼯程 Electronic Technology & Software Engineering 计算机技术应⽤ ? the Application of Computer
Technology
【关键词】NVMeSSD SSD 状态灯 热插拔1 前⾔NVM Express (NVMe ?),⾮易失性内存主机控制器接⼝规范(Non-V
olatile Memory express),是⼀个可扩展的主机控制器接⼝规范,⽤于满⾜使⽤基于PCIe 的SSD 的企业和客户端系统的需求。
该标准由包括IDT 、Dell 、Intel 、EMC 、NetApp 、Oracle 以及Cisco 在内的13家发起企业主导,并由80余家业界领军公司
合作开发JVM Express 是⼀个针对使⽤PCI Express SSD 的企业和普通客户端系统开发的可扩展的主机控制芯⽚接⼝标准。
它是与AHCI 类似的、基于设备逻辑接⼝的总线传输协议规范(相当于通讯协议中的应⽤层),⽤于访问通过PCI-Express
(PCIe )总线附加的⾮易失性内存介质,虽然理论上不⼀定必须要求 PCIe 总线协议。2 NVMe SSD硬盘性能NVMe 是为
SSD 所⽣的,特别是企业级应⽤场景的SSD 。它增加了对许多企业功能的⽀持,⽐如端到端数据保护(与SCSI 保护信息兼
容,通常称为T10 DIF 和SNIA DIX 标准)、增强的错误报告和虚拟化。NVMe 出现之前,SSD 绝⼤多数⾛的是AHCI 和SATA
的协议,后者其实是为传统HDD 服务的。与HDD 相⽐,SSD 具有更低的延时和更⾼的性
能,AHCI 已经不能跟上SSD 性能发展的步伐了,已经成为制约SSD 性能的瓶颈,SATA 现在最⾼带宽就是600MB/s ;
NVMe 还可降低延迟超过50%;NVMe PCIe SSD 可提供的IOPs ⼗倍于⾼端企业级SATASSD ;⽽且⾃动功耗状态切换和动
态能耗管理功能能够⼤⼤降低硬盘功耗。NVMe SSD 硬盘的弹出状态指⽰的⽅案
⽂/王爱梅 胡泽志
NVMe 规范的⽬的在于充分利⽤PCIe 通
道的低延时以及并⾏性,还有当代处理器、平台与应⽤的并⾏性,在可控制的存储成本下,
极⼤的提升固态硬盘的读写性能,降低由于AHCI 接⼝带来的⾼延时,彻底解放SATA 时代固态硬盘的极致性能。基于NVMe
的优秀
性能,和PCIeSSD 在数据中⼼得到⼴泛应⽤。
如图1所⽰。
实际应⽤过程中,⼀台服务器中有⼏⼗
块硬盘(如图2所⽰服务器可安装24块硬盘)
在同时⼯作,在服务器开发测试中或者数据中
⼼运⾏中,如果发现某块硬盘存储已满或者出
现故障,需要更换硬盘时,可以通过硬盘盘位
编号找出故障SSD ,更需要能够从硬盘指⽰灯上快速⽅便地识别出可以移除的硬盘。在IntelPurley 平台开发测试过程中,测
试⼈员在测试时发现,想更换NVMe SSD 硬盘,但是在OS 下点击弹出相应的硬盘后,硬盘灯继续保持常亮,⽆法直观识别
那块SSD 硬盘需要被移除。Intel 推荐的⽅法是:基于VMD (V olume Management Device )的控制⽅法。VMD ⽀持从
PCIe 总线对NVMe 固态盘进⾏热交换更换,⽽⽆需关闭系统,同时标准化 LED 管理可帮助更快速地识别固态盘状态。这种
通⽤性使 NVMe 固态盘具有更⾼的可靠性、可⽤性和可服务性 (RAS) 功能。如图3所⽰。2.1 最⼤限度减少服务中断利⽤
NVMe 固态盘打造下⼀代⾼性能存
储。这些固态盘响应速度更快的原因之⼀是因为他们⽐以往任何时候都更接近英特尔处理器- 对上的PCIe 总线。维修这些驱
动器意味着直接将它们从系统内核中拉出来,然后借助英特尔VMD ,就可以在不⽤中断服务的情况下,在线完成此操作。2.2
提⾼正常运⾏时间和可服务性VMD 是在英特尔⾄强可扩展处理器的根端⼝上采⽤的技术,它将NVMe 固态盘插⼊和移除
PCIe 总线事件重定向⾄存储感知驱动程序。这些事件先前必须由系统 BIOS 和操作系统结合起来进⾏处理,成功程度也各不
相同。VMD 确保从PCIe 总线顺利添加和移除 NVMe 驱动器,从⽽确保正常运⾏时间和可服务性。
如图4所⽰。
2.3 通过指⽰灯识别驱动器仅能够热插拔 NVMe 固态盘还不够。您还必须能够确定,在⼀个数据中⼼通道内的数千个驱动器
中,哪个是要维修的驱动器。VMD 还⽀持激活NVMe 固态盘上的状态LED 。这对于知道哪个驱动器需要维修⾮常重要。此指
⽰灯规范 (SFF-8489)已存在许多年,⼀直⽀持通过主机总线适配器 (HBA) 连接的SAS 和SATA 设备。操作系统OS 应⽤层通
知VMD ,VMD 驱动层通过CPU_I2C 控制背板硬盘灯显⽰状态,硬盘弹出状态为黄灯闪烁,虽然能够通过LED 识别SSD 驱
动器,但是这就跟告警报错的显⽰相冲突,不直观、容易出错。为了避免上述不直观的问题,对⽐NVMe 规范现有的⽅案,
下⾯提出了⼀种修改硬盘FW (Firmware )的⽅式。通过调整硬盘对指⽰灯的状态定义,实现了快速识别可移除硬盘的操
作。保证了产品测试的顺利进⾏。同时将这个功能推⼴到Purley 全线产品上,数据中⼼的管理员可以⽅便的识别出可以移除
更换的硬盘。如图5所⽰。具体的办法为:当OS 对某⽚NVMe SSD 进⾏弹出操作(software managed hotplug )时,NVMe
SSD 会⾃动从L0状态进⼊到L1状态,这时候NVMe SSD FW 可以检测到这个状态,然后把Active LED 由常亮状态变成常灭
状态,这样⽤户就可以直观看到到底是那⼀⽚NVMe SSD 被热移除了,从⽽不会拔错盘。在标准的idle 模式时,如果系统没
有对盘进⾏IO 操作,NVMe
盘是在L0→L1→Recovery 三个状态之间来回切换的,当弹出之后,进⼊到了L1的low power 模式,硬盘灯变成黄⾊,同故障
数据来源: Micron 图1:SSD 接⼝趋势
发布评论