2023
05-19

不止于快,企业级SSD的稳定性体现——QoS服务质量

在数据中心和云计算的场景中,存储设备是承载各种业务数据的重要组件,其性能和可靠性直接影响着上层应用的运行效率和用户体验。随着业务规模的扩大和数据量的增长,数据中心对SSD存储的要求也越来越高,不仅需要高速、高容量、低功耗、低成本,还需要高稳定、高可靠、高安全。

 


除此之外,数据中心和云计算的业务通常会涉及到大量的随机读写、混合负载、持续压力等,这些特点会对SSD造成很大的挑战,从而引起SSD的性能下降、不稳定性增强、延迟增加等。为了解决这些问题,需要对SSD进行具备企业级稳定性的设计和优化,使其能够在各种复杂场景下保持稳定一致,不会出现性能波动或严重下降的情况。

 


服务质量(Quality of Service,QoS)是指在规定的时间内以稳定一致的性能完成所有请求的能力。最初,它是用在网络质量上的,随着SSD的发展以及云上业务的兴起,QoS也逐渐成为衡量企业级SSD的一个重要指标。通过对SSD各项性能的管理,以保证特定应用程序或工作负载的响应时间和吞吐量,尽可能避免SSD的性能波动和不稳定,从而确保数据中心应用的可靠性和稳定性。

 

比较常见的SSD QoS量化指标是以99%或99.99%的可信度给出最大的响应时间,其中的9越多,就说明对延迟的稳定性要求越高。例如:QoS(99.99%)的指标是0.1ms,表示总请求99.99%的IO延时在0.1ms以内。

 

这些数据可以通过FIO(Flexible I/O Tester)软件来进行测试获得。

 


宝存科技SP4在FIO测试中,分别测试了99%和99.99%两个等级,测试队列深度为1和128,分别代表了最小压力和最大压力。其中,在队列深度为1的4K随机读取场景下,SP4的99%延时低于92,672纳秒(0.09毫秒),99.99%延时低于83,456纳秒(0.08毫秒);在压力更大的128队列深度读取测试中,SP4实现了99%延时低于367微秒(0.367毫秒),99.99%延时低于635微秒(0.635毫秒)。

 


为实现更稳定的高性能和更低的响应延时,宝存科技通过IO优先级排序、先进的NAND管理技术、NAND Program/Erase Suspend技术、灵活的缓存策略以及适时垃圾回收等技术对旗下企业级SSD产品进行深度优化,以满足数据中心所需。

 

01 IO优先级排序

接收到大量不同的IO请求后,SSD对于不同类型的请求进行优先级排序,并向LUN上的队列按照队列实际状况分发请求;

 

02 先进的NAND管理技术

确保最佳的Vth表更新以最大化减少LDPC解码迭代及读重试的次数,尽量避免进入软解码;

 

03 NAND Program/Erase Suspend技术

让SSD在数据编程(Program)或擦除(Erase)操作进行过程中暂停(Suspend),以便在稍后的时间点继续操作,搭配IO优先级排序,大大提升SSD性能负载时的任务灵活性;

 

04 灵活的缓存策略

SSD固件可以根据实时的负载情况和数据访问模式,自动优化缓存策略以提供更稳定的性能;

 

05 适时垃圾回收

实时且动态地进行垃圾数据回收并为新数据提供可用的块,减少了由于垃圾回收导致的写入延迟,改善写入操作的一致性和可预测性。

 

企业级SSD的性能固然重要,但是数据中心7x24小时持续运行的要求给企业级SSD带来的稳定性调整更具意义。宝存科技SP4产品系列在多项技术加持下所实现的低延时响应为数据中心应用,提供着出色的QoS保证,满足了虚拟化、云计算、数据库和金融服务市场等应用所需的一致性能,充分发挥了数据中心存储性能潜力。