2016
05-31

企业级SSD看这里--2016全球互联网技术大会宝存科技看点


本届全球互联网技术大会关键词:PCIe-RAID,原子写。
PCIe-RAID
1. 什么是PCIe-RAID?
通过驱动将RAID逻辑整合到FTL层,在实现高容量的同时,解决传统SSD RAID存在的写放大和性能损耗的问题,我们称这一技术为PCIe-RAID。
2. PCIe-RAID如何解决性能损耗、容错性差、意外掉电、连续故障等现象?
PCIe-RAID 技术的优势在于,PCIe-RAID 技术的目标是在系统中提供一个集任意可扩展、超大容量、高性能和高可靠性的全闪存设备。Shannon PCIe-RAID能够为客户提供一个集大容量、高性能和高可用的单一逻辑块设备,方便用户管理与使用。在系统层面,将FTL的实现完全从PCIe Flash存储设备中移至主机软件层,实现全局FTL,同时卡间的RAID基于Flash的物理页面地址构建,针对Flash优化,解决传统SSD RAID系统中的写放大和可靠性问题。
3. 创新可靠性设计如何提供保护?
Shannon Systems的PCIe-RAID可靠性设计有着几个突出的优势。PCIe-RAID 技术是一个2-D(2维) 软硬结合的RAID阵列,其2-D RAID 的PCIe-RAID技术不仅包括闪存单卡Nand芯片之间的RAID,还有在此之上卡与卡之间的RAID冗余,双重保护机制,保护客户的数据安全。
PCIe-RAID技术还有一个亮点,在于在单卡内的Cross Nand RAID保护机制,采用了基于PBA方面的RAID5改进算法冗余保护机制,该机制解决了RAID5的严重性能、全局写放大系数过大问题,以及写洞(Write-Hole)现象等传统RAID5 缺陷。在PCIe卡之间,PCIe-RAID支持基于PBA的RAID0\RAID5的冗余级别,未来可能会支持RAID10。
4.PCIe-RAID适合哪些行业用户与应用场景?
PCIe-RAID 技术适合任何对速度和可靠性有较高要求的客户,同时也适合对要求存储但希望优化存储成本的用户。因此,PCIe-RAID 适合大数据分析、云平台、数据分析、数据挖掘、BI等应用场景。
5. PCIe-RAID闪存方案可解决用户哪些痛点?
大容量、高可用、高性能的PCIe-RAID闪存解决方案,在很大程度上可以帮助用户实现小机、高性能存储等存储需求。PCIe-RAID技术配合Shannon Systems 之前发布的Re-config 技术,可以从根本上解决困扰原生PCIeFlash 产品存在已久的超低概率SEU问题,这样就为要求高可靠性的金融行业用户应用高速闪存存储产品方案提供了可能。

原子写(Atomic Write)
Shannon Direct-IO产品很早已实现原子写(Atomic Write)。
1. 什么是原子写?
原子写是不可中断不可分割的写操作,这个操作要么没有完成,要么已经完成,不存在这个写操作只完成了一部分。例,当程序向SSD中写入16K数据时,机器突然断电了,重新启动机器后去检查SSD上的数据,这16K数据要么没有写进去,要么已经写进去了,不会存在只写进去4K,剩下的12K没有写进去的现象。

2. 原子写的原理是什么?
Nand Flash的最小写单位是page,NandFlash写page的操作是原子操作。我们只要将上层应用程序发过来的写操作放在一个Nand Flash的page里,那我们这个写操作也就是原子操作。

3. PCIe Flash和原子写的关系?
目前常见的NandFlash的page大小是32KB,所以只要上层应用程序写的数据小于32KB,我们就可以把这个数据放在一个page里,这个写操作就是原子写了。只有Host-Based SSD才能容易识别哪些数据来自于同一个写操作,才有可能把这些数据放在同一个Nand Flash page里。所以,只有Host-Based才能实现原子写操作。Deviced-Based的架构,无法实现原子写。
4. 原子写的好处有哪些?
MySQL经常写的数据页是16KB。MySQL在写入16KB的数据页时如果发生了突然断电,有可能只写入一部分,导致重启后读出的一个数据页即非新的数据,也不是旧的数据。MySQL为了防止这种情况,每写一个数据页时都会写两遍,第一次写在磁盘上一个固定的位置,第二次才写入真正要写入的位置。如果第二次写入时发生了突然断电导致数据不完整,MySQL就会从第一次写入的位置恢复数据。这个技术叫做“double write"。有了我们的原子写技术后,MySQL就不需要写两遍数据。需要写的数据减少了,速度就会更快了。而且由于写入的数据量只有原来的一半,SSD的寿命会延长一倍。
欲了解更多,请洽北京国家会议中心3楼S05宝存科技展位。