摘要:带重复数据删除的归档存储系统性能评价模型之典型的重复数据删除存储系统体系结构。 |
图4.29所示为一个典型的带重复数据删除存储系统的体系结构。逻辑上它由客户端、重复数据删除服务器及存储节点三个主要部件组成,这些部件可以实际配置成一体系统(One-site System)或分布系统(Distributed System)。数据流进入系统时,通过诸如NFS、CIFS等标准接口到达文件被切分成若干互不重叠的数据片段,通过查找数据片段映射表,只在存储设备中存储单独一份数据片段。数据片段的存取及管理由数据片段位置元数据服务层负责。最底层是实际上的存储数据片段到存储设备中的部件。因为数据片段在经过诸如
Rabin fingerprinting 和Metadata aware chunking[101]等切分过程后通常是不定长的,把它们直接存入存储设备会导致产生大量的存储碎片,引发大比率的随机磁盘存取操作,这都是非常低效的。因此重复数据删除系统应该设计一种专门的数据储存机制来实际组织数据。为不失一般性和便捷性,这里使用一种基于对象的接口,它已成为目前PB数量级规模存储系统流行的解决该问题的范例。
责任编辑:GOCN