摘要:软件定义存储, Software Defined Storage; 出现背景: 应对数据暴增, 成本降低到普通机架式服务器硬盘的价位, 兼容各种硬件的开放性, 可在线横向扩展; 哪些新的技术显著地改变了存储架构: SSD, SDS, CPU多核技术, 高速网络, 大容量服务器和磁盘, 多副本存储方式; |
为何出现软件定义存储?
人类各项发明、创新,大多都是为了更加的高效、方便、灵活,并且节省成本。例如,从种植业、畜牧业的出现,到蒸汽机的发明,到自来水、集中供电的出现,再到互联网的出现(信息传递更快更高效,更省成本),无一不是如此。
IT也不例外,以企业级存储为例,近10年来逐渐出现的自动分级、去重、压缩也是为了更高效地使用存储资源,更节省成本。而最近两三年,软件定义存储的出现,依然是为了这个需求。
伴随着需求,还有两大背景:
一是,随着个性化、物联网、万联网的发展,数据以前所未有的速度迅猛增长,数据的存放、管理、优化、利用成为难题,用户面临着如下挑战:
存储利用率低,数据僵化在某些硬件组件里,难以提供随需动态变化的服务等级,缺乏精确的控制,部署和调整存储资源需要经过复杂的流程(例如需要应用管理员与存储管理员等进行协调),自动化程度低,对请求的响应慢。
二是,虚拟化、云计算和硬件技术的发展,使得软件定义成为可能;在此之前,存储用户也希望更加高效、简单、灵活,且成本较低,但十年前,SSD和高速网络尚未出现或发展不够,分布式存储难以堪当重任;彼时虚拟化云计算还未出现或者尚未成熟,从存储中调用控制信息给前端应用或OS使用,去实现灵活敏捷的存储资源的部署,在那时还不是那么迫切。
随着虚拟化和云计算的普及,用户的思维方式也发生了转变,逐渐意识到,快速、敏捷、灵活地获取计算资源已经成为可能,并且逐渐要求能按需使用,按需付费。因此,做为虚拟化和云计算里重要的组成部分,存储也应适应新的需求而不断完善。
下面围绕这这两大背景展开阐述:
我们先来看一下,在物联网、万联网(IoT,Internet of Things)的伴随下,未来数字宇宙的惊人变化。
我们知道:
KB= 210 x Byte ;
MB=210 x KB ;
GB=210 x MB ;
TB=210 x GB ;
PB=210 x TB ;
EB=210 x PB ;
ZB=210 x EB ;
IDC在2012年预计,到2020年数字宇宙规模将超出其在2011年的预期,达到40 ZB,如下图所示。
40 ZB到底有多大呢?假设地球人口按照73亿计算,40ZB相当于地球上人均5600 GB以上的数据。
2014年4月,IDC发现数据的增长超过其在2012年的预期,预计2020年将达44ZB的数据量,比2012年的预估增加了10%。
有趣的是,在整个全球的数字宇宙中,2017年新兴市场(Emerging Markets)的数据所占全球数据的百分比,将首次超过成熟市场(Mature Markets,也即指发达国家和地区)。
预计,2014~2020的6年里,IT从业人员仅仅增长到1.285倍。平均每个IT人员管理的数据量从230GB增加到1231GB,5倍多!