机房360首页
当前位置:首页 » 存储资讯 » 大数据带来的存储机遇

大数据带来的存储机遇

来源:网界网 作者:Randy编辑 更新时间:2012-3-1 16:11:05

摘要:一些传统存储厂商也不再满足于自己在存储方面的市场空间,纷纷开始向数据分析发力。他们在通过不断的并购或者合作,在向数据分析领域扩展自己的触角。

  几十年前,当Oracle、SQL等数据库技术风靡全世界的时候,广大的IT人士可能不会想到在几十年后的今天,一堆堆毫无计划性、毫无关联的社交网络访问记录、图片,或者音视频会成为用户手心里的“宝贝”,这些数据在当今可能会成为一个生意人致胜的法宝。而对于十几年前,甚至几年前开始建设数据中心的管理人员来说,也不会预料到后端的存储空间会被大量的非结构化数据填满?
  
  非结构化数据时代来临
  
  是的,大数据时代来了,而且来势汹汹。大数据并不是一项技术,而是由于不断增长的数据量和数据种类而逐渐衍生出来的一种现象。搜索一下大数据的定义也可以发现,各家厂商都在基于自身的理解去定义大数据。以NetApp为例,其大中华区系统技术及专业服务部总监何英华表示,NetApp认为大数据应该包含三大要素,分别是:大分析,帮助用户获得价值;高带宽,让数据处理速度更快;大内容,指的是不丢失任何信息并实现高扩展性。而Teradata天睿公司大中华区产品技术及销售支持副总经理张锦沧则从四个维度解释了大数据的概念——三个V和一个C.三个V分别指的是数据量大、数据种类多和数据增长速度快。一个C指的是处理、升级或利用大数据的分析手段比处理结构化数据要复杂的多。
  
  虽然每个厂商对于大数据的理解都不同,但其中一个共通点就是大数据包含了大量的非结构化数据,包含了诸如图片、音视频、邮件、社交网络数据等等与传统关系型数据完全不同的数据类型。
  
  ESG中国区总经理王丛认为,大数据与增长量有关,但是不代表增长快的就是大数据。从存储角度来看,数据量的增长是一种挑战,如何将这些增速飞快的数据进行存储并合理规划存储空间,是亟须解决的问题。而从数据分析角度来看,大量的非结构化数据的增长在为用户带来挑战的同时,也带来了很多机遇。对于以交易型数据为主的行业,例如金融、零售业等,对数据进行分析,提炼出具有商业价值的信息将是此类用户面临的大数据挑战。而对于像广电IPTV、网游、社交网络等需要存储大量的音视频、图片、社交网络数据等等非结构化数据的用户来说,后端存储如何应对飞速增长的庞大数据量,是他们面临的大数据挑战。王丛表示不同种类的行业,面临的大数据挑战也不可等同视之。
  
  存储领域的“大数据”效应
  
  在大数据时代,非结构化数据量的增长是用户必须要面对的难题之一。近几年,针对非结构化数据的存储系统也在不断地出现。例如统一存储、集群存储等,都将海量的非结构化数据的存储作为目标。这些存储产品在大数据时代中能否合乎需求呢?
  
  首先,统一存储产品集中了SAN和NAS存储两种功能,分别面向关系型数据和非结构化数据。国内市场中,相比于NAS来说,SAN的发展速度和用户采用率一直都占据优势。但随着最近两年非结构化数据量的攀升,存取文件系统更加有利的NAS系统逐渐受到重视。可以看出,最近的两年中,主流的存储厂商EMC、NetApp、IBM、HP、Dell都将统一存储作为了自己的推广重点。
  
  针对统一存储,王丛表示,它也存在着一定的瓶颈。比如,在某个时段,非结构化数据猛增,此时,非结构化数据的存取会占据大部分的带宽,而结构化数据就无法享受到应有的带宽。在数据中心用户中,以数据库为主要内容的结构化数据往往又有很高的业务重要性。因此,王丛表示,对于大数据时代所要面临的海量非结构化数据而言,统一存储可能会存在瓶颈。
  
  在Gartner首席分析师张瑾看来,大数据对于存储领域带来的最重要的影响就是从Scale-up向Scale-out的转变。传统的存储一般都是采用双控制器或者多控制器存储,当容量和性能进行扩展的时候,往往只能从后端增加磁盘数量,当磁盘数量增加到一定程度时,前端的控制器却无法随之扩展,这种架构必定会形成性能瓶颈。但何英华也提出了不同的观点,他说,对于用户而言,Scale-up和Scale-out两种架构也并不是完全冲突的,有时两者也有互补的时候,用户须根据自身的应用类型,才可以判断需要哪种架构的存储产品。
  
  众所周知,SAN系统具有很高的性能,但由于数据块和网络需求的增长,SAN系统的扩容问题也逐渐凸显。NAS是公认的解决文件数据的最佳方案,但是NAS头的瓶颈问题却也无法满足大数据的需求。用王丛的话说,存储容量和控制器的处理能力不成线性增长,必然会导致性能瓶颈。王丛表示,在大数据时代之下,集群存储的市场空间将会扩大。
  
  在谈及集群存储和传统存储区别的时候,业内人士通常会使用一个形象的例子去描述。传统的存储相当于旧的火车,在一个火车头的牵引下,若想提升存储容量,只能采取不断增加车厢数量,但是火车头的牵引能力也是有限的。而集群存储就类似于动车组,在增加容量的同时,性能也不会削减。通过将数据分布到集群中各个节点的方式,集群中的所有存储资源可以整合为前端的应用服务器进行服务,大大提高了磁盘的利用率。
  
  目前,存储厂商在这方面的动作也显示了集群存储日渐受重视。例如,2010年,EMC通过收购Isilon公司,弥补了其在NAS产品线方面的空白,并且确定了其在ScaleoutNAS产品市场的领先地位。同时,戴尔在2010年也通过收购Exanet进入到了集群文件系统市场。IBM在同年4月份发布了新的集群文件系统SONAS.HDS通过收购BlueArc也开始销售高端NAS产品。国内产品像华赛的N8000也是一款集群存储产品。王丛表示:“集群存储市场正在逐渐走向成熟,而目前中国市场可以选择的集群存储产品还不是很多。对于以非结构化数据为主营业务的中小型企业来说,一款可以满足其基本需求的集群存储是其迫切之需。”通过硬件存储厂商的不断并购也可以发现,他们早已嗅到了大数据带来的无限商机,集群存储市场潜力巨大。

本文地址:http://www.jifang360.com/news/201231/n052534143.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
更多
推荐图片