机房360首页
当前位置:首页 » 专家谈存储 » 数据存储技术面临的趋势、挑战和问题

数据存储技术面临的趋势、挑战和问题

来源:机房360 作者:mopper整理 更新时间:2010-12-7 17:32:00

摘要:多数环境下,在PCFE的影响因素中,所有IT设备的冷却设施能耗和服务器能耗的影响力居于首位,而外部数据存储器则紧随其后。这些存储器除了消耗大量电能、占用大范围面积外,它们在环境方面也产生了一定的影响,其数据存储量和数据足迹的规模也在不断扩大

  多数环境下,在PCFE的影响因素中,所有IT设备的冷却设施能耗和服务器能耗的影响力居于首位,而外部数据存储器则紧随其后。这些存储器除了消耗大量电能、占用大范围面积外,它们在环境方面也产生了一定的影响,其数据存储量和数据足迹的规模也在不断扩大。
  
  尽管与过去相比,如今同样大小或更小的物理空间能存储更多的数据,不过,人们现在既要求降低存储器能耗和相应的冷却,又需要必要的数据增长速率来维持业务增长、加强IT服务交付和新的应用程序等,以上种种要求都继续对现有的PCFE资源施加了更多的压力。
  
  现今产生的数据越来越多,数据的存储时间也越来越长,同时还要在多个位置进行数据备份,而这些都是人们对数据存储空间提出增长要求的主要推动因素。无论何种规模的组织,
  
  其在短期内都会继续朝着扩大数据存储空间的趋势发展。
  
  人们需要利用新型及更具扩展性的存储解决方案来处理非结构化数据,然而富媒体和基于互联网的应用的普遍流行,已经引起了该类数据的爆炸性增长。另外,诸如视频前后期制作加工、动画渭染、视频和音频点播、社交网站以及手机、PDA和其他资源的数据数字化等具体应用,同样使存储器的性能和容量开始不堪重负。其中,非结构化数据包括电子数据表、幻灯片、移动平台、AdobePDF文件、微软宇处理文档、网页,也包括几EG、帆仍和MP4格式的视频、音频文件等多种格式的文件数据。
  
  富媒体和互联网应用十分多样化,其范围从具有不同存取模式的小文件到更传统的大型视频流访问一一不等。因此,为了更加稳定地支持互联网和Web2.0上的应用程序,存储系统需要具备各种各样的性能特点,包括支持元数据或个人文件的小型随机访问以及较大的视频流序列等。另外,随着产生的数据和数据备份越来越多,数据存储空间越来越大,存储时间越来越长,数据的增长速率也从较低的百分之十几,发展到高一些的百分之几十,甚至超过了百分之百。
  
  对多数环境和应用程序来说,尽管以数据库形式存在的结构化数据还在持续增长,但如今对数据足迹影响力最大的却是半结构化电子邮件数据和非结构化文件数据,并且随后人们遇到的发展瓶颈也是由该类数据产生的。非结构化数据具有各种随时间而不断改变的输入/输出(I/0)特征,比如一些数据起初活动频繁,接下来闲置了一段时间,然后又被大量读取,例如在媒体、娱乐、社交或公司赞助的网站上流行的视频或音频文件就是这样。再来看另一个例子,通常在完成一项开发或一个研究项目后,其中涉及的数据或知识产权会被归档或移动到成本较低、性能较差的海量存储器上,直到进一步的研究或后续项目要用到它们时,才会再次耙它们调用出来。
  
  数据足迹是指为了满足应用程序和信息的需求所需要的总的数据存储空间。事实上,数据足迹可能比实际的所有数据存储总量要大得多,换句话说,也就是总的数据存储容量超出了实际存储数据的规模。计算数据足迹的一般方法,只要简单地将金部在线、近线以及离线的数据存储器(磁盘和磁带)的容量相加即可。例如,家里能支持各种数据和信息需求的媒介中个人计算机和便携式计算机、个人数字助理、数码相机和录像机、硬盘数字录像机和数字视频录像机以及带USB接口的移动硬盘,这些媒介里所存储的全部数据之和,就是数据足迹。
  
  数字家庭是指配有一台或多台计算机和其他电子设备的家庭,可能拥有5OOGB到超过1TB的数据,而且其存储需求还会继续增长。理解该类家庭对数字化数据增长的需求的意义在于,能够扩展需要存储在IT数据中心里的数据量,以支持现有和新兴的应用程序和服务。
  
  假设一个业务分配到2OTB的数据存储空间,被用于存储数据库、电子邮件、主目录、共享文档、工程文档、财务报表和其他不同格式的数据,其中既有结构化数据,也有非结构化数据。不过,由于数据库的表在存储中的分布可能会很稀疏,电子邮件和共享文档文件夹中也极有可能有重复数据,因此这2OTB的数据对整个存储空间的利用率应该不到100。对该例进行简化,例如,假设这2OTB的数据需要完整地复制两份,以各业务连续或灾难恢复(BC仍R)所用,而其中有1OTB的数据还要根据常规的应用测试、定期培训以及业务分析和报昔分别复制到3个不同的领域。
  
  总的数据足迹是指所有数据的总量,包括所有副本占用的空间,以及支持这部分数据所需要的额外存储空间,比如独立磁盘冗余阵列(RAID)保护或远程镜像处理所需的外加磁盘空间等。在这个简单的例子申,其数据足迹和随之产生的存储要求相当于2OTB数据的好儿倍。数据足迹越大,需要的存储容量和性能带宽就越多,另外还要考虑对存储器供电和冷却、以及如何将其安置在楼层中某处的机架和机柜里等问题。
  
  支持增加数据足迹所花的费用明细如下。
  
  (1)获取数据存储器硬件和管理软件工具。
  
  (2)相关的网络或I/0连通硬件和服务。
  
  (3)重新进行维护和软件更新。
  
  (4)占地空间、供电和冷却等基础设施所需费用。
  
  (5)数据和IT技术资产的物理和逻辑性安全处理。
  
  (6)针对高可用性和BC仍R所做的数据保护措施,包括备份、复制和存档等。
  
  针对一个典型的数据中心,人们对其存储设备(服务器内部存储器和外部存储器)实际消耗的能源量,以及活动数据和非活动数据的数量这两个问题一直颇具争议。普通存系统的主要电力通常由硬盘驱动器(硬盘)的运转及其插接箱所消耗,这部分能耗平均占总能耗的66一75,而剩余部分电力中,绝大部分一般都由控制器和相关的I/0连通组件消耗掉了。因此,数据存储是能源优化和节能改进的一个重要领域。
  
  减少数据足迹有一个简单的办法,那就是不再扩大数据足迹,同时为其增长安排上限。对大多数环境来说,若要求其停止扩大数据足迹,条件稍微有些苛刻,但却也不失为一种选择。不过比较好的做法是,在现有或较差的条件下争取完成更多的工作,也就是说,通过整合和优化来实现数据增长,直到再也无法整合和优化为止。

     责任编辑:handsome

本文地址:http://www.jifang360.com/news/2010127/n904013455.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
更多
推荐图片