机房360首页
当前位置:首页 » 技术解构 » 铁道出版社刘波:改变存储介质 提高总体性能

铁道出版社刘波:改变存储介质 提高总体性能

来源:机房360 作者:yuxin编辑 更新时间:2013/12/13 16:49:41

摘要:日前,中国存储峰会在北京悠唐皇冠假日酒店成功举办。作为中国IT界和存储界的思想高地,本届中国存储峰会围绕着“数据造化 智见未来”这一主题,吸引了来自1500多位来自行业用户、厂商和第三方机构的专家,共同探讨大数据、云存储、软件定义数据中心和闪存等IT行业的重要发展趋势,打造了一场极具远见性的IT盛宴。

  第二数据的可修复性。我们从在线应用的角度来讲,作为传统盘来讲,这块盘快了,我们可以通过read方式修复。第二如果盘坏了,我们通过手段把盘片读出来了。固态盘出了问题,我们怎么修复它?固态盘存储密度相对于其他的盘密度大,对于它来讲,它修复的代价和修复的时间,这是我们需要考虑的问题。所谓的连续性要求比较高的情况下,这是需要考虑的问题。但是并不能说,一定会怎么样。因为目前我们从资料上看,还没有人能修复物理损坏。

  第三应用连续性。第四寿命。寿命怎么样考虑呢?也是一个问题。现在的寿命有两种算法,两种评判的指标,第一可以用度写次数判定,比如说Q5H这块硬盘来讲,这块卡最终的寿命是多少次?你可以通过监测你使用的次数推算出它的寿命。我们有这样的数据。我监测了22天的数据,这22天一共读写了11T的数据,读、写、格式化的方式做测试,有22天读写产生11T的数据,相对于读写数据来讲,读、写两项加起来大概是2×10的9次方次,相对于它的寿命来讲,给了一个比例。我们11个T的使用寿命?相当于它的寿命的0.1%,大家可以算我这块可以使用多长时间。现在在市面上也有另外一种方式,我可以算出它的可靠性时间,就像硬盘一样,盘的可靠性有多少,PCIE卡,我的可靠性是多少。时间还是由次数决定,归根结底还是由次数定的。我们并不否认硬盘本身怎么样,我觉得这方面需要验证一下,条件具备的时候,我们要做这方面的测试。

  前面讲的是我们测试和实用的情况。下面我们测试和实用以后,我们有一个应用策略的考虑,到底怎么搭配,怎么测试,怎么用?这个就涉及到了我们对存储定位的问题,它是干什么用的。因为存储来讲,还是属于IO的范畴,目前我们感知到的,能够得到的应用场景是两个,第一个协助运算,第二保存信息。对这两个应用场景的要求是不一样的。对协助运算来讲,主要强调跟CPU的匹配性是怎么样的?这是我们要考虑的重点的问题,容量都是我们共同考虑的问题之一了。第一要侧重匹配性。对于保存信息来讲,我们侧重于保存的可靠性、持久性,这是我们重点考察的问题,包括存储成本的问题。

  从选择系统的维度来讲就是5个,第一是速度,第二是容量,第三可靠性,第四能耗,第五经济性,就是成本。从5个维度来说,在现有的条件下,我们有5种选择,基本上就是这5种选择。第一CPU缓存,第二内存,第三固态硬盘,第四机械硬盘,第五磁带机。以前只有四个数据,出现固态盘之后,我们认为可以作为内存和机械盘中间新增了一个层级就是5个层级了。从内到外,从速度快与慢,从距离CPU的远近来讲,从近到远的层次化的结构,这是层级的关系。

  从选择系统的速度,我们考虑存储的时候,考虑的就是三个五,一个是应用维度,一个是应用层级,一个是应用的选择,基本上就是三个五。在选择的时候大家可以参照这个表可以做一个平衡。上面列基本上是维度,左边是我们考虑的速度的问题。CPU缓存基本上是纳秒级别的,容量是多少KB到M,可能性定义为永久,现在还没有听到说哪个是因为CPU出现毛病的,单节点能耗是80W,也是一个估算值,这是我们从CPU的标的功耗取下来的,基本上是几十W的水平。经济性是我们折算出来的。CPU缓存是集成的,价钱也不会单标,不会说话2万单买一个缓存,我把这个作为代用的,不是特别的准确。缓存分三级,CPU增加了,换这么多代,缓存增加级别上,第三级缓存有了不同级别的缓存是不一样的,但是对于二级缓存或者一级缓存来讲,实际上都是在KB级别的。目前现在的CPU缓存,不管是哪个档次的CPU,我看到的都是256K,这里面也是有一些问题的。综合考虑容量基本上就是KB-M的层级。从速度来说基本上差10倍,从十几ns到几十ns。容量范围基本上是GB,PC是8GB对服务器来讲64,128或者256的,再大的就不是我们讨论的范畴了。

  可靠性比CPU可靠性小一点,我们认为是半永久,单节点能耗2GB,加一条内存就是增加4W左右的水平,一条多少大家也都知道了。

  对固态盘和机械盘来讲,为什么我说它是在内存和机械盘之间一个比较合适的层级呢?无论从存储时间,容量,可靠性,能耗,都是比较合适的。它比内存慢10倍,比机械硬盘也差10倍多一些,因为这是一个单的情况,总体来讲,从内存到硬盘差距就比较大了,有一个固态硬盘会更协调一些,容量比较大,多少的都有,刚才我看有一些产品是3T的,能耗也是比较小的,从5-26W,经济性也是很经济性的。

  后来加N是什么意思?N指的是控制器的价格。对于固态硬盘来说没有控制器直接插卡的,这里面N就是0的,如果对其他接口的固态硬盘来讲,如果使用外接存储还需要有外接存储的设备,还会有这个的成本开销,所以后面要加一个N。下面的机械硬盘速度是这样的。刚才要提的,可靠性大家比较公认的就是一块盘3-5万小时,单节点能耗是5-16W+N。如果我们还是用机械硬盘的方式来做,它的成本开销会比较大。现在提的比较少了,我们觉得在某些情况要关注到,你的容量到了这个层级的时候,你应该考虑作为一个选项,磁带机作为归档系统来说,作为大数据来讲,还是有一些意义的,这是我希望提醒大家的,不要忘记磁带机。

  应用领域,CPU缓存,内存也可以参与运算,更准确的说,它可以协调运算。我们根据不同的应用角度和应用的层级和用途来讲,我们做了一个对号入座。前面讲的我们是对存储系统架构的问题,后面就是对固态盘选择的问题,在接口上怎么选。这里面考虑选用固态盘接口考虑的因素。SATA、SAS,FC,PCLE接口的。SATA是150,SAS一开始就是600,PCLE就是三个层级,FC是这样的。内置,外置的情况。SAS还有外置的情况。距离也分长短。PCLE是这样的,从PCLE接口规范来讲,它是能够进行热插拔的。目前我们看到的PCLE接口的硬盘卡,没有见到有谁能支持热插拔的,所以我们暂时列为否,是这样的情况。

  最后我们对固态盘应用的策略。使用三条,第一条使用固态盘能显著提升既有存储的性能。第二从应用来讲,我们建议可以从边缘应用向核心应用逐步推进,第三混合应用是平滑的选择。

  对于固态盘来讲,我们怎么用?通过实践和一些测算有五条应用。第一条将tempdb放在PCLE加速卡当中,第二将用户数据库的数据文件置于PCLE固态硬盘当中。第三对于大型数据库而言,将该数据库当中的IO最密度部件放在硬盘加速卡当中,前面是对大型数据来讲,如果你测的数据比较小,可以全放到固态硬盘上就行了。试运行的时候,我们的数据库运行的数据是比较小的,基本上是30G的,连tempdb数据带数据库都放在里面了。对于操作系统来讲,我们可以将虚拟内存放在硬盘加速卡当中,有助于提高操作系统的性能。这是我们对应用的几条建议。

  最后对于硬盘加速卡来说,我们希望是混合应用,等于混合动力,是这样的概念。这就是我对混合硬盘最终的印象,谢谢大家。

  责任编辑:余芯

机房360微信公众号订阅
扫一扫,订阅更多数据中心资讯

本文地址:http://www.jifang360.com/news/20131213/n929054888.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
转载声明:凡注明来源的文章其内容和图片均为网上转载,非商业用途,如有侵权请告知,会删除。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
推荐图片