机房360首页
当前位置:首页 » 专家谈云计算 » 友友新创技术总经理姚宏宇谈云计算

友友新创技术总经理姚宏宇谈云计算

来源:机房360 作者:许剑 更新时间:2010-5-23 17:36:02

摘要:云计算平台是一个计算技术的不断演进,从集群到网格,到分布式计算到云,云计算涵盖了这两个概念,但是这两者之间没有必然关系,你可以有云计算平台,以技术为主要的,服务为辅,有云计算服务,以服务为主要的模式,以商业模式为主要的推动力,技术为辅助的手段。

  姚宏宇:我们公司从2007年开始在中国做云计算实践,在这里跟大家分享一下我们的看法和经验。今天演讲分为三部分:理想,到底什么是云计算平台的理想?在五年、十年,甚至二十年之后云计算会是什么样的,给社会带来什么变化。因为我们公司是专注做云计算平台的,我就讲讲云计算平台构建的方法和从不同角度看云计算平台是什么东西。最后也是最痛苦的,我们比市场早行了一步,所以中途有成功的也有失败的经验,跟大家分一下。
  
  对云计算本身做一点补充,因为我们从07年开始跟客户交流云计算这个事情,发现交流到现在还是有一些事情说不清楚,今天大家都说云计算,很少人把云计算分为云计算服务和云计算平台两个东西,我个人觉得一定要说清楚,否则就很混淆。很简单的例子,我有一个朋友做移动互联网,刚开始创业,他用了十几台服务器提供服务,他说我这算不算云计算。我说你应该算云计算服务,但可能用的不是云计算平台。大家还经常问我你们公司到底是做什么的,云计算也没看你们服务。
  
  云计算平台是一个计算技术的不断演进,从集群到网格,到分布式计算到云,云计算涵盖了这两个概念,但是这两者之间没有必然关系,你可以有云计算平台,以技术为主要的,服务为辅,有云计算服务,以服务为主要的模式,以商业模式为主要的推动力,技术为辅助的手段。
  
  从云计算服务角度,一切可以以服务形式提供给用户的都可以叫做服务。现在提的很多都是从云计算服务角度出发的。云计算服务的理想是什么?或者云计算的理想最后要达到什么目的。从农业社会进化到工业社会,现在到信息社会,云计算就相当于信息社会的工业化革命。云计算带来的是巨大的计算数据处理能力,让成本变得更低廉。大家回想一下工业革命时候是什么样的情况,工业革命带来两个很重要的变革,一是生产力的极大提高,二是社会所有的人获取产品的成本和手段变得非常便宜、简单,它提供了巨大的能力,能够让以前一些不敢想做的事现在变得可能。从云计算服务的角度,又让所有这些计算能力变得非常廉价,非常方便获取。所以从本质上,从理想来说,云计算是信息社会的一次工业化革命。从个人角度,从唯我所用变成唯我所用,从特定环境到随时随地,从固定支出到按需付费,有些服务就是你用多少花多少钱。从企业角度,工业化革命还有一个很重要的特点,就是整个社会的分工更加精细化、模块化,没有人说要通吃所有的东西,就跟纺织做衣服一样,我不知道大家有没有到过浙江的义乌,现在到义乌,拿一张图纸去,一天之内就可以把这个服装从一张图纸变成一件衣服,正因为所有的东西都已经很精细化,有人做扣子,有人提供布料,有人提供裁剪。像EMC,我们提供云计算平台,有人提供存储服务,有人提供计算服务,有人提供邮箱服务,对客户来说就是把这些组织在一起,他们拿着图纸说把这些东西接起来,这就是我所需要的东西。从社会角度,提高社会IT服务的规模化生产,提高它的巨大能力,极大地降低成本,促进整个社会的创新进步。
  
  我在前面稍微提了一下云计算服务和云计算平台并不一定非得很强的关联关系,没有人说假如你把这个服务叫做云计算服务的话,一定得有云计算平台这个技术,其实不是这样的。现在很多的互联网服务,甚至应用服务,仍然可以在云计算平台上。其实可以称为云计算服务,但是用的不是云计算技术。云计算平台提供支撑非云计算服务的应用。我以前搞高性能计算的,以前一直用NPR等等并行计算的框架,其实现在已经有很多地方在研究如何把并行计算的框架在云平台上实现,而且能解决原来并行计算框架上的问题。云计算服务必然带来两个非常重要的特点,一是多租赁的,可以提供给成千上万,上百万,上千万用户同时使用的。有人就问我既然已经叫云计算服务,为什么现在云计算还炒的这么厉害?用云计算平台跟支撑的云计算服务,才能真正提高你的服务效率,把它的规模变得非常之大,而且充分发挥你的服务能力。
  
  传统IT系统里面一些常见的问题,从高可靠性的要求,第一是性能压力,数据宇宙的爆炸,我以前在雅虎工作,我宇宙爆炸的速度比它还快,我们每年增长百分之三百,不光数据的走量,还包括数据的流量。另外需求增加,尤其是随着物联网出现,每个用户的需求,每个应用程序没有适合用户的需求,怎么能有一种架构能够让它很快调整,这就需要云计算平台。
  
  高可用性的需求,我以前管过很大的数据中心,大概每个数据中心一般是5000-10000台全新机器,第一年出的问题,磁盘坏了,网络断了,你平时想象不到的问题都会在那里面出现,换句话说你的IT信息系统建立的基础是不稳固的。我可以打个比方,IT系统,就像建楼房,这个IT系统做市场的,必须得有一个很坚固的地基,才能保证上面的东西持续下去,但可惜的是所有的硬件都是不可靠的,怎么从整个系统层面保证可靠性?所以云计算平台所办的事情要建一个基础,在沙地上把这个基石打出来,能够建万丈高楼。
  
  云计算平台的理想,最终要造出一个基于网络可扩展的超级计算机。虚拟化,VMware虚拟化是把一台机器虚拟成多台,我这里是一定要把多台虚拟成一台。透明,底下所有的东西都可能随时随地坏掉的,怎么建一个系统,保证上面的运营不受影响,所以下面的系统运营是透明的。弹性,随着业务增长,这个系统能平滑过渡,平滑增长,而不像现在的系统一样,我先建这个,等我有能力重新再一个系统,把这个扔掉,再重新做。动态,最主要是适应现在各种IT业务,IT系统用户需求的快速变化。有一个很明显的例子,亚马逊卖东西是有季节性的,尤其在美国,有一段时间销售量和流量是平时的5倍,我以前负责的雅虎财经网更是这样,中国财经可能也是这样,每个股市总是在开盘之前半个小时,开盘之后半个小时,这一个小时之内流量是极其巨大的,然后就掉下去,快收盘了,大家赶紧把今天卖的股票卖掉,又产生巨大量,怎么样调度资源,怎么样在非峰值的时候做其他的用处。通用,不能说云计算平台最底下的平台,还要说做这个业务系统用这样的业务平台,所有的计算资源其实有三种,通信能力、存储能力、处理能力。云计算平台要做的事情就是把这三种能力在分散资源当中聚合起来。多租赁,必须有能力支持成千上万、上百万的用户。绿色节能,我最近碰到一个很有意思的数据中心案例,有客户提出,比如中国全国好几个地方都有数据中心,但是数据中心平均使用率不是特别高,就问我有没有可能达到这样一个程度,有的数据中心在西南,有的在东南,有的在北边,他说东北的电从网上几电到几电特别便宜,能不能在那个时间调度,让我那个时间在那里运行,电特别便宜,晚上也比较冷,其他东西也能歇下来。我觉得这个很好,不光为企业节省成本,而且节省整个能源使用率。最主要就是把你的业务从用户的需求反映到业务的需求,从业务的需求反映到IT系统的需求,从IT系统的需求反映到能源的需求,都能利用起来,最后适配化。
  
  云计算平台的构建,这是我们公司主要做的事情。云计算平台的技术本质,里面的每一块技术,虚拟化技术也好,网格并行计算技术也好,调度资源的技术也好,并不是说从2007年、2008年前才还是有的,有的技术已经有了二十年了,所以云计算的技术本身不是我要创造这种新的解决方案出来,而是前面有几十个、一百个各种各样不同的技术集中在某一个领域,就是某一类问题,我怎么做集中管理,能够让这些技术模块根据你的需求,根据你的IT业务的需求在IT架构上自由组合起来,能够达到更高层次的分布式的集中,或者它的实现关键点,第一这个云必须运行在网络上,必须是宽带网络,越宽越好。第二硬件,我和台湾广达林百里先生聊过,他们现在硬件都是积木化的应变,以后不是说买一个刀片机,而是卖一个小盒子,我这盒子里装一个CPU,剩下99个全装成硬盘,哪天不需要就把硬盘拔出来,装CPU。系统软件或者云的操作系统,就是云计算平台也是可以积木化。我不相信世界上有完美的技术,针对所有的应用都是完美的,只能对这种应用这样的架构最合适。所以云计算平台从技术上要解决的是怎么让这种堆砌变得非常简单、快速。
  
  构建云计算关键技术,云计算,自己管理一万台,十万台机器,就跟管理一万个人,十万个人的公司是一样的。比如高效可信的管理传输,动态负载均衡存储管理,必须有分层结构,不可能一个人管一万个人,必须分成好几层等等,这其实让机器管机器和人管人从原理上是一样的。
  
  从三个角度看云计算平台:云计算平台是一个物理的聚合,换句话说我在北京有一个数据中心,在广州有一个数据中心,在成都有一个数据中心,它们三个是连在一起的,这是整个云计算平台,我们每一个都可以跑业务。但是每个数据中心里面的存储资源、计算资源又是纵向可以互相分享,这就是资源的整合。最后一直强调通用的,有存储、管理、通用计算,但是也有专用的,所以既有通用的云计算平台,也有专用的云计算平台。
  
  我现在要给大家做一个实例分析,在座的各位都用过电子邮件,很多人都在谈云计算安全问题,云计算服务怎么去推,一直考虑到数据的阴私性,但是你们不知道自己的邮件其实是你最隐秘的数据,但是大家现在很放心的放在163、Google,没有人提出任何意见。举这个例子有一定的代表性,先是物理的聚合,在欧洲、美国有三个数据中心,在亚洲有两个数据中心,最后是一个整体,整个都是一个邮箱的平台,在每一个数据中心里又分成几块,有前端处理,有邮件存储,有邮件处理,按照纵向资源不同的整合,不同处理方式分成模块。最后有专用和通用的,比如都会用多分布式文件系统,都会用到分布式数据库,但是有一些东西并不是所有人都会用到,比如数据挖掘,防病毒、防垃圾,这两个体系加起来就变成邮箱整个云计算平台。既有通用的云计算平台,又有专用的。
  
  很多人在说云计算带来的是便宜,没错,但前面有一个条件,在一定规模之上,它会变得很便宜。我们会碰到有些用户,你给我上这个平台,我有五台机器,能不能让它变得很便宜,我很遗憾的告诉大家恐怕不可以,只有到了一定规模,你过了那个交叉点以后,规模越大越便宜。规模性带来的影响,规模性不光是让你平均成本、总体成本、TCO降低,它还会让你云计算性能、可靠性,会根据规模的增加应该是线性增加。安装部署的特点,我们最近遇到一个案例,就是用非集约化数据存储,客户非要按照传统模式来部署云计算的硬件和软件,就好象我现在发明一辆汽车,你说不行,我非得用脚去踩轮子,这样是用不好的,所以在部署安装的时候一定要注意,并不是传统的方法不能用,一定要根据你的实际情况调节。最后是新的编程模式,现在很少有那样的云计算平台,就好象你原来的业务应用,把云计算平台插进去,我不敢说没有,但却是很少有,多多少少都会有一些调整。大家都是编过程序的,就好想你用汇编语言编程序,后来用JAVA编程序,觉得轻松了很多,但是以前汇编的程序不想动它,能不能让JAVA也可以编,难度很大,但不是完全不可能。
  
  因为我做云计算很长时间,我以前在大规模分布式计算方面做了十年多,可以从三个角度看安全,用于安全服务的云,现在大家听了很多,像瑞星、360都推出了类似的服务。大家其实最关心的是云本身的安全问题,我觉得云本身的安全问题没有特别多的特殊化,比如原来云是建立在你Linux系统上,你不把系统补丁打上去,云也没有办法解决你这个问题。但是云的规模很大,所以带来新的问题大家要真的注意,规模很大,出现问题的时候影响面会非常大。所以你要想有什么新的机制能够尽快发现问题,尽快隔离问题。数据托管,数据放在别的地方,数据的私密性、安全性、可靠性如何保证。可移植性,这要解决,主要靠标准。最后是资源的动态调配,我的数据跑来跑去,到底在什么地方,我怎么监管它,中国的数据突然跑到美国,能不能监管。我曾经考虑过这个问题,我花一毛美金可以租亚马逊的一个比较主流服务器的机室,我花一千美金可以租一万台机器一个小时,成本很低。
  
  回过头来,云计算并不是万能的,至少在目前来说有三个瓶颈,第一解决的问题必须可以拆分开来,又可以聚合起来,并不适合于所有的场合,比如有些科学计算并不适合用云计算。第二带宽永远是它的瓶颈,再宽也不够,都可能用掉,而且带宽成本非常之高。第三技术问题,标准问题,法律问题。云计算现在还处于非常早期的阶段,无论从技术上,比如说分布式数据库,我们公司演示了一下目前做的分布式数据库,我们其他都能做得不错,有一个很大的难题解决不了,就是事务在分布式云计算情况下如何管理,我觉得现在还没有人能解决,从标准上、法律上,还有很多问题需要大家共同努力。今天的演讲就到这里,谢谢大家!
  
  责任编辑:许剑

本文地址:http://www.jifang360.com/news/2010523/n37776536.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
更多
推荐图片