机房360首页
当前位置:首页 » 云计算资讯 » 云计算与大数据问答:李德毅、高文、林仕鼎答疑

云计算与大数据问答:李德毅、高文、林仕鼎答疑

来源:机房360 作者:yuxin编辑 更新时间:2013-6-8 15:55:13

摘要:中国工程院院士李德毅、高文,百度大数据首席架构师林仕鼎,就云计算与大数据相关问题回答了网友以及现场与会者的种种疑问。


  
  主持人:这方面的进展怎么样?
  
  李德毅:我建议看一看白皮书的演化过程,今年出了第三本的白皮书,请大家看一看。
  
  林仕鼎:在实际过程中,我们会这样做。首先,数据中心被烧掉是不太可能发生的。我们考虑数据存储的时候通常是这样分的,我们会把错误分成不同的等级。通常情况下叫故障,采用容错的方式来处理。如果是一个数据中心毁掉,或者因为火灾、地震毁掉的时候,我们把它叫做灾难,用容灾的处理方式。灾难发生的概率和错误发生的概率是完全不一样的,在几千台、几万台规模的数据中心里,每天都有几十台的机器发生故障,这很正常。我们通常会这样考虑,因为灾难不是特别容易发生,我们就采取低成本的方式处理。
  
  通常情况下是这样,对于容错是采用三个冗余,对于需要做容灾考虑的时候会再加一个副本在云层,不在同一个地理位置上。就算是对于同一个数据中心里面的三份冗余,其实也有一定的策略。我们知道在不同的交换机互联的时候,它的背板带宽是有限制的。在同一个交换机里面,收联比比较高。我们会把两份副本放在一个交换机下面,另一个副本放在另一个交换机下面。这是为了防止机架的故障和交换机的故障。对于两个副本放在同一个交换机里面,也有一定的策略。我们会根据实际的应用场景和系统运行状态调整副本存放策略。通行的惯例是用三个副本防止故障的发生,再进行定期的准备,做数据中心的数据冗余。
  
  提问:我是来自苏州大学的研究生,我们实验室研究的方向是生物信息计算。生物信息计算需要有强大的计算能力,还有海量的存储资源。现在提到的云计算,无论是个人,还是针对企业,基本上都是在应用层面的。我就想问一下三位,如果将云计算和科学计算结合起来,它们有怎么样的前景?我们具体的研究方向是蛋白结构预测。
  
  李德毅:我们在讲云计算作为当前IT主流技术的同时,也不要把云计算说成是万能的。高性能计算机该做的还要做。生命科学需要的特种计算机也可以做。云计算主要是讲以IPC联合起来的通常协议模式,所以是不确定的,增加了不确定性。我们在白皮书讲云计算的最大魅力是它的不确定性,所以我想不要想用一个技术覆盖所有的东西,生命科学里有一些专门的数据处理可以用专用机,也可以用通用机,也可以用云计算,就看你的生命科学到底研究什么。
  
  高文:刚才李院士说的,科学计算里面也分很多类,有一类是类似于做天气预报、油田的勘探等等,计算开销非常大,而且数据之间的依赖性特别强,这是一种科学计算。这种科学计算用那些超级计算机更有效。
  
  另外一类科学计算,像你们要做的蛋白质的搜索、匹配,它和事物计算非常类似,它们之间相互的依赖性没那么强。一个库里面有多少个样本,有几千万个、几百万个,你有一个新的东西,要进行比对,样本之间实际是没有关联的,你就可以把它分成很多份。这种情况下用云计算是很适合的。到底哪种适合在云计算上做,哪种适合在超级计算机上做,跟计算本身是有关联的。
  
  提问:我是来自哈尔滨工程大学软件学院大三在读生。我想问两位院士和林老师,互联网发展的速度太快了,云计算之后是大数据,大数据之后会是什么?例如是量子计算机或者是其他的什么?中国会率先发明出新的模型吗?
  
  主持人:他关心的比较远。
  
  李德毅:我们生活在现实里,预计未来风险很大。我曾经预计过,我在云计算大会上曾经讲过一句话,我说“物联网的更高境界是机器人联网”。我跟一些国家政府部门讲云计算、物联网、智慧城市作为战略性新兴产业,我个人认为下一步可能是机器人。
  
  主持人:既然是这个话题,我们别预测那么远,一年之内,百度在云计算上要做的事情是什么,院士们预测一下一年内云计算在中国发展会是什么状况,哪些行业或者哪些技术,或者哪些科研方面能够取得明显的进展。
  
  林仕鼎:像移动的发展和大数据的发展,很多时候是得到我们以前没有办法获得的数据。我们会构建一个环境,网页里面有各种知识,我们希望是能够把这样的架构构建起来。这样就可以把无结构化的网络变成更加结构化,它会作为我们新业务的基础。这是公共数据。

本文地址:http://www.jifang360.com/news/201368/n824148911.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
更多
推荐图片