机房360首页
当前位置:首页 » 云计算资讯 » 云计算与大数据问答:李德毅、高文、林仕鼎答疑

云计算与大数据问答:李德毅、高文、林仕鼎答疑

来源:机房360 作者:yuxin编辑 更新时间:2013-6-8 15:55:13

摘要:中国工程院院士李德毅、高文,百度大数据首席架构师林仕鼎,就云计算与大数据相关问题回答了网友以及现场与会者的种种疑问。

  第五届中国云计算大会于2013年6月5-7日在北京国家会议中心盛大举行,本次大会以国际视野,洞悉全球云计算发展趋势,并从应用出发,探讨云计算与大数据、云计算与移动互联网、云安全及云计算行业应用等焦点话题。
  
  中国工程院院士李德毅、高文,百度大数据首席架构师林仕鼎,就云计算与大数据相关问题回答了网友以及现场与会者的种种疑问。
  
  以下是问答实录:
  
  主持人:下面进入互动环节,有请中国工程院院士李德毅院士、中国工程院高文院士,还有百度大数据首席架构师林仕鼎。
  
  第一个问题从高院士开始。大家听了您的演讲以后,觉得视频是一个大数据,但也对安装3千万个摄像头有一点疑问,在云计算这个时代,公民的隐私问题都被暴露出来了。
  
  高文:现在安装的用于城市安保的摄像头并不是可以自由访问的,它在安全方面还是受到保护的,必须得到授权才能访问。通常都是进入它的系统以后才能进行搜索访问,包括系统内,也不允许工作人员随便访问。它都是有规定的,只有在特定情况下才可以访问,比如你需要破案。它的安全比云计算、大数据的安全性要高得多,没有什么可以担心的。
  
  主持人:请李院士就这个问题再谈一下,视频数据在国家安全等级范围内的,但个人的数据还是暴露出了很多问题,在隐私方面是什么样的情况?从技术手段和法律手段上,有什么样的政策吗?
  
  李德毅:我们讨论云计算的时候,最大的困难之一就是安全。云计算作为一种网络计算形态,跟安全并不直接相关。无论是一个单机系统,还是个网络系统,还是个社会系统,它的安全,它的可信,它的诚信,都必须从社会、法律、道德,乃至技术,共同来完成。有些人说我的数据放到存储中心,安全谁来保证?这个问题问得非常好,你的数据是你的,没有你的批准别人是不能用的。这就好像你的钱在银行里,你不同意别人是不能挪用的一样,有协议。你拿去投基金了,有协议。你拿去炒股票了,又有协议。所以云计算当中的数据存储、集中存放并不等于可以滥用。这一点,除了技术手段之外,还需要政策层面的支持、法律层面的支持。有的时候还需要社会道德层面的支持。所以这个问题相当复杂。
  
  我们老百姓所说的安全,现在更多的是可信、诚信,是技术不能承担之重。技术永远是为人服务的,但技术不是万能的。
  
  主持人:谢谢院士的回答。
  
  林仕鼎先生是来自企业界,你们内部是怎么看待云计算这个问题的?包括平台。
  
  林仕鼎:百度是一家搜索引擎公司,搜索引擎从第一天还是就具有云计算和大数据的特征,我们的工作就是加工网页。通过为用户提供相关的广告提供流量,搜索和广告都是跟数据相关的,因为这两者的规模特别大,我们在发展这两个业务的过程中就发展了云计算的业务。对我们来说是一个事情,我们搭建一个大规模的云计算平台,包括大规模的存储、大规模的计算和高性能计算,就是为了支持数据分析类、数据智能类的业务。
  
  提问:我是一名普通的系统管理员,做了十年的系统管理,近几年有一个非常困扰我的问题,就是关于资源利用率的问题。云计算的一大优势是用更少的成本提供更好的服务,更少的成本通常意味着要更好地提升像服务器、存储、网络这些IT资源的利用率。包括今天的演讲里面,很多嘉宾都讲到利用率从20%提高到70%、80%,甚至更多。但是,现在业界似乎没有统一的标准和计算方法。这就导致你说你高,我说我高,他说他更高。我想请问一下几位专家,有没有必要建立这样一个统一的语言、统一的标准来衡量云计算的资源利用效率?
  
  主持人:云计算资源利用率的标准。
  
  林仕鼎:我分享一些我们在百度内的实践我们内部是这样划分的,我们会根据业务和应用的类型进行分析。业务类型有哪些呢?比如说数据处理类。这一类型业务的特点,我们会有大量的数据需要做IO,然后进行处理。这是一个类型。
  
  另外一个类型是存大量的数据,大多数都是用来备份,有的时候也是供审查使用,它平时不太用,只是类数据。
  
  还有一类是用户数据,比如云存储。我们给每个用户提供存储空间,他们进行随机的访问。
  
  还有一类业务,像百度知道、百科、贴吧这种偏社区类的业务,更多的是面向用户查询。
  
  这些不同的类型,对资源的使用是不一样的,比如说数据分析类的业务,它就是IO跟CPU之间平衡的业务,我们通常只要看CPU利用率。我们会制定一个标准,这类业务的CPU利用率必须达到80%。CPU利用率是一个瓶颈,它的IO是平衡的。对于存储类业务我们又定了存储的利用率,就是你的存储空间在硬盘上的占比是多少,大概也是80%左右。对于社区类型的业务,它的瓶颈在IOPS,虽然每台机器上存的数据量不大,但它的IO压力比较高,这个时候它的瓶颈是IOPS。

本文地址:http://www.jifang360.com/news/201368/n824148911.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
更多
推荐图片