机房360首页
当前位置:首页 » 治理 » IBM:大数据治理应当收到重视

IBM:大数据治理应当收到重视

来源:机房360 作者:yuxin编辑 更新时间:2013-7-19 14:16:42

摘要:《大数据时代》的作者维克托·迈尔-舍恩伯格在谈到大数据给信息时代带来的变革时表示,相对于“小数据”来说,我们不再热衷于追求大数据的精准度,或者我们可以将其理解为大数据定义中的第三个V,即Value(价值)。

  大数据的价值密度相对于传统交易数据会比较低。在大数据时代,我们不必去追求每一条数据都准确无误,数据的混杂以及相互作用让我们从之前的探寻因果关系转化为寻找事物之间的相关性。
  
  在2013 IBM技术峰会上,IBM杰出工程师、副总裁兼Guardium首席技术官RonBenNatan认为,大数据治理比传统数据治理更困难,存在更多的挑战,因为用户需要从数据开始生成的时候就开始考虑以大数据的方式来进行治理。
  
  大数据带来治理难题
  
  大数据的魅力在于为提升公司的竞争优势提供必要的洞察力:公司可以利用它发现客户及其他与业务息息相关的元素。对于走在大数据前沿的实践者来说,缺乏正确的数据治理流程会造成数据错误,从而导致分析结果的偏差以及无形成本的增加。而大数据治理的难度则体现在:首先既要考虑传统数据的治理,又要兼顾新型数据存储方式的变化,比如NoSQL;其次大数据来自于多个数据源,这些数据源有内部的数据也有来自外部的数据;第三,大数据的数据结构更多,如JSON、Avro等,数据治理的复杂程度更高;最后,大数据的量非常大,海量数据给治理带来了更大的压力。
  
  为了从大数据中获得有意义的业务信息,我们要完成所有的相关工作,如数据的语义分析,然后再将它转变为概念模型或知识。因此整个过程就需要数据治理的参与。大数据的治理不只是说当你有了这些数据之后开始治理,而是从数据开始生成的时候就开始考虑要以大数据的方式来进行治理,需要整个生命周期的大数据治理。
  
  IBM的大数据治理最佳实践
  
  IBM在发布大数据战略之初就一直强调治理的重要性。RonBenNatan表示,IBM在大数据治理方面已经有了三年多的积累,并总结出一套大数据治理的最佳实践。这其中包括:
  
  让现有的数据转换成大数据可以使用的数据集,同时提供双向的转换。IBM提供了一系列工具,可以在现有企业的关系型数据和大数据需要的数据模型下进行自由的转换。大数据环境下进行数据屏蔽。当把所有的数据放在一起,数据中很多部分跟企业和个人相关的数据是具有敏感性的,在不同的人手里这些敏感的数据用做不同的用途,有一些是有害的,企业需要在这些数据流入流出的过程当中避免敏感数据的泄露。
  
  对大数据进行加密。我们需要保证不同节点中的数据不被他人非法利用。这里谈到数据的加密,可以提供透明的方式,保证只有特定的用户使用特定的应用程序,或特定的方法来访问到真实的数据。Hadoop环境下的数据保护。Hadoop是大数据时代最流行的数据存储方式,企业大量数据存储在HDFS中,因此需要对这部分数据进行充分的保护。RonBenNatan博士介绍,IBM对开源Hadoop以及IBM的BigInsights都提供这样的数据保护方案。
  
  IBM结合了传统数据治理的经验,在过去几年中积累并且建立了大数据治理的策略和Guardium产品,同样也是迄今为止市场中最完整的大数据治理产品组合。而未来IBM也会尽力去投资增加在大数据环境,尤其是NoSQL环境治理的工具和方案。尽管NoSQL并不是IBM传统关注的领域,但NoSQL对传统数据库的增强作用是显而易见的,因此IBM有许多客户都开始进行NoSQL的尝试。而包括电商等互联网客户,也存在着与传统供货商直接的业务交流,这其中可能就会涉及到相关NoSQL数据的治理。
  
  责任编辑:余芯

本文地址:http://www.jifang360.com/news/2013719/n719350925.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
更多
推荐图片