机房360首页
当前位置:首页 » UPS资讯 » 创建大数据持续成功的五个步骤

创建大数据持续成功的五个步骤

来源:机房360 作者:艾达 更新时间:2013-9-3 11:06:13

摘要:企业需要积极提升他们的数据管理能力。这并不意味着他们应该制定繁重的流程和让速度慢下来的监督机制。聪明的机构制定灵活的流程和能力,配合他们的数据活动的生命周期:随着运行需求的增加,质量或精度要求也会提高。

  企业所面临的环境是,越来越多的数据被收集或可供使用,大数据正在提供一个以及时和有效的方式利用信息的机会。一些机构利用技术,解决新的数据源,但大多数的机构仍在挣扎于管理数据,他们已经知道或应该知道,找到自己在处理新的以及当前的数据时,他们期待的应用大数据的能力。

  企业需要积极提升他们的数据管理能力。这并不意味着他们应该制定繁重的流程和让速度慢下来的监督机制。聪明的机构制定灵活的流程和能力,配合他们的数据活动的生命周期:随着运行需求的增加,质量或精度要求也会提高。

  企业如果把自己定位在大数据持久成功上,那么,企业需要把重点放在五个主要的领域:

  1、建立明确的作用和职责。

  就像在您的环境中所有其他数据一样,您需要一个明确知道谁是关键的利益相关者或决策者。随着数据在其生命周期里,在您的生态系统中移动,作用可能会改变,但它们仍然应该是很好被理解的。当您开始从事于您的大数据倡议时,尽可能识别这些利益相关者,并准备当您往前进行时,提炼和重复这个识别过程。

  2、加强数据治理和数据管理功能。

  确保流程增强了,可以支持大数据用户和大数据技术。流程可以是灵活的,并应考虑到经营与交易的需求,经营和交易均伴有不同程度的管理和监督。

  确保您的参考信息架构更新,包括大数据。这样做会告知如何最好地利用大数据技术的未来项目,并纳入相应的信息管理能力。

  确保您的元数据管理能力增强了,包括或关联所有的基本元数据的组件,随着时间的推移,还包括分类、本体和业务规则。

  一旦您推广您的解决方案并用于生产,您会希望这个方案一直被使用,所以您的监督和架构功能应该被很好地定义和有很好的功能,这一点是非常关键的。确保治理流程包括IT控制的作用,可以帮助企业的利益相关者,引导项目最好地利用数据。还应该包括安全和法律团队。使用现有的监督或门径管理机制来管理流程,这是我们的经验,应该专注于快速移动程序,让其通过流程,而不是像墙一样阻碍进程。

  3、了解环境中的数据的目的和要求的精度水平,并相应地调整您的期望和流程。

  无论它是一个POC,还是一个项目,已经进入主流业务流程,就要非常清楚地知道您打算利用数据做什么,以及您的要求是什么级别的质量和精度。这种方法将使项目能够寻求正确的数据来源,以及给利益相关者带来好评和影响,让您决定如何最好地管理这些数据。质量和精度要求越高,数据管理和监督就要越强大。

  随着机构在大数据方面成熟起来,考虑建立一个质量分类或精确分类的办法,将允许用户数据了解他们正在使用的是什么,并相应地调整自己的期望。例如,您可以使用白色、蓝色或金色来指定表示原始数据、清理​​的数据、组织和验证的数据,以支持有针对性的分析和使用。有些团体甚至进一步完善这一方法,将数据分为从1到5,其中1是原始数据,5是被很好理解的、净化的和有组织的数据。

  4、将非结构化内容纳入您的数据管理能力中。

  非结构化数据一直是企业运营的一部分,但现在我们有更好的技术,可以探索、分析这部分内容,并把它们注入到业务流程和监管工作中,我们终于采取步骤正式将它们纳入管理,这是非常重要的。大多数企业已经从这一步开始奋斗了。

  基本的、非结构化的数据在数据库中,以评论的形式,或自由项的形式存在,但至少是数据库的一部分,应该已经在一些数据管理的措施之下。但挖掘这些信息的能力已经变得非常困难了。

  对于许多管理团队和数据管理实施团队来说,在传统的结构化数据库和业务流程以外的数字数据是很少在他们的管理范围内的,除非当它可以被看作是一个技术问题时。一般来说,要不是符合保留和安全策略,它真的不是今天要保留的内容。随着您实施大数据,你会发现这一数据会迅速进入范围,影响您的商务智能(BI)解决方案,甚至你的业务活动。考虑积极地工作,把这个数据包括在您的数据管理功能的范围内,加入明确的企业所有权,并记录数据信息,如:用法、来源和更多的信息。

  不要采取“轻松路线”,单纯依靠大数据技术是您唯一正式的非结构化数据管理的过程。随着时间的推移,非结构化数据越来越多,要清楚什么是好的,什么是坏的,它来自何处,以及它是否被一直使用,这些变得越来越重要。甚至在其生命周期阶段,使用这个数据是至关重要的。

  要保持清晰,您可以使用大数据和其他工具,来了解您有什么,确定什么是有价值的,什么是需要管理的,这是至关重要的。大多数非结构化数据进入您的大数据的生态系统已经有一些监督,但通常是作为一个blob和非结构化的形式。正如您的“矿藏”一样,这个数据在您的业务流程中,变得更加精确和有价值。它可能还需要额外的特点,以符合安全、隐私或法律和法规的要求。最终,这些数据可以成为新的数据元素或添加到现有的数据中,但您必须有元数据,来描述它,您必须有管理能力,尽可能最有效地利用它。

  5、正规化从发现和试验性环境到生产环境的切换。

  如果你正在做一个实时分析或一个全面扔掉的测试,这并不适用于您,但对于大多数机构来说,他们最初的大数据工作快速发展,他们找到了需要的可持续利用的高度有价值的信息。这意味着,把在沙箱环境中所做的工作正规化,并正式在生产环境中运行。

 

       责任编辑:Adah

本文地址:http://www.jifang360.com/news/201393/n585652181.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
更多
推荐图片