机房360首页
当前位置:首页 » 业界动态 » 数据迁移正考验云计算的实际能力

数据迁移正考验云计算的实际能力

来源:机房360 作者:victor 更新时间:2013-4-4 19:33:14

摘要:中国雅虎官方邮件称,雅虎邮箱将于8月19日停止服务,建议用户将数据怎是转移至阿里云邮箱。在规定日期前没有进行转移操作,用户的原雅虎邮箱中的相关数据及联系人信息将被彻底删除无法恢复。

  随后中国阿里巴巴以及网易等大型的邮箱纷纷发布数据迁移,可以将雅虎的邮箱整体迁移到网易等,这个过程在用户使用的过程中或许很方便,但数据迁移本身就是一个技术层面。

  随着时间的推移和云服务标准的最终确立,在标准化的云计算平台迁移应用程序和数据将成为可能,如OpenStack,而且整个迁移活动会更无缝和容易。

  由于大多数云服务提供商不会在合同中提供太多的风险转移和补偿方式,所以企业在采用基于云的服务时应该谨慎考虑对数据管理提供的保险,以解决因数据破坏或服务中断而产生的潜在经济损失。虽然许多网络风险政策涵盖了数据丢失事件中的第一和第三方责任,但如果政策中并没用具体提到基于云的服务的话,保险公司往往可以拒绝承保。

  同时也会有商业系统进入市场,使得迁移工作变得更轻松。例如,Vision Solutions公司所提供的全新迁移解决方案Double-Take Move,将可用于数据从一家服务供应商迁移到另一家云提供商,即使源提供者拒绝合作。Quocirca预计,随着时间的推移,其他类似的服务也将逐步上市。但对许多企业来说,在处理数据和应用程序迁移时,将仍然需要一套坚实的计划。

  大数据和云范例之间实际的重复非常广泛,你可以宣称你正在一个内部部署的Hadoop、NoSQL、或企业数据仓库环境下处理基于云的大数据。请记住云被广泛理解为包含“私有”部署以补充或代替公共云、SaaS、和多租户托管环境。

  但是如果你把云的实际定义限制于公共订购服务内,你就能找到问题的核心:识别哪些大数据应用相对于内部部署更适合公共云/SaaS 部署(比如那些涉及提前优化的硬件设备或虚拟服务器集群的应用)。

  换句话说:你什么时候可以通过引进一个外部服务供应商为你管理它们,从而提高大数据的可扩展性、灵活性、性能、成本效益、可靠性、以及可管理性?以下是一些明确的大数据在公共云中的使用实例。

  已经在云中托管的企业应用程序:如果和许多企业一样——尤其是中小型企业——你使用了一个外部服务供应商提供的基于云的应用程序,许多你的源交易数据已经被置于公共云之上。如果你在这个云平台上有更深入的历史数据,那么它可能已经积累至大数据级。如果外部服务供应商或它的合作伙伴之一提供了一个增值的分析服务——如客户流失分析、营销优化、或客户数据的异地备份和归档——那么利用这些服务会比将这些数据置于内部来得有意义。

  需要相当大的预处理能力的大容量外部数据源:例如,如果你打算通过监测社交媒体数据的聚合输入来分析客户的情感,内部的服务器、存储、或带宽容量可能无法很好地为你完成这项任务。这是一个明显的关于应用程序的例子,在这里你会希望利用一个基于公共云的、大数据驱动的服务所提供的社交媒体过滤服务解决问题。

  超过你内部部署的大数据处理能力的策略型应用程序:如果你已经有一个专门为某个应用程序内部部署的大数据平台(比如高容量非结构化数据源ETL专用的Hadoop集群),那么使用一个公共云来处理当前平台所不适用的、或是按需服务会更健壮或划算的新的应用程序(例如多渠道营销、社交媒体分析、地理空间分析、可查询归档、弹性数据沙盒技术)可能会更行得通。事实上,如果你需要尽快获得PB级规模的、流媒体的、多结构的大数据处理能力,那么一个公共云产品可能是唯一可行的选择。

  非常大但只是短暂存在的沙盒的弹性供应:如果你有一个短期周转的短期数据科学项目,而这个项目需要比惯常大一个数量级的探索型数据集市(又名沙盒),那么云可能是你唯一可行或可以支付的选择。你能够很快在项目期间运作基于云的存储和处理能力,然后当项目结束时又可以很快的取消之前配置的一切。我称之为“泡沫集市”部署模型,它是为云量身定制的。

  云服务提供商与任何其他商业实体并没有什么不同。前进的道路上也会经历失败,但是,我们有必要对所实施得IT平台模型进行反思。毕竟,现在的问题是,云服务提供商的任何故障都将影响到更多的企业,因为根据定义,它们是多租户的平台,IT企业必须准备好一套战略,以最大限度地减少云服务或数据中心供应商发生故障所带来的影响,无论是合作关系的崩溃或是云服务提供商的彻底运行失败。

  数据云迁移必须面对云的网络连接能力的考验。企业与云之间数PB的数据的来回切换是比较困难的。目前大部分的操作模式是通过一个局域网或者广域网进行数据传输。

  根据企业数据量大小不同以及网络连接能力的高低,初次的数据迁移可能会持续相当长一段时间,因此,响应延迟是阻止云存储被采用的一个最重要因素。这里,建议各个机构在做数据云迁移前仔细检查本机构的网络情况并对内部网络的安全现状进行评估。

  目前,提高现有网络连接能力已经成为了一个新的研究方向,只有当网络足够好时,数据迁移才会更便捷。虽然有些云供应商提出了用物理迁移的方法来代替网络传输数据,但是我们要看到,由于工作性质的原因,有些类似于病人病历、企业核心数据等敏感数据是不能被复制或采取物理迁移的方法带走的。

  鉴于此,要把企业的数据转移到云中,针对不同的实际情况这里我推荐两种方法:当企业的数据吞吐量较大但是数据量不是特别多,对传输延迟也沒过多要求时,云供应商可以提供从企业到供应商某个存储节点之间的私人链接,方便企业迁移数据。企业可以根据自己的时间,在不影响公司正常运行的情况下做数据的转移安排;

  当企业的数据可以提供拷贝,那么我们可以采用sneakernet的方式,即人工网络模式,将数据通过磁盘、移动存储设备等从企业服务器拷入到云数据中心或者从云数据中心拷贝出来,目前一些云供应商为了加快数据的转移,在给企业进行数据转移时会采取一些切实有效的人工网络模式。

  责任编辑:yayo

本文地址:http://www.jifang360.com/news/201344/n444246680.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
更多
推荐图片