机房360首页
当前位置:首页 » 技术前沿 » 实时的四个真正含义

实时的四个真正含义

来源:机房360 作者:Harris编译 更新时间:2016-9-30 6:50:36

摘要:但实时到底意味着什么呢?当你说实时的时候,你真正的意思是什么?别人说实时的时候,别人所说的通常是什么意思?你怎么能告诉人们使用的是什么意思?什么是近乎实时?

    一位工程总监表示,有个客户询问SyncsortDMX-h是否能做到实时数据处理。他问客户所说的实时究竟是什么意思。他说,我们希望能够每两小时实时将我们的数据从数据库和Hadoop进行迁移。”
  
  但实时到底意味着什么呢?当你说实时的时候,你真正的意思是什么?别人说实时的时候,别人所说的通常是什么意思?你怎么能告诉人们使用的是什么意思?什么是近乎实时?
  
  这里有四个不同的事情让人们了解实时的真正意义,以及如何确定你正在使用的意义。
  
  (1)亚秒级的响应
  
  一般来说,当工程师说“实时”的时候,他们通常指的是亚秒级的响应时间。而这种实时数据的处理,纳秒计数。性能极端水平是成功的关键。
  
  实例引用:
  
  “我们的网络安全进程对于窃取客户数据具有实时响应的能力,并能阻止自动攻击。”
  
  “这个股票交易应用程序必须实时竞价,否则我们会赔钱。”
  
  如果这就是所说的“实时处理”,那么需要数据来进行评估,而反应发生̶的时间一般都不到一秒。如果别人的系统可以做到几纳秒的速度,你可能会被淘汰出局。而这种实时其推动的性能极限并不是靠金钱来激励的,这是一种必然。
  
  (2)人类的反应时间
  
  这种实时处理是一个命令:“你不要让用户厌烦或沮丧。“”这种处理的性能要求通常是几秒钟。
  
  实例引用:
  
  “我们需要为我们的商业情报团队提供实时的可视化,无论多么大的数据。”
  
  “这个网站需要实时响应用户的要求,否则我们将失去客户。”
  
  如果这是你说的“实时”的意思,那么性能问题它可能不是第一个标准。在一些情况下,一秒的差异可能是至关重要的。举例来说,如果一个人点击网页上的广告,而页面需要4秒钟的加载,用户很可能就会感到厌烦,于是查看另外不同的网页。如果原来那个页面在3秒钟内加载,用户可能已经购买了该网页上的东西。
  
  然而在大多数情况下,只要数据获取处理和应用程序响应用户要求,或检查电子邮件,那么这些性能可以满足要求。
  
  (3)事件驱动
  
  如果当你说“实时”,你的意思却是相反的计划,那么你的意思是事件驱动。而不是发生在一个特定的时间间隔中,在事件驱动的数据处理发生时,通过一定的动作或条件触发它。这通常是在另一个事件发生之前的性能要求。
  
  实例引用:
  
  “当对数据库进行更改时,以实时集群进行这个复制过程。”
  
  在某些情况下,你不能准确知道什么时候处理完成你需要的数据,但当一个特定的事情发生时,这时候需要进行数据处理被触发。常见的事件实例是数据或用户操作中的更改。
  
  事实上,有两个不同的性能要求事件驱动的数据处理。首先,数据处理系统必须完成工作,并准备在下一个事件发生之前重新开始。因此,如果平均而言,事件发生不超过五分钟,一个数据处理时间为2-3分钟的帧是优秀的。如果事件发生的平均间隔为10秒,那么显然,2-3分钟的处理时间将是不可接受的。
  
  第二个性能要求可能会更加随心所欲。这是业务的服务等级协议(SLA)。例如,如果你希望能够保证首席执行官用最少的时间处理最新的数据,然后将数据处理必须能够在最后期限完成。
  
  (4)流数据处理
  
  如果当你说“实时”的,你的意思是批量处理的对立面,那么你的意思是流数据处理。通过批量处理,数据被收集在一起,所有记录或其他数据单元在一个大包中被处理,直到他们全部完成。在流数据的处理中,该数据被处理。一旦数据开始进来,它一般不会结束。对流数据处理的性能要求是,你必须在数据流中的数据流中快速处理数据。
  
  实例引用:
  
  “我们通过Twitter数据实时的筛选,密切注视我们公司的市场人气。”
  
  “在这个数据中心的服务器信息进行实时监控,可以尽早发现问题。”
  
  这些日子以来,越来越多的人在谈论“实时数据处理”,他们最有可能的是指流媒体数据处理。流媒体数据处理具有一些很具体,有时很难实现的要求。你必须能够连续处理这些数据,而不需要启动或清理开销。微批量流数据处理框架,如Spark流已经找到了一种方法来处理启动和清理需求,同时仍然保持与流媒体性能相匹配的速度要求。流数据处理还需要一种方法来处理偶尔的系统故障,而不需要大量的数据丢失。在某些情况下,数据丢失是可以接受的,但在其他情况下,并非如此。
  
  接近实时
  
  从所有这些不同的含义的实时外卖不是你使用的单词错了,或一个定义是比另一个更正确的。这是,当你在考虑实现一个实时数据处理应用程序时,你要考虑什么样的即时真的是很重要的。在此基础上,你可以确定你将需要什么样的性能水平。
  
  这不是实时,而是接近实时。那么,接近实时的意思是什么呢?说真的,为什么一个小小的连字符的单词突然有四种不同的含义吗?那么漂移英语是什么?它是如此的不精确!
  
  接近实时基本上意味着任何一个提到的定义,除了亚秒级的响应时间。那么,什么是实时时间,实时意味着什么呢?
  
  在最近召开的SparkSummitEast峰会中,Syncsort公司总经理TenduYogurtcu问,“你看到了什么趋势?”对此,她回应道,“很多客户正在向实时的数据处理努力。”DataBricks公司首席执行官阿里AliGhodsi对此表示赞同,“我们看到一个真实的实时推送。”他也看到打破数据孤岛的趋势,并做进一步的分析。Tendu还表示,未来在于流媒体和批次平台的结合。
  
  无论你的系统在任何情况下的性能水平如何,如果只是速度太慢了,你最终失去了客户,那么也许你应该尝试迁移到实时数据处理。
  
  编辑:Harris

机房360微信公众号订阅
扫一扫,订阅更多数据中心资讯

本文地址:http://www.jifang360.com/news/2016930/n047587602.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
推荐图片