机房360首页
当前位置:首页 » 大数据 » 大数据应用技术(上):加速创新,重塑世界

大数据应用技术(上):加速创新,重塑世界

来源:机房360 作者:Mary编辑 更新时间:2013/12/8 14:48:08

摘要:我们对数据分析师的要求不光会使用Hadoop,使用大的数据仓库,也要熟悉各种算法,各种模型,具有一定数学的基础。最重要的,你必须要了解业务。你要了解你分析的行业,它是什么样的生产流程,它的特点是什么?所有的数据代表什么意思?如果没有这些方面的基础背景,数据量再大,摆在我们面前的也都是冷冰冰的数字。

  2013年12月5-6日2013中国大数据技术大会在北京举行。数十家领军企业,近七十场主题演讲,不仅覆盖Hadoop生态系统与流式计算,实时计算与NoSQL、NewSQL等技术方向,还对互联网、金融、电信、交通、医疗等创新案例,大数据资源的法律法规、大数据商业利用的政策管制等有深入讨论。在大数据应用主题论坛上,中国移动研究院业务支撑研究所所长孙少陵在开场致辞中指出:我们对数据分析师的要求不光会使用Hadoop,使用大的数据仓库,也要熟悉各种算法,各种模型,具有一定数学的基础。最重要的,你必须要了解业务。你要了解你分析的行业,它是什么样的生产流程,它的特点是什么?所有的数据代表什么意思?如果没有这些方面的基础背景,数据量再大,摆在我们面前的也都是冷冰冰的数字。

  易欢欢:大数据时代的跨界与颠覆

  宏源证券研究所副所长易欢欢,演讲的主题是《大数据时代的跨界与颠覆——金融业门口的野蛮人》,他指出:以前的个人信用数据来源来自金融账户、水电煤气。现在的个人信用还包括了Amazon、eBay、甚至是Facebook和Twitter。打通社交网络的数据,可以提供多渠道的数据获取,决定贷款最终的发放。如果奥巴马发推at过你,那你的信用额度将会大幅提升。


  专注极致,基于口碑的传播模式。这是一个充满颠覆的时代。重新审视核心竞争力、护城河、拥抱移动互联网大数据、重新评价公司产业事业的新价值。另外,易欢欢还讲到,整个产业的模式在变化。更加专注、更加极致、注重口碑、信息的传播会非常的快! 对大数据应用对于金融业有更大的意义,在企业层面,其拥有数据的规模、活性,以及收集、运用数据的能力,决定公司的核心竞争力。掌控数据,就可以支配市场,意味着巨大的投资回报。数据将成为企业的核心资产。面对大数据时代,各行各业的需求、运营和结构效率都将发生改变。

  何鸿凌:Analytics as a Service

  中国移动经分(BI/DW)系统规划项目负责人何鸿凌,演讲的主题是《Analytics as a Service》。他指出,大数据时代下电信运营商的分析需求变化。1. “头部”共性的需求越来越少,“长尾”个性化需求越来越多。2. 固化的需求越来越少,探索性需求越来越多。3. 向前总结性分析越来越少,向后预测性分析越来越多。(Predictive Analytics )4. 简单的统计分析越来越少,复杂的分析越来越多。(Advanced Analytics)5. 单一数据分析越来越少,跨域数据分析越来越多6.大数据平台越来越集中,但应用覆盖面却越来越广。(Pervasive BI)


  陈奇:数据蕴藏价值,用芯发掘机遇——英特尔大数据实践

  英特尔数据中心软件部首席架构师陈奇,演讲的主题是《数据蕴藏价值,用芯发掘机遇——英特尔大数据实践》。他指出,数据可以驱动创新的良性循环。在2012年,全世界产生了2.8ZB的数据。未来的2020年,全世界将产生40ZB的数据。


  云将变得更加智能,将有更丰富的数据可以用来分析,智能客户端的用户体验将变得更加丰富。而由于使用了更多仪器采集数据,我们未来的物联网将变得更加的智能。整个世界将因为人们掌控的数据越来越多,各行各业将变得更加智能。

  薛伟:腾讯广点通——大数据之上的实时精准推荐

  腾讯精准推荐中心广告推荐负责人薛伟,演讲的主题是《腾讯广点通——大数据之上的实时精准推荐》。他指出,典型的大数据包含四个特征:

  大量(Volume):腾讯QQ月活跃用户超过8亿,在线人际关系链超1000亿;Qzone空间月活跃用户数超6亿。

  高速(Velocity):Qzone空间日均相册上传超过4亿,日写操作总数过10亿。

  多样(Varity):数据种类多(日志、视频、图片、LBS信息等),非标准化数据比例高。

  价值(Value):价值密度低,商业价值高。


  在算法方面,要针对不同的推荐场景,采用不同的数据和不同的算法策略。事实上,对于像广点通这样的基于腾讯大社交平台的效果广告营销产品,在腾讯大社交平台的海量用户积累基础上的大数据挖掘平台来说,推荐本质上是一种个性化排序,即Ranking= scoring+sorting+filtering。好的推荐,就是准确的排序+精准的预测值。

  当然研究算法要构建算法谱系,将基本算法、基于内容的算法、协同过滤算法、图算法、分类算法等等做混合,形成一套完整科学的混合算法。因为用户是复杂的,应用环境是复杂的,单一的算法不可能解决所有问题。

  魏凯:大数据商业利用的政策管制问题

  工业和信息化部电信研究院专家魏凯,演讲的主题是《大数据商业利用的政策管制问题》。他指出,目前的大数据应用还是以互联网行业领先,其他行业还在摸索中。大数据分析已经开始向经济社会其他领域广泛渗透。全球大数据市场规模较小,但增速很快,在开源生态、投资并购等方面都非常活跃。


  国际上,大数据技术创新,形成了“互联网公司原创+开源扩散+IT制造商产品化+其他企业使用”的明显格局。大数据应用的技术们门槛在降低,但差距在逐步拉大。

  早在1993年,Peter Steiner在《纽约客》上谈到在互联网中,没有人知道你是一条狗。今天,MIT 2013年对150万手机用户15个月的记录进行分析得出的结论:四个位置信息就可识别你是谁,准确率95%。数据的开放与流通,用户的安全与隐私,已经成为了业界争论的焦点。

  责任编辑:Mary

机房360微信公众号订阅
扫一扫,订阅更多数据中心资讯

本文地址:http://www.jifang360.com/news/2013128/n597354697.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
转载声明:凡注明来源的文章其内容和图片均为网上转载,非商业用途,如有侵权请告知,会删除。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
推荐图片