机房360首页
当前位置:首页 » 大数据 » 如何提纯大数据的业务价值

如何提纯大数据的业务价值

来源:机房360 作者:Mary编辑 更新时间:2012/4/18 10:51:55

摘要:4月17日、18日在北京国家会议中心隆重举行2012 第四届CCS云计算高峰论坛暨展览。近3000名来自运营商、政府部门、金融、保险、电力、能源、医疗、公安、军队、教育、制造等行业的企业IT、信息部门主管及专家学者齐聚一堂,深度探讨云计算应用现状及发展趋势,分享交流云计算的优秀案例。知名厂商“甲骨文”亮相“云计算高峰论坛”并发表精彩主题演讲,以下是甲骨文大中华区技术架构部总监林逸飞演讲主题“如何提纯大数据的业务价值?”演讲实录。


接下来是我的演讲题目,这些大数据,四个V的特点,量又大,速度也大,格式也众多,每一条数据的价值又非常低,我怎么把这些数据提纯起来,真的知道我的生产,这是提纯大数据的主要原因。我举一个最简单的例子,一个超市,今天我谈到的这些是有十几案例,而且这些技术在今天,可能在座很多朋友们手里都有。比如说我可以根据在商城里面所有部署的探头或者其他的设备,客户的行进路线我可以采集得到,根据他的行进路线,途径我的门店的时候,我可以定点向他推荐促销信息,这个完全做得到。整体的营销策略里面,跟进整个销售的战役的制定,来调整他的一些促销,或者我进货出货的策略。采集客户在微博、博客在相关的一些网站上面,各种各样的反馈,这样是一个很明显的,在今天我们完全能够利用到的业务场景。我拿这个金字塔套一下,大家看,这些数据我们把他归结为大数据,他可以被采集到系统里面来,同时我跟进他的业务策略,这些数据可能来自于我们的数据仓库,甚至于来自我的ERP系统,这些数据是我的生产数据。那当然我采集所有网络相关的这些数据,他一定是大数据,他希望进入到我最底层的金字塔最下面,作为我大数据的基础。关键是说这些数据之间是完全需要互动的,换句话说你要定时定点的推一些营销策略,或者根据机器传回来的数据进行判断,这个时候这些大数据要反过来,对你的DW,对你的生产系统直接发生关系,如果不这样的话,这些大数据没有用处。
大数据提纯以后的结果,让这个大数据从金字塔最下端被逐渐提纯进入到DW,最后再进入各种各样的分析,进入到BI,数据逐渐浓缩,最后具有商业价值。所有人都在说我希望做微博营销,我希望提高在互联网上对我企业的影响,哪些数据对企业经营有十几价值,这就是一些数据,48%的客户,当他是手机微博的用户的时候,通常他会更乐意接受这些促销信息,其中有很大比例的人会在它的微博,或者博客上发布我曾经在这个里面接到这样一些东西,使用的体验是什么样的,这就是数据。对这个企业来讲,我先解决缺货的问题,我一定能够解决在我整个店里面最基本的问题,第二我可以对这些手机微博客户做一些定点营销和精准策略,这是两个精准的例子,后面想做这件事情是非常难的。
首先在金字塔终端这个层次上,他两个核心系统,一个是企业ERP的生产系统,第二个就是企业原有的DW,BI系统。第二个在金字塔的最下端大数据这块,你有很多企业专业应用,这些应用可能直接跟机器,跟互联网打交道。第三金字塔的最上端你要有一个合适的BI的工具和平台,形成管理者的驾驶舱,内容把业务数据体现出来。想产生上面这两个简单的结果,中间画了一个环,他基本上要历经这四个步骤,只有通过这四个步骤才能把你的大数据发挥它真正的业务价值,首先我要能够获取,我有合适手段采集到各种各样的数据。第二我能够去计算组织他们,第三能够根据这样属于进行分析,最后形成我的判断、业务动作出来。这些大数据跟你现在的数据仓库,跟BI要集成,如果不集成的话,这些大数据在旁边又建了一个烟囱出来,没有用的。
说到最后就是oracle,oracle实际上提供了完整的方案,同数据的捕获、组织、分析、决策我们都有平台化的工具和产品提供给客户和合作伙伴。首先是捕获,大家都知道oracle有自己的应用,从ERP到CRM,到各种的ECM我们都有然间,使得你有机会从各种各样的核心系统里面找到一些数据。第二针对所有非结构化的数据,oracle直接推出了一个产品就叫NoSQL数据库,很有伸缩性的一款产品,他可以帮助你存储非结构化数据。
在组织这一块,我们业提供沙盒的功能,你可以在你的机器里面配置这样一个沙盒出来,所有分析全部在这个沙盒里面运行,他对CPU的消耗不会超过你这个沙盒所设置的限制,这样是帮助你去运行这样一些大数据分析的基础平台性的功能。我们提供这样一个产品ODI,oracle已经有几十年的产品。
分析有一个R的组织,他是非常适合统计分析跟图表化展示的平台,他是开源的,而且比较适合在笔记本里面或者PC里面运行的系统。我们能够把它集成到oracle数据库里面,大数据机里面,提供这样三种方式,比如通过客户机访问,或者直接在大数据机里面运行,第三,可以在oracle数据库一体机里面直接去运行。在BI的信息表里面我们也集成了对R的支持。这是oracleExalytics,oracle不断在各种领域体现推出合适的一体化的设备,这也是一种一个,他的主要特点基于内存的实时BI的产品,在这个产品里面所内置的oracle内存数据库是一个定制版本,这个版本可以利用到更大范畴的内存,使得这样一些BI分析数据可以直接灌入内存,可以达到非常高的速度。
做个总结,一体化的设备,oracle将近三年半以前开始做,在今天看来,我们推出的数据库一体机,云计算的弹性服务器,在过去三年里面,在市场上都得到了非常好的反馈,这个反馈来自于两个方面,一方面我们的业绩当然大家去看oracle的财报,确实是这几款机器给oracle贡献非常巨大,在过去三年里面搅动了很多企业做了类似的收购,跟相应产品的推出,这是oracle一体机的背景。
在今天我们去谈oracle大数据平台的时候,实际上我们也有一体化的解决方案,前端我们有一个叫大数据机,去年10月份发布,这个机器是oracle运行大数据最主要的机器,刚才我谈到的各种平台工具,全部内置在这个机器里面,这是oracle作为大数据最前端处理金字塔最下端的PB级别数据的机器。中间成名了三四年的机器,作为世界上最快的做DW的机器,我们看作金字塔中间那块,当你需要做最终的决策的时候,进入到BI,基于内存的实时BI的机器,也是去年我们刚刚推出的,他可以基于定制版本的内存数据库,支撑整体BI决策。关键一点是我们在这三者之间集成这块花了非常大的气力,变成你真的可以从新浪微博、博客里面采集数据,进入到真正指导你企业的业务生产,这是oracle谈到整体化大数据整体解决方案。oracle在处理大数据这一块,是跟我们整个云计算的策略一脉相承的,所以oracle也有自己完整的云计算的方案,其中针对云中的大数据,是刚才我所跟大家阐述的所有的大数据解决方案,谢谢大家!
责任编辑:Mary

本文地址:http://www.jifang360.com/news/2012418/n858535554.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
推荐图片