摘要:尽管据Gartner公司预测,大数据将在2013年带动340亿美元的IT开支,并到2015年在全球范围内创造440万个就业机会,但成功的大数据项目的部署需要细致的规划和明确的战略。 |
明确您需要把握什么样的洞察和见解
企业所面临的问题的部分原因在于:供应商使用的术语。“当提到大数据项目时,供应商就某些专业词汇缺乏一致的定义,这常常会使得企业客户容易混淆相关的概念。”Yuen说。
“数据采集的关键在于,需要深入的了解这些数据信息。”赛仕软件研究所(SAS)香港地区总经理StanleyLam表示。“您需要明确的是:您想要从贵公司所收集的数据中获得怎样的洞察和见解,然后才是选择正确的策略和工具来实现它。”
例如,一家零售商想要调查了解其客户的情况下,该零售商可以充分利用其客户在社会化网络媒体所发布的相关意见的帖子。他强调说:“要做到这一点,零售商需要采用文本或情绪分析工具。”
根据他的经验,香港的许多客户对于社交媒体分析非常感兴趣。“所有消费者驱动的企业,包括零售商均发现:社交媒体分析是非常有用的。”Lam说。“无需进行手动搜索和研究,你的企业仅仅只需要采用一套系统的方法来分析和理解客户在社会媒体网络的评论。”
垃圾数据信息
尽管数据信息能够帮助企业分析和理解相关有价值的东西,但数据量并非总是越大越好。随着企业所收集的数据量的不断增长,大部分数据信息都是一次性的,根据Gartner公司的Yuen介绍。数据信息的作用大小是由其相关性所定义的,但数据信息的相关性会随着时间的流逝而变化,他补充说。
“随着存储成本的不断降低,以及大规模的并行处理计算变得越来越普遍(在大规模并行处理计算数据库中,数据被划分到多台服务器,每台服务器的内存/处理器都能够在本地进行数据处理),多个数据在合理的成本情况下被重复使用是可能的。”Yuen说。“例如,曾几何时,在一个网站上,访客登录的记录仅仅只能用于相关法律规定条件下的合规性目标统计。现在我们可以将这些访客的数据信息保留一段较长的时间以分析客户的行为、渠道的有效性、和成本结构了。”
但企业仍然需要评估如何测量相关数据信息的关联性。Lam介绍说,其实垃圾数据信息是很难界定的。“当谈到数据信息时,有一件事企业务必要记住:我们并不是仅仅像Facebook那样简单的将评论数据信息累积起来,我们这样做的目的是为了能够从中分析并得到有价值的见解。”他说。
关于大数据的五大神话
企业同样也应该意识到那些阻碍大数据项目有效部署的神话。
1、大数据分析不是大分析
Lam指出,大数据分析不是“大分析”。商务智能的关键是生成报告。当您的企业需要就所收集的大量数据信息生成报告时,那仅仅只是大的分析。他说:“大数据分析是使用先进的分析工具对海量的数据信息进行分析,进而从中获得相关有价值的见解和预测。”
例如,利用数据了解和预测感染性疾病的发展趋势便是这样的一个例子。据SAS介绍,香港特区政府卫生署卫生防护中心就在实施SAS公司的框架和文本分析工具,以预测相关感染性疾病的发展趋势。
“同样,也有类似的工具可以用于金融机构进行相关欺诈检测和预测分析。”Lam说。