机房360首页
当前位置:首页 » CIO管理 » CIO必读:大数据、社交媒体与内存计算

CIO必读:大数据、社交媒体与内存计算

来源:机房360 作者:jay蕊 更新时间:2013-9-14 13:43:57

摘要: LinkedIn推荐引擎的核心:半结构化数据


  如果注册了LinkedIn,你肯定会注意到有一个区域叫“你可能感兴趣的工作”。这个功能,乍看和Amazon或者Netflix的推荐引擎很像,但是在LinkedIn的推荐和个性化部门工程总监Anmol Bhasin看来,LinkedIn的实现要更加复杂。

  LinkedIn用机器学习算法从成员个人信息中发现有趣的模式。“但是,我想要澄清的是,真正推动这个产品的其实并不是机器学习算法。”Bhasin说。这番表态来自于其在近期Data Driven Business(组织每年一度的文本分析会议)的一次演讲上。

  真正的驱动力在于LinkedIn用户的各种信息:工作头衔、地理位置、所在行业和技能等。基于超过2.25亿份个人信息,可以挖掘出非常有用的模式,比如人们一般在什么是开始考虑职业生涯的下一步、工作变化的趋势以及那些较少有人员流出的领域。将成员的信息与整体职场趋势相比较,可以为其推荐合适的职位。

  “迄今为止,这个产品取得了巨大的成功,占到了我们所有工作申请总数的50%。”Bhasin表示。

  社交媒体的力量

  对于连锁药店CVS来说,这个夏天过得并不容易。有客户开始在互联网上抱怨CVS超长的处方单。他们发布照片、讽刺言论、左右晃动示意no的电子手指以及对经常长达6英尺的纸带的新奇用法。甚至还有人注册了一个叫@CVS_Receipt的推特账户,伴随着这样的语言:“我是如此不必要的长。”甚至American talk show的主持人及滑稽演员Ellen DeGeneres也来凑热闹。

  “你遇到过这种事情吗?这和一个12岁的孩子一样长。”她向听众发问,手里拿着一张CVS的处方单。

  社交媒体上的言论起到了效果。CVS通过其Facebook账号表示正在听取用户的意见并计划在未来几周内将处方单减少25%。

  内存计算

  咨询公司Third Nature Inc.的董事长和创始人Mark Madsen认为,BI的问题在于其依然生硬的交互模式。与Madsen一起发表这个观点的是IBM分析师Chris McPherson。

  基于SQL的数据库面临着工作流的问题。请求提交到数据库、提取数据以及结果返回到用户屏幕等阶段之间的延迟日益明显。根据IBM在1982年发表的《The Economic Value of Rapid Response Time》,超过3秒钟的时间延迟将会导致工作效率的急剧下降。Madsen认为这个问题当前仍然非常严重,当面对海量数据的加载和处理时,SQL查询显得力不从心。

  内存计算有助于这种问题的解决。数据在存储层次之间的来回移动是性能瓶颈所在,而将数据库缓存在内存中则可以消除这种冗余。

  自带设备的趋势

  Gartner在其发布的报告《Bring Your Own Device: The Facts and the Future》中,认为自带设备已是大势所趋。根据调查,38%的公司希望在2016年停止向员工提供设备,而只有15%的企业不会允许员工用自带设备工作。

  责任编辑:jay蕊

本文地址:http://www.jifang360.com/news/2013914/n398852577.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
更多
推荐图片