机房360首页
当前位置:首页 » 需求分析 » 存储大数据成本高 可考虑多平台

存储大数据成本高 可考虑多平台

来源:机房360 作者:yuxin编辑 更新时间:2013/5/2 14:37:10

摘要:以LinkedIn为例,该公司就同时使用了Hadoop的解决方案和Teradata的解决方案。公司这样做的原因在于,大部分数据的价值密度很低,如果全部使用Teradata来存储,那么它的使用成本就会很高,而Hadoop则是公认的成本比较低的解决方案。

  如今,众多企业对于大数据是“趋之若鹜”,似乎没有应用大数据就是落后,而大数据的挖掘对于企业来说却并不全是机遇,因为这还意味着财政支出,这是因为针对大数据存储或者挖掘的成本也很高。而在2013Teradata大数据峰会上,LinkedIn商业分析高级经理李玥在接受采访时也表示,企业在投入大数据存储上的成本并不低。因而企业在应用时还应考虑到其他多个解决方案。

就以LinkedIn为例,该公司就同时使用了Hadoop的解决方案和Teradata的解决方案。公司这样做的原因在于,大部分数据的价值密度很低,如果全部使用Teradata来存储,那么它的使用成本就会很高,而Hadoop则是公认的成本比较低的解决方案。




类似于Linux开源,基于Hadoop开发的公司也很多,他们可以为用户提供产品。而通常来讲,Hadoop的解决方案会便宜一些。

这就要求对涉及到大数据类工作的企业进行筛选。比如,对LinkedIn来说,其报表数据分析对公司来说尤其重要。于是,该公司绝大多数的报表在后台都是用Teradata数据仓库来支持的。这部分报表要准时发出去给商业代表,而商业代表则要根据数据来做相关的决策,而且很多新功能也是通过TeradataAster大数据探索平台开发的。

据李玥介绍称,这些报表数据具有舞台效应,如果有一个延迟,后面的就会全部延迟。而在LinkedIn中,绝大多数的数据是先要从高度可靠Teradata系统里面读出来,读到LinkedIn的数据挖掘的平台上面,然后再用已有的这些统计上的工具来进行这些数据挖掘的工作。

    责任编辑:余芯

机房360微信公众号订阅
扫一扫,订阅更多数据中心资讯

本文地址:http://www.jifang360.com/news/201352/n972047476.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
转载声明:凡注明来源的文章其内容和图片均为网上转载,非商业用途,如有侵权请告知,会删除。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
推荐图片