摘要:“大数据”一词在2015年谷歌趋势分析上达到顶峰。组织收集的数据比以往任何时候都多,并且需要以经济高效的方式存储它,这可能是搜索“Hadoop”也达到谷歌趋势分析的高峰的原因。 |
但是到2018年,情况发生了变化。Cloudera、Hortonworks和MapR这三大Hadoop供应商不再将自己宣传为Hadoop提供商。在今年春天举行的Gartner公司数据分析峰会上,该公司研究副总裁Merv Adrian指出,这些供应商中甚至没有一个厂商在他们的展台提出Hadoop这个词。
现在重点是数据的分析和机器学习方面。据Cloudera公司高级产品营销经理Wim Stoop称,Cloudera已将其定位改为,“一个现代化的机器学习和分析平台,针对云计算进行了优化”,这是该公司大约一年半前所做的改变。
Stoop表示,直到大约两年前,市场关注的重点是如何在更长的时间内保留更多数据和更多不同类型的数据。那么如何存储它?但是,随着组织掌握了这项任务,出现了另一个挑战,现在可以存储这些数据,到底用它做什么?
“因此我们需要专注于机器学习和分析。”他说。
如今,Cloudera、Hortonworks和MapR公司将自己推广为分析、数据科学和机器学习的平台,将许多开源技术集成到一个地方,使企业更容易使用。MapR公司将自身描述为集成Hadoop、Spark和Apache Drill,以及其他数据技术的融合数据平台。Hortonworks将自身描述为连接数据平台和解决方案。
所有这些公司都在重新定位,不仅仅提供开源存储技术来满足大数据需求。这一举措得益于企业组织希望对其数据程序做出的改变。
这些数据平台公司采用多种开源技术,用于存储、管理和执行大数据的高级分析。这些公司正致力于通过为服务提供弹性云选项,使组织更容易使用这些技术。
例如,在日前召开Strata Data London会议上,Cloudera公司宣布计划将其Altus数据科学平台作为服务产品扩展到Azure云平台。该服务在过去一年中在AWS上提供。
Cloudera表示,Altus Data Engineering for Azure通过降低复杂性简化并加速了ETL、数据处理和批处理机器学习。 Azure客户还可以使用目前处于测试阶段的Cloudera Altus SDX中的共享数据目录功能。Cloudera表示,这旨在保留业务元数据以及安全和治理策略,以便可以跨云中的数据处理和分析工作负载一致地应用它们。
Cloudera Altus Analytic DB是一个数据仓库云服务,现在也可以在Azure云平台中使用。
Cloudera还更新了其Data Science Workbench和Cloudera Enterprise平台。据Cloudera称,工作台更新使数据科学家能够运行和跟踪版本化实验,并且更容易将模型部署为REST API。虽然用数据实现更好结果的技术已经到来,但许多组织仍然需要在自己的数据组织和流程方面做些工作。也许这是下一步。
“许多组织尚未将数据视为战略资产,”Stoop说,“他们在部门和孤立的基础上处理大部分问题。他们需要改变他们处理这些数据的方式,这不是一夜之间发生的事情。”
编辑:Harris