机房360首页
当前位置:首页 » 大数据 » 如何制定面向未来的大数据战略?

如何制定面向未来的大数据战略?

来源:Harris编译 作者:Harris编译 更新时间:2024/4/8 6:49:09

摘要:大数据为组织提供了许多优势,例如提高业务效率和预测未来的业务结果。但要想走在创新的前沿,科技领导者必须避开普遍存在的误解,拥抱新兴趋势。

   Cherre公司人工智能产品副总裁MishaSulpovar表示,随着大数据的应用越来越广泛,为组织提供了众多优势,技术领导者必须避开普遍存在的误解,拥抱新兴趋势,以保持在创新的前沿。
  
  数据对技术领域内外的公司都至关重要。组织数据,特别是当它遇到第二和第三方数据的世界,承诺提供一个宝贵的见解,以实现业务的各个方面。到目前为止,大多数组织已经开始了他们的数据之旅,并了解到它并不总是最直接的轨迹。虽然组织已经变得更加适应繁琐但关键的数据成熟度追求,但2024年将颠覆这种新发现的舒适感。
  
  发现或使用过生成式人工智能模型(如ChatGPT)的人已经有效地见证了成熟的数据和人工智能用例是如何从过度炒作转变为必不可少的。然而,这些落后者在大数据之旅中遇到的同样的障碍仍然存在,首先要了解如何管理大量数据,并利用它们更好地做出决策。
  
  大数据为组织提供了许多优势,例如提高业务效率和预测未来的业务结果。但要想走在创新的前沿,科技领导者必须避开普遍存在的误解,拥抱新兴趋势。
  
  戳穿大数据神话
  
  关于大数据的许多常见误解依然存在。那么,需要揭穿的最大神话是什么?利用大数据可以保证更好的决策。虽然大数据项目旨在从给定的数据点中发现关系和模式,但最终,成功的大数据项目取决于利益相关者如何解释这些关系和模式。
  
  我们也很容易忽略输入决策系统或算法的偏差或错误数据。在最好的情况下,这些偏见可能会使决策系统表现不佳,在最坏的情况下,偏见可能会完全而危险地误导。与突破性发展并行的是,在过去的20年里,我们也看到无数的项目成为糟糕规划和误解数据、问题或领域的牺牲品。
  
  新的数据计划伴随着这些项目将取代数据仓库工作的假设而出现。大数据平台不应单独使用,而应作为传统数据管理系统的补充。结构化数据和可预测的工作负载将始终彼此协同工作。如果没有数据、人员和系统来验证黑盒算法,这些算法在使用或滥用时将继续造成严重破坏。这些问题将引发一系列围绕更负责任的人工智能以及不可避免的监管的对话。
  
  大数据四大趋势
  
  随着大数据变得无处不在,它将继续以四种主要方式发展:元数据驱动的数据结构和图表的使用增加,AutoML机器学习的民主化,生成式人工智能的大规模采用和颠覆,以及研发预算的减少使用。
  
  1.元数据驱动的数据结构
  
  元数据驱动的数据结构用于连接不同的数据工具集合,这些工具具有极大的灵活性、用于建模的基础设施和更厚的数据集,可以驱动真正的洞察。提高数据管理的敏捷性应该是所有组织的优先事项,尤其是那些使用大数据为决策提供信息的组织。当与元数据或“上下文中的数据”交互时,数据结构允许集成不同的湖,并从正式结构化的数据体系结构中提取知识图。数据结构侦听、学习元数据并对其进行操作,从而创建一个更加自主和用户友好的数据覆盖系统。
  
  根据gartneropen的新窗口,数据结构中的主动元数据辅助自动化功能将减少三分之一的人力,同时将数据利用率提高四倍。部署这种数据结构方法的主要目标是通过增加对上下文化信息的访问和理解,为大数据提供更多价值。
  
  2.民主化机器学习
  
  对于那些使用大数据的人来说,一个广泛开发的机会是利用AutoML使机器学习大众化。AutoML是一类机器学习算法,它有助于自动化机器学习模型的设计和训练。由于其简化的方法和流程,AutoML扩大了大数据和机器学习的使用,使其更适合非专家。使用AutoML的目标是构建能够创建自己的机器学习模型的算法,而不是需要有人手动输入未来的机器学习模型。
  
  在我们的组织中,我们观察到越来越多的公司使用AutoML来授权具有最少数据科学专业知识的员工来构建健壮的模型。与生成式人工智能一样,自动人工智能在应用于正确的问题时是一个令人难以置信的工具,但如果在公民数据科学的背景下使用,它可能是危险的——这是开箱即用的,没有什么过程或思想。自动AI可以让用户快速构建,但它也可以使算法和分析不像它们看起来的那么好,或者更糟,产生有偏见的结果。这些“陷阱”非常普遍;毫无疑问,这些工具功能强大且快速,但它们需要知识、细微差别和大量数据。
  
  3.生成的人工智能
  
  GPT3和ChatGPT已经展示了大型语言模型(LLMs)的强大功能和质量。虽然llm已经存在了一段时间,但ChatGPT提醒了大众人工智能的潜力和成熟状态,以及它以复杂和通用的方式处理和创造的能力。其结果将是用例的激增,这将扩展我们应用AI的方式。
  
  4.不要使用研发预算
  
  数据多样性的增加和分析方法的进步使得商业结果在大数据计划中变得至关重要。随着大数据和内部流程的优化越来越成为组织的核心,大数据项目通过研发预算获得资金的情况也越来越少见。首席数据官以及公司内部专门的数据实践和团队的出现进一步加剧了这一趋势。
  
  大数据:不是一个设置并忘记它的过程
  
  在考虑数据策略时,要非常用心并勤奋地工作,以确保正在构建的决策系统将导致良好的结果。使用生成式人工智能或公民人工智能工具实现目标变得越来越容易。然而,组织必须有意识地处理如何收集、存储、组织和清理数据。否则,很容易得出错误的结果。
  
  定义大数据成功的一些核心因素包括创建备份决策系统来证实结果,并为该计划分配足够的资金和战略思考。此外,始终确保将尽可能多的领域注入到决策系统的构建和部署中。
  
  编辑:Harris
  

机房360微信公众号订阅
扫一扫,订阅更多数据中心资讯

本文地址:http://www.jifang360.com/news/202448/n9870156615.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
转载声明:凡注明来源的文章其内容和图片均为网上转载,非商业用途,如有侵权请告知,会删除。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
推荐图片