摘要:现代人工智能解决方案增强了人类的理解、偏好、意图,甚至口语。人工智能通过提供更快、更有见地的见解来改善我们的知识和理解,从而推动超越以往想象的变革。这种快速增长和转型的挑战在于,人工智能对计算能力的需求在计算进步方面超过了摩尔定律。 |
人工智能需要能够满足不断增长的计算能力需求和人工智能应用和工作负载的专门需求的基础设施,比如自然语言处理、机器人驱动的过程自动化、机器学习和深度学习。
高性能计算为人工智能提供了可扩展的解决方案。
为了满足当今更高的需求水平,人工智能基础设施必须扩大规模,利用带有多个加速器的单个服务器,并向外扩展,将分布在高性能网络中的许多这样的服务器结合起来。
扩展人工智能计算基础设施将单个图形处理单元(gpu)的内存组合成一个大型共享池,以处理更大、更复杂的模型。当与GPU令人难以置信的矢量处理能力相结合时,高速内存池已被证明在处理大型多维数据数组时非常有效。
通过增加高带宽、低延迟互连结构的功能,向外扩展的人工智能优先基础设施可以显著加快输出时间。这是通过先进的并行通信方法实现的,在大量计算节点之间交错计算和通信。
专门为人工智能构建的云基础设施
微软Azure是目前唯一一家提供专门构建的人工智能超级计算机的全球公共云服务提供商,该计算机具有大规模可扩展的、可扩展的IT基础设施,由NVIDIA量子InfiniBand互连的NVIDIAamereA100TensorCoregpu组成。Azure机器学习为端到端机器学习生命周期提供企业级服务,加速AI与工作负载的集成,以驱动更智能的模拟和加速智能决策。
由NVIDIAGPU和NVIDIA量子InfiniBand网络支持的放大和扩展基础设施是这个星球上最强大的超级计算机之一。微软Azure在全球超级计算机Top500中排名前15,目前前50中的5个系统使用Azure基础设施和NVIDIA A100 TensorCoregpu。在Green500榜单中排名前20的超级计算机中,有12台使用NVIDIAA100张量核心gpu。
这种超级计算机级别的人工智能基础设施可供世界各地任何规模的组织中的研究人员和开发人员使用,并被跨行业的客户用于满足AI日益增长的计算需求。所有类型的人工智能技术、研究和应用都通过Azure的人工智能优先基础设施得到实现、增强和/或加速。
零售与人工智能
一个主要的行业例子是零售,在零售领域,由微软Azure提供的以NVIDIAgpu为特色的ai优先云基础设施和工具链正在产生重大影响。看看Everseen是如何创造一个无缝的购物体验,让他们的底线受益的。通过GPU加速计算平台,客户可以快速浏览模型,并确定性能最佳的模型。自动结账使零售商能够在增加收入和利润的同时,为顾客提供更便捷的购物体验。人工智能优先的零售云基础设施的好处包括:
大规模改进经典数据分析和机器学习过程的性能。
加速训练机器学习算法。通过使用带有NVIDIAGPU的RAPIDS,零售商可以使用更大的数据集,并更快、更准确地处理它们,实现对购物趋势的实时反应,并大规模节省库存成本。
预测准确,减少缺货和库存不良,节约成本。
*更好更快的客户结帐体验,减少排队等候时间。
减少缩水——由于商店行窃或在自助结帐通道换票等偷窃行为造成的库存损失,据美国全国零售联合会统计,这导致零售商每年损失620亿美元。
在零售业,数据驱动的解决方案需要复杂的深度学习模型,这些模型比机器学习单独提供的模型复杂得多。深度学习还需要显著提高计算能力,因此通过人工智能优先的基础设施和人工智能工具链进行优化是必要的。
人工智能无处不在,它的应用正在迅速增长。优化的人工智能优先基础设施对人工智能应用程序的开发和部署至关重要。MicrosoftAzure的放大和向外扩展基础设施结合了NVIDIAGPU和云中的NVIDIA网络的能力,为任何规模的AI应用程序和任何规模的组织提供适当大小的GPU加速。
通过结合最新的GPU架构和为计算密集型人工智能训练和推理工作负载设计的软件的整体解决方案,微软和NVIDIA正在为超越百亿亿级人工智能超级计算铺平道路。
编辑:Harris