机房360首页
当前位置:首页 » 数据中心资讯 » CPU、GPU、DPU一体是数据中心未来必然的架构

CPU、GPU、DPU一体是数据中心未来必然的架构

来源:集微网 作者: 更新时间:2021/12/23 9:29:00

摘要:数据中心已不再是原来的大型机时代,即处理关键的单一任务,也走过了在软件定义数据中心下,运行多业务时如何优化利用资源的问题,目前数据中心正从纵向延伸走向了横向扩张,现有的算力便成了瓶颈,英伟达网络事业部亚太区市场开发高级总监宋庆春表示。

  数据作为重要的资源和生产要素,已经成为世界范围内的共识。而这一切背后的支点——数据中心——计算和存储数据的区域,必将是未来科技企业角逐的圣地。

  数据中心已不再是原来的大型机时代,即处理关键的单一任务,也走过了在软件定义数据中心下,运行多业务时如何优化利用资源的问题,目前数据中心正从纵向延伸走向了横向扩张,现有的算力便成了瓶颈,英伟达网络事业部亚太区市场开发高级总监宋庆春表示。

  GPU很好的解决了算力瓶颈的问题,但仅是针对于单机的,再面向更为广泛的数据中心,特别是对于安全和性能隔离时,该如何解决?

  英伟达选择了DPU。“现在在数据中心中CPU、GPU、DPU 3U一体缺一不可,这是数据中心成为计算单元的基础,也是算力成为服务的基础。”宋庆春指出。

  DPU即Data Processing Unit,是面向数据中心的基础架构的处理器。从某种角度而言,DPU的出现很好地释放了CPU、GPU的资源,在英伟达眼中,它的出现为以数据为中心的新计算架构带来不同的思路。由DPU执行通信框架、存储框架、安全框架和业务隔离,将CPU、GPU算力资源“解压”给应用,让性能得到更优的释放。宋庆春表示,有了DPU以后,把通信和计算重叠起来,这样可以通过DPU来加速HPC业务中的通信,让CPU与GPU执行真正的浮点计算。

  他指出,DPU的出现弥补了在数据中心中对于基础服务加速能力的不足,实现了3U一体的新型数据中心架构,让数据中心成为新的计算单元,这也是一个必然的架构。

  英伟达在GTC 2021上发布了新一代 InfiniBand 网络平台Quantum-2。包括 NVIDIA Quantum-2 交换机、ConnectX-7 网卡、BlueField-3 数据处理器 DPU(数据处理器)和所有支持这种新架构的软件。这也是迄今为止最先进的端到端网络平台。

  宋庆春表示,Quantum-2是一个会计算的网络,真正契合了超级计算和云原生对网络的需求。当超级计算机和云原生超算系统要实现高性能时,所有资源一定需要参与到计算中去。

  数据在网络通信过程中,很多通信模型会制约整个系统性能的发展,用传统的冯·诺依曼架构的计算模型就会造成网络拥塞。无论是提升带宽还是降低延迟都无法解决这一问题,如何继续提升数据中心的性能成了业界面临的新挑战。

  数据在哪里,计算就在那,宋庆春指出。以数据为中心的新架构即可解决网络传输中的丢包问题和其他瓶颈。新架构可以使通讯延时降低10倍以上,因而网络计算成为现在以数据为中心的架构的关键技术之一。

  凭借每秒 400Gbps 的高吞吐量,NVIDIA Quantum-2 InfiniBand 将网速提高了一倍,网络端口数量增加了三倍。它在性能提升 3 倍的同时,还将对数据中心网络所需的交换机数量减少了 6 倍,于此同时,数据中心的能耗和空间各减少了 7%。

  NVIDIA Quantum-2 平台实现了多租户之间的性能隔离,这使得一个租户的行为不会干扰到其它租户,同时通过利用先进的基于遥测且支持云原生的拥塞控制机制,确保了可靠的数据吞吐量,并且不受用户或应用需求高峰的影响。

  NVIDIA Quantum-2 SHARPv3 网络计算技术可为 AI 应用提供超出上一代产品 32 倍的加速引擎数量,借助 NVIDIA UFM Cyber-AI 平台,将为数据中心提供先进的 InfiniBand 网络管理功能,包括预测性维护等。

  NVIDIA Quantum-2 平台中集成了纳秒级精度的计时系统可以同步分布式应用,如在数据库处理中,有助于减少等待及空闲时间。这一新功能,其使得云数据中心成为电信网络的一部分,可以托管软件定义的 5G 无线服务。

  对比传统超算平台,宋庆春介绍道,Quantum-2可以让网络直接参与到计算中,在Quantum-2平台中,通过先进的网络计算技术、动态路由、拥塞控制技术实现了业务的性能隔离,当在运行多个业务时,每个业务都能发挥到最好的性能,把超算上云时的性能发挥到最优,能够保持Bare-metal的性能。甚至可以通过Quantum-2 InfiniBand DPU 实现计算和通信的重叠,通过计算和通信的重叠又提供另外一个新的优化思路,就是把计算放在了CPU、GPU上,把通信框架放在DPU上,这时候对某些业务来看甚至可以达到比Bare-metal更好的性能,就像做快速傅立叶变换,3D FFT这样一个业务来讲,它就可以达到比Bare-metal还要更好的性能。所以,如果要是推云原生的技术平台,Quantum-2是一个最佳的网络平台去支撑云原生。

  对于云原生的概念,宋庆春表示,从英伟达的角度来看,云原生也许未来会改名字,但一定会走到相关技术的方向上去,现在的算力已经成为资源,包括政府号召的节能减排、提升性能、降低功耗,所有这些都希望数据中心能以一个最低的功耗,最少的设备来提供最大的性能,这样在云原生提升性能的这个方向上肯定是毫无疑问,是对的。

  责任编辑:张华

机房360微信公众号订阅
扫一扫,订阅更多数据中心资讯

本文地址:http://www.jifang360.com/news/20211223/n9779142435.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
推荐图片