机房360首页
当前位置:首页 » 数据中心资讯 » 数据中心面临千倍算力增长 英特尔XPU战略如何破局?

数据中心面临千倍算力增长 英特尔XPU战略如何破局?

来源:中关村在线 作者: 更新时间:2021/11/3 9:14:16

摘要:科技发展的速度之快,也使得数据中心要面临更加现实的问题:成倍增长的数据需要计算与存储,自然也就对数据中心的算力提出更加苛刻的要求,不但要满足当下的计算需求,还要有足够应对未来千倍算力增长的能力。

  这是一个充满想象力的时代,也是一个可以用科技实现梦想的时代。不可否认的是,现代社会正迎来一场全面的技术进步,无论是计算机视觉的飞速发展,还是虚拟现实概念的深入人心,亦或是人工智能的惠普,都让我们看到了科技的无限可能与潜力。

  以数字化技术为支撑的整个数字世界正逐渐成为社会经济价值的数字基建,而数据中心就是这些数字基建的重要基石,根据Gartner公布的数据显示,2020年中国IT支出达到2.84万亿,其中数据中心系统支出2508亿元,占IT支出比重达8.85%。数据中心在当今数字时代所扮演的角色,已经不言而喻。

  但科技发展的速度之快,也使得数据中心要面临更加现实的问题:成倍增长的数据需要计算与存储,自然也就对数据中心的算力提出更加苛刻的要求,不但要满足当下的计算需求,还要有足够应对未来千倍算力增长的能力。

  作为一家半导体领域的“元老”级公司,英特尔的产品涵盖通讯、存储、通用计算等各个方面,自然也注意到了这个问题,于是从2018年起,英特尔便提出了以制程、架构、存储、互联、安全、软件为基础的六大战略支柱,并在之后明确了无所不在的计算、从云到边缘的基础设施、无处不在的连接和人工智能这四大超级技术,以及以XPU战略为核心的发展方向。这一切,似乎都是在为未来算力增长所做的铺垫。

  今年的英特尔On技术创新峰会(IntelInnovation)上,英特尔也让所有人都看到了自己对XPU战略的投入:

  Sapphire Rapids:为下一代数据中心树立标准

  去年4月份,英特尔正式发布第三代至强可扩展处理器,整体性能相比上一代提升了46%。半年之后,阿里巴巴、AWS、百度、谷歌、微软、Oracle和腾讯这样的云应用开发者都已经在主要的云服务提供商中使用了最新的第三代英特尔至强可扩展处理器。据英特尔公司市场营销集团副总裁兼中国区数据中心销售总经理陈葆立介绍,“到今年年底,在大客户中,已有40%-50%客户切换到第三代至强,我们相信这是一个过程,到明年第三代至强就是市场主流产品了。”

  但第三代至强可扩展处理器明显也只是英特尔在服务器CPU产业上的又一个深刻有力的脚印,而这个脚印的下一步便是基于Intel 7制程工艺技术的全新数据中心架构Sapphire Rapids,它最早由英特尔在今年的架构日活动上对外提出,采用了英特尔性能核与全新加速器引擎,被称作树立了下一代数据中心处理器的标准。其核心是一个分区块、模块化的SoC架构,采用英特尔的嵌入式多芯片互连桥接(EMIB)封装技术,支持加速器接口架构指令集、高级矩阵扩展,以及数据流加速器,能够提供更高的整体工作负载性能,在CPU、内存和缓存以及所有附加的内存、存储和网络设备之间移动数据。

  嵌入式多芯片互连桥接(EMIB)封装技术带来的好处是显而易见的,随着制程工艺越来越小,芯片越来越复杂,制作难度也越来越高,良率也有可能越来越低,而EMIB就可以将4个芯片连成1个芯片,这样既可以保持高速互联,也可以实现更高的内核和更好的内存,并分享同样的内存和带宽。从软件上来看没有任何差异,但从制造工艺上讲,集成了Intel 7制程工艺的Sapphire Rapids则代表着更高性能和更低产品的产品。

  当然,Sapphire Rapids的潜力不止如此,业界已经在第三代至强可扩展处理器上看到了AI的无限潜力,Sapphire Rapids则更进一步,通过集成英特尔高级矩阵扩展AMX加速IP模块,可以为深度学习算法核心的Tensor处理提供大幅加速。具体来看,AMX矩阵扩展与之前的AVX-512指令集的一大区别就是可以通过类似GPU的处理方式快速推理和学习,使得人工智能深度学习推理可以再提升4-5倍。

  以ResNet模型为例,使用Sapphire Rapids可以达到每秒1.3万张(单核)或者是2.6万张(双核)的处理速度,要比当下流行的GPU的约1.5万张的处理速度是快很多的,对于服务器而言,从性价比角度考虑,Sapphire Rapids可以带来加量不加价的效果,为整个服务器带来更强的AI能力,当然,对于高端的训练与推理,仍旧是需要GPU发挥作用的,Sapphire Rapids起到的是锦上添花的效果,可以在如小区卡口这样的需要低成本部署AI的场景下发挥最大的作用。

  Sapphire Rapids的另一个重要特性是集成了英特尔DSA数据流加速器,DSA可以卸载最常见的数据移动任务,改进对这些开销任务的处理,以提供更高的整体工作负载性能,并可以在CPU、内存和缓存以及所有附加的内存、存储和网络设备之间移动数据。从而为云服务厂商和企业带来更高的性价比。

  不难看出,Sapphire Rapids正是基础设施建设革命中,提供源源不断算力,实现卓越的性能和利用率,提供从边缘到云的计算能力的重要组成部分。

  IPU:为提升数据中心运算效率而生

  对数据中心而言,为服务器CPU实现降本增效的重要手段是给CPU减负,毕竟现在除了主内存和辅助内存之外的所有计算都是在CPU上完成的,面对超大规模数据处理的需求,CPU的算力已经达到瓶颈,但随着摩尔定律的进步正在放缓,而且CPU内核价格昂贵,尽可能地从CPU内核中卸载虚拟化、容器化、安全化工作负载的繁琐开销,一方面是对CPU性能价值的充分释放,另一方面也是对数据处理与存储等工作负载的更好平衡。

  而英特尔在今年6月份推出的全新的基础设施处理器IPU就是为此而生的,它可以对数据中心内的基础设施功能进行安全加速,从而使系统级资源的管理更加智能,通过IPU,云运营商可以转向完全虚拟化的存储和网络架构,在减少CPU方面开销的同时保持超高的性能、以及强大的可预测性与可控性。

  “如今大部分云服务厂商都采用CPU来实现管理功能,CPU是通用计算,本来也可以用来实现这个功能,但它会消耗掉CPU 20%-30%的算力,而这只是纯粹在做管理功能,还没有算上用户的运算。所以英特尔把它独立出来,做一个叫IPU的独立芯片来实现所谓的管理功能。把这部分独立出来后,可以释放CPU 100%的算力来实现真正最终用户想要运行的功能,不管是数据库还是大数据,或者人工智能运算。”陈葆立补充道。

  目前,基于ASIC的IPU(代号为“MountEvans”)已在谷歌云中得到应用,英特尔宣布与谷歌云展开深度合作,设计和开发这一首个由行业标准编程语言和开源基础设施程序员开发工具包所支持的开放式解决方案,以简化开发者在谷歌云数据中心对该技术的访问。

  Ponte Vecchio:面向高性能计算和人工智能工作负载的大杀器

  在去年的架构日上,英特尔宣布了Xe架构的显卡会包括LP、HP、HPG和HPC四个领域,而Ponte Vecchio就是英特尔迄今为止最复杂的Xe-HPC GPU,它包含了多达1000亿个晶体管,提供领先的浮点运算和计算密度,以加速AI、HPC和高级分析工作负载。其ResNet推理性能超过每秒43000张图像和超过每秒3400张图像的ResNet训练。

  Ponte Vecchio的复杂设计均被集成于Foveros封装中,为提高功率和互连密度形成有源芯片的3D堆叠。高速MDFI互连允许1到2个堆栈的扩展,其中计算单元是一个密集的多个Xe内核,是Ponte Vecchio的核心,一块单元有8个Xe内核,总共有4MB的一级缓存,是提供高效计算的关键,而基础单元是Ponte Vecchio的连接组织,Xe链路单元则提供了GPU之间的连接。

  陈葆立表示,目前美国的一些大型实验室和欧洲的客户已经决定使用这款产品,英特尔也在与国内的客户进行积极的沟通。

  除了XPU的硬件战略之外,软件作为硬件发展的土壤也同样重要,现在oneAPI迎来了全新的版本oneAPI 2022,拥有900项新功能。此次发布的新版本首次通过统一的C++/SYCL/Fortran编译器和Data Parallel Python为CPU和GPU增加了跨架构的软件开发能力,并提升了Advisor加速器性能建模能力,包括使用VTune Flame Graph将性能热点可视化,并通过扩展Microsoft Visual Studio Code集成和Microsoft WSL2支持,以提高生产力。

  当然,面对数字化时代的数据爆发,仅仅靠英特尔的力量可能还是略显单薄,生态一直都是英特尔重要的一环。软件方面,oneAPI作为一个开放、规范、跨架构和跨厂商的统一软件栈,提供了跨架构的兼容性,让开发者能够摆脱专有语言和编程模型的束缚。而通过精选解决方案的模式,可以更深入地与合作伙伴进行联系,将第三代至强、第二代傲腾可持久内存、网卡进行部署和调优,而针对未来的创新产品,也需要跟行业头部用户一起把软件和硬件调优,做成一个可以让众多企业都用得比较好的软件包,然后再扩散到一些其他行业用户身上。

  “中国在创新方面会在有一些技术方面是领先的,但技术本身是没有国界的,好的创意到处都有,每个人侧重不同,我们希望我们是一个好的硬件或者是开发平台,能够把所有好的创新都加速,然后把这个创意分享到所有地方,这是我们一直以来在做的事情。英特尔将一如既往地深耕生态,包括跟软件商、ISV、方案商一起合作,为广大企业提供稳定可靠的创新产品,当然,这个过程肯定是渐进式的。”陈葆立总结道。

  从XPU的硬件战略到开放的oneAPI软件栈,从IDM 2.0战略再到“水利万物而不争”的生态路线,英特尔近几年来的布局,无一不在彰显着自己在软件、芯片和平台方面的深度与广度,在封装和制程工艺方面的技术,以及在大规模制造上的实力,这一切都在说明,英特尔已经为千倍算力增长的数字化时代做好了准备。

  技术是人类智慧的产物,而创新则会在开放境中茁壮成长,在这样的环境下,开发者们能自由地联系、沟通和协作。英特尔基于在开放平台和大量基础软件技术方面的深厚积淀的努力,为业界提供的创新技术与架构,无疑会成为驱动数字化时代的重要源动力之一。

  责任编辑:张华

机房360微信公众号订阅
扫一扫,订阅更多数据中心资讯

本文地址:http://www.jifang360.com/news/2021113/n4961141163.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
推荐图片