机房360首页
当前位置:首页 » 战略与策略 » x86、RISC-V、ARM,谁才是数据中心架构的未来?

x86、RISC-V、ARM,谁才是数据中心架构的未来?

来源:腾讯网 作者: 更新时间:2022/3/3 9:20:15

摘要:定制化和异构化逐渐成为数据中心架构的主流发展趋势,从单一供应商制造的处理器转变为由多个供应商(包括系统公司自己的设计团队)共同制造的处理器和加速器。

  定制化和异构化逐渐成为数据中心架构的主流发展趋势,从单一供应商制造的处理器转变为由多个供应商(包括系统公司自己的设计团队)共同制造的处理器和加速器。

  由于服务器供电和冷却机架的成本不断上升,需要更紧密的集成来处理AI/ML应用,以及需要处理的数据量大幅增加。在过去五年里,超大规模数据中心逐渐向异构架构迁移。再加上各层次边缘数据中心的建设,整个数据中心行业都在发生着巨大变化。

  正是由于这些变化,英特尔过去拒绝向第三方IP开放其架构,转而为其芯片构建“民主化环境”。除了该公司愿意在其解决方案中包含Arm内核,并且已经达成多年的协议外,英特尔现在还加入了RISC-V国际委员会,成为其主要成员。

  目前还不完全清楚这将如何发展。一方面,它为基于RISC-V架构的更多定制处理元素和加速器打开了大门,这将首次将RISC-V设计引入数据中心,尽管容量还有待观察。但从更长远的角度看,它为主要芯片供应商的更多定制奠定了基础,这些供应商过去依靠摩尔定律的每一次新修订作为他们的竞争武器。

  这种解决方案不再有效,正如苹果的M1芯片所证明的那样。苹果公司将笔记本电脑和台式机中的英特尔芯片换成了基于Arm内核的内部设计的处理器,紧密集成了其原生软件,以提高性能并将电池寿命延长多达五倍。据报道,苹果计划在未来几年内将其台式机和服务器更换为基于Arm的芯片。

  Arm也进入了企业。“云计算在媒体消费、电子商务、远程学习、标准通信、IT服务、数字化转型等现有应用领域发挥着关键作用,未来还将成为推动机器学习、元宇宙、自动驾驶和智能物联网等新型应用不断发展的核心驱动力,”Arm基础设施业务线部门营销总监Dhaval Parikh表示。

  Parikh指出,为了满足现有应用以及云计算支持下新的应用日益增长的需求,超大规模数据中心和云服务提供商正在寻求使用专门构建的异构基础设施重新构建其下一代数据中心。

  因此,在数据中心领域,异构架构的市场竞争愈加激烈。虽然不太可能很快取代主要处理元素,但RISC-V增加了另一个定制化选项。预计未来几年内,该架构将进一步渗透至数据中心领域。英特尔的举动只会加速这一转变。英特尔代工服务本月早些时候表示,英特尔正在与RISC-V生态系统中的领先合作伙伴联手,包括Andes Technology、Esperanto Technologies、SiFive和Ventana Micro Systems,从而确保RISC-V在英特尔代工芯片上实现最佳运行效果,加快芯片上市时间。

  “目前,每个人似乎都专注于RISC-V带来的两个主要优势。RISC-V是一个开源ISA,并且不需要许可费,”西门子EDA研究员Gajinder Panesar表示。“首先,开放的ISA只适用于CPU。但这与CPU无关,而是关于系统。你仍然需要将其集成在SoC中,SoC需要放在数据机架或其他装置里。因此,即使开发了CPU内核,也不意味着完全结束。这对于企业来说,尤其是初创公司来说,不需要支付许可费是非常友好的,因为许可费可能会是相当大的一笔开销。对于这个市场的大玩家来说,许可费与实际制造芯片的成本相比相形见绌。然后是开发芯片的成本,从设计、实现、验证、确认,以及制造。尤其对于尖端技术芯片,使用RISC-V架构会产生一系列好处。事实上,当支付大约8000万到1亿美元来制造芯片时,在许可证上节省的200万美元或300万美元已经无关紧要了。开发基于开源ISA的芯片是另一回事,可以补偿并从EDA工具提供商那里获取特别优惠,但仍然必须使整个工作正常进行。此外,还需要将芯片放入软件堆栈,提交操作系统、安全层。同时需要对安全性进行审核。所有这些成本加起来。”

  各部分协同运行

  在下游市场,处理器逐渐转向异构集成,同时引发了各企业大规模的市场争夺。适应和支持异构集成的生态系统仍在建设中,在可预见的未来里仍将处于建设中。从数十亿单元的处理器到定制设计的转变,可以在更小的制造运行中整合各种小芯片,这对设计团队来说仍然是一个巨大的挑战。

  “如果处理器的选择是其面临的唯一挑战,那么设计团队将会持续突破,”Cadence解决方案和生态系统高级集团总监Frank Schirrmeister表示。“但是,从RISC-V的角度来看,当设计人员试图构建定制芯片时,需要应对很多挑战。从选择正确的IP、通过硬件或软件验证,到在IP目录中选择正确的软件,再到所有潜在的3D-IC集成挑战。然后,对IP进行完整全面的验证,并将其放在电路板上,确保有足够的气流,使其不会烧毁数据中心的其余部分。当设计人员做出这些决定时,面临的挑战不会少。架构的选择实际上只是其中之一。这就是为什么要通过这个过程来考虑如何让设计工作更轻松,并确保错误不会出现在你的职责范围内。坦率地说,这种情况对系统设计者来说是一个挑战。”

  对于EDA供应商来说,特别有趣的是能够以RISC-V作为切入点,更深入地进入系统和大型处理器公司。“这是一个巨大的机会,因为RISC-V是开源的,但开发成本仍然很高,”在Vtool数字设计工程师Natalija Colic看来。“这是一个高度可定制的处理器,验证需要遵循这一趋势。RISC-V在服务器集群中迎来了大放异彩的发展良机,但仍需努力使RISC-V ISA成为有效的竞争对手。”

  她表示,围绕RISC-V的讨论在其他方面都是积极的。“例如,这种趋势可能会迫使长期占据垄断地位的Arm可能将RISC-V纳入其一些传统产品中。由于英特尔、谷歌和Arm正在投资RISC-V,这肯定会影响市场,不仅对于以RISC-V形式拥有这些加速器的集群,而且对于较小的嵌入式芯片,就像我们在Vtool中所做的那样。”

  数据中心市场变化缓慢

  当然,这些都不会在一夜之间发生。从历史上看,数据中心在变革方面一直是保守的,EDA工具需要时间来开发。但数据中心市场的竞争非常激烈,异构架构的推出标志着一个转折点。

  “我们看到AI处理器开始使用RISC-V,具有不同程度的定制、增强和扩展,”Codasip首席营销官Rupert Baines指出,RISC-V迄今为止的成功仅限于AI、加速器和来自Esperanto、Mythic等功能的特定组件。“您看到的是深度嵌入的应用。多年来,Nvidia一直在使用RISC-V作为minion核心和控制器核心,不是用于实际的GPU功能或AI功能,而是用于其他所有内容。因此,我们看到RISC-V在很多方面稳步用于数据中心,但尚未用于重载英特尔至强应用级处理器。这仍然是英特尔主导、AMD深入布局、Arm处于早期进展的状态。Nvidia、Ampere、Marvell也正在进入这个领域,而RISC-V尚未完全进入。但RISC-V最终将会更深入该领域。”

  事实上,Baines预测,基于RISC-V ISA的主流数据中心应用处理器内核可能会在短短三四年内变得更加普遍。

在这一点上,真正的价值可能更多的是各种组件的集成,而不是一个拥有一切的供应商。在纸上分解很简单,但将各部分重新聚合到安全、高效和可靠的设备中要困难得多,而像英特尔和AMD这样的大型芯片制造商一直在争先恐后地使用小芯片/瓦片类型的方法将所有部分放在一起。台积电(TSMC)等代工厂也一直在研究这种方法,使用混合键合来加速小芯片之间的数据流。

  这表明了整个处理器领域不断的公告和重新定位。业内人士报道,Arm最近已开始与初创公司合作,提供更灵活的许可条款,为客户设计节省时间和精力。

  “如果Arm真的适合你的项目,你应该选择Arm,因为它已经过测试,具有项目需要的所有功能,”Vtool项目经理Olivera Stojanovic认为。“但如果你需要更特别的设计,那么RISC-V可能是更好的选择。但请记住,必须要全面验证检查CPU功能。需要执行验证过程来确保基于ISA的开源CPU已完全验证。”

  潜在市场趋势

  虽然RISC-V肯定引起了很多兴趣,但它的成功与其说是因为能够推动数据中心的大规模变革,不如说是由于市场发生了广泛变化。

  “消费者需求正在推动着数据中心架构的改变,对工作负载进行优化,”Cadence的Schirrmeister表示。“数据中心提供商需要针对特定工作负载集提供相应解决方案,如何更好地从底层处理器实现这一点?这就是它本身不是RISC-V的原因。现在,需要做出一系列决定,即与其他设备的接口。支持哪些总线?可以很好地扩展吗?是否满足要求?”

  在这方面,RISC-V可能只是众多选择之一。“如果我是一名系统架构师,我采用基于小芯片的RISC-V内核并对其进行集成,现在我必须弄清楚是否有软件支持,”他表示。“此外,我还需要对风险偏好进行把控。如果出现问题,我可以把风险转嫁给别人,还是把一切都揽在自己身上?这是一个需要克服的障碍。如果你已经弄清楚了这一点,如果有软件支持,如果你对它可能引入RISC-V驱动器所带来的风险感到满意,那么在你必须做出的50个决定背景下,RISC-V的选择发挥了重要作用。”

  不确定的未来发展

  那么像RISC-V这样的ISA是否会随着时间的推移影响数据中心架构?Codasip的Baines认为这是未来的发展趋势。

  “其中一个原因是关于控制者与决策者,”贝恩斯说。“如果你是谷歌或Facebook,那么硬件供应商就是你,在过去的5年或10年里,每个谷歌数据中心都充满了按照谷歌规范设计的谷歌服务器。越来越多的企业(谷歌、Facebook、微软)不仅定制了自己的硬件,还定制了自己的芯片。通过定制化,这些公司拥有从上到下的堆栈控制权。因此,如果这些企业愿意,他们将指定编程语言。也许会使用Swift或Objective C或GO。这些编程语言可能与其他公司使用的不同,但这无关紧要。他们也有自己的工具链,如果切换到不同的ISA,那也在其控制范围内。如果这些公司看到了优势和利益,他们就会这样入局。这又回到了功能计算和特定领域计算的概念。如果你是垂直整合的,并且控制着软件和芯片,那么投资功能计算、异构计算、特定领域的架构是非常有意义的,这意味着你需要控制架构。你不能完全依赖一个独立的第三方供应商。”

  与此同时,其中一些公司正在不断重新评估计算架构。“当我们看到如今的系统架构时,它应该与系统有关,而不是与CPU有关,”西门子的Panesar表示。“人们谈论高端CPU以及如何满足系统要求。但实际上,需要将其放在应用背景中。我很失望,因为几乎没有创新。如果刮掉RISC-V并在上面贴上ARM标签,你真的无法分辨两者。除了它是32位或64位处理器之外,没有其他区别。这里失去了一个机会,因为可以做更多的事情来改变架构,以比现在更深入的方式改变架构。特定领域的体系结构、内存计算概念不会成为主流。可能有一些利基市场在关注这一点,但未来的创新将来自于打破现有的做事方式。例如,拥有一个基于缓存的系统与很久以前我开始从事这个行业时的架构相同,除了他们有了新的流行语或首字母缩略词。但它或多或少是一样的。我不太相信缓存和一致性这样的东西,因为这是人们一直坚持的范式,他们正在为新的应用寻找权宜之计。”

  一段时间以来,人们提出了在数据中心应用更多特定领域架构的论据。

  “现阶段的数据中心往往非常通用,”Panesar表示。”这会给那些不想要所有东西的人带来负担,也无法为应用提供一致、适当优化的解决方案。实际上,你并没有有效地为其他潜在客户提供服务。我们需要退后一步,问问目标是什么。我们的目标是提供创新和产品,这些产品正在解决我们在21世纪面临的问题和挑战,而不仅仅是采取现有的解决方案,并对其进行改进。有机会采用可以修改的ISA,并将其放入特定或特定领域的系统中。这就是创新的来源。这不会来自设计的CPU有多好。这是关于系统的。为了实现这一目标,需要有机会让所有CPU看起来都不一样。”

  责任编辑:张华

机房360微信公众号订阅
扫一扫,订阅更多数据中心资讯

本文地址:http://www.jifang360.com/news/202233/n2217144054.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
转载声明:凡注明来源的文章其内容和图片均为网上转载,非商业用途,如有侵权请告知,会删除。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
推荐图片