机房360首页
当前位置:首页 » 技术解构 » Prodigy:全球唯一可以在数据中心、AI和HPC工作负载之间切换的处理器

Prodigy:全球唯一可以在数据中心、AI和HPC工作负载之间切换的处理器

来源:百度百家 作者: 更新时间:2020/8/10 15:14:24

摘要: 初创公司Tachyum™Inc.近日宣布, 其Prodigy通用处理器已成功完成了跨x86、ARM和RISC-V三款平台二进制环境的软件仿真测试。这一重要的里程碑表明,Prodigy将使客户能够在推出时透明地运行其传统应用,其性能优于任何当代或未来的ARM或RISC-V处理器。

  初创公司Tachyum™Inc.近日宣布, 其Prodigy通用处理器已成功完成了跨x86、ARM和RISC-V三款平台二进制环境的软件仿真测试。这一重要的里程碑表明,Prodigy将使客户能够在推出时透明地运行其传统应用,其性能优于任何当代或未来的ARM或RISC-V处理器。再加上Hadoop、Apache等超大规模的数据中心主力程序,Tachyum正在将其重新编译为Prodigy本地代码,这一功能将确保Prodigy客户能够实现开箱即运行广泛的应用程序。Tachyum客户一致表示,他们将在过渡到Tachyum平台后的9-18个月内运行100%的原生应用,以超越最快的Xeon处理器的性能。仿真是为了让Tachyum Prodigy顺利过渡到原生软件。

  Tachyum正在开发原生Linux发行版,并及时推出更多应用程序,以便于2021年Prodigy推出。为方便起见,Tachyum还提供了使用动态二进制翻译器将x86、ARM或RISC-V代码转换为Prodigy原生ISA(指令集架构)的能力,透明地安装和运行传统应用程序。尽管在Prodigy芯片上进行了软件仿真,但ARM和RISC-V二进制文件在Tachyum Prodigy上的运行速度要比现在的ARM或RISC-V快得多。这证明了Prodigy处理器的性能。其中一个演示在Prodigy上运行了一个web服务器应用,使用了本地和x86混合代码。结果证明,Prodigy能够在相同的通用芯片上高效运行异构系统应用,这将为广大用户带来巨大的成本优势。我们将在不久的将来发布一系列演示视频,第一个视频展示了在Prodigy仿真上运行原生、x86、ARM和RISC-V二进制文件的演示;第二个视频演示在Prodigy仿真器上安装并运行仿真的x86,ARM和RISC-V二进制文件。

Prodigy:全球唯一可以在数据中心、AI和HPC工作负载之间切换的处理器

  演示之一使用混合了本机代码和x86代码在Prodigy上运行了Web服务器应用程序。结果证明,Prodigy能够在同一通用硅片上高效运行异构系统应用程序,这将为广大用户带来巨大的成本优势。

  Tachyum的Prodigy凭借其简单的编程模型,可以在单个同质处理器平台上运行HPC应用、卷积AI、可解释性AI、通用AI、生物AI和尖峰神经网络,以及普通的数据中心工作负载。使用CPU、GPU、TPU等加速器代替Prodigy来处理这些不同类型的工作负载,效率很低。异构处理结构,为每种类型的工作负载(如数据中心、AI、HPC)提供独特的专用硬件,导致硬件资源利用不足,编程环境更具挑战性。Prodigy能够在这些不同工作负载之间无缝切换,极大地改变了数据中心的竞争格局和经济性。

  与目前超大规模数据中心提供的现有芯片相比,Prodigy显著提高了计算性能、能耗、硬件(服务器)利用率和空间需求。它还将允许物联网边缘开发者利用其低功耗/高性能,以及简单的编程模型,将人工智能提供给边缘。

  Prodigy是一款真正的通用处理器。除了原生的Prodigy代码,它还可以运行传统的x86、ARM和RISC-V二进制文件。而且,凭借单一、高效的处理器架构,Prodigy在数据中心、AI和HPC工作负载中提供了业界领先的性能。“拥有一个现成的解决方案,并且易于使用海量软件,展示了一个平台成功的基础。”

  Tachyum创始人兼CEO Radoslav Danilak博士说。“Prodigy能够正确运行软件--甚至是x86、ARM或RISC-V处理器的传统代码--的这一演示表明,我们将使客户从Prodigy推出的第一天起就能够无缝地使用他们今天正在使用的应用程序。这是对Prodigy可行性的又一次验证,也证明了它有能力在最具挑战性的计算环境中释放出前所未有的性能、能效和成本优势。”

  Prodigy是该公司的旗舰通用处理器,将于2021年进入量产。4月,Prodigy芯片成功证明了其可行性,完整的芯片布局超过了速度目标。8月,该处理器能够正确执行短程序,结果与软件模型自动验证,同时超过目标时钟速度。下一步是在今年晚些时候获得该芯片的制造的全功能FPGA原型,这是tape-out前的最后一个里程碑。

  在数据中心工作负载上,Prodigy比最快的Xeon处理器功耗低10倍,在高性能计算、人工智能训练和推理方面也优于NVIDIA最快的GPU。125个HPC Prodigy机架可以提供32张量EXAFLOPS。Prodigy的每MIPS成本降低了3倍,功耗降低了10倍,这意味着数据中心的总拥有成本(TCO)降低了4倍,为谷歌、Facebook、亚马逊(Amazon)、阿里巴巴(Alibaba)等超级巨头节省了数十亿美元。由于Prodigy是全球唯一可以在数据中心、AI和HPC工作负载之间切换的处理器,服务器成本已经摊平,因此闲置的服务器可以作为无CAPEX的AI或HPC云使用。

  责任编辑:张华

机房360微信公众号订阅
扫一扫,订阅更多数据中心资讯

本文地址:http://www.jifang360.com/news/2020810/n7600131895.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
推荐图片