机房360首页
当前位置:首页 » 数据中心资讯 » AMD:数据中心必须改变

AMD:数据中心必须改变

来源:机房360 作者:litao984lt编译 更新时间:2017-2-21 10:00:51

摘要:未来是属于机器学习、异构计算的,而AMD将迎来其新的机遇......AMD公司的首席执行官如是说。

  未来是属于机器学习、异构计算的,而AMD将迎来其新的机遇......AMD公司的首席执行官如是说。

  当前的数据中心的世界充满了英特尔和Nvidia的芯片,而AMD可能还并未被这一行业所广泛接受。

  该公司曾一直在努力应对的其密集服务器业务也已经于去年关闭了,但这一举措尚未对数据中心市场产生重大影响,但该公司认为他们有机会改变现状。

  随着我们在日常的工作和生活中产生越来越多的数据,以及采用机器学习工具来处理这些数据变得越来越流行,迫使数据中心行业需要积极的采用异构计算,AMD公司坚持认为,他们已然为迎接应对和处理这种转变做好了最充分的准备。

  不断产生的数据

  “今天,我们大部分人甚至都有好几款不同的连接设备。”AMD公司的首席执行官苏姿丰博士在参加由Datacenterdynamics.com网站所主办的新闻活动上表示说。 “所以这是非常令人振奋的。”

  “但更令人振奋的则是:数据中心业界所正在发生的改变。当我们把目光投向这一行业时,我们实际上看到了问题和机遇并存。其问题在于,企业现在有数以百万计的互联的设备,生成了海量企业甚至真正未能使用的数据信息,您企业真的不知道该拿这些数据信息怎么办,因为到今天为止我们大多数企业的系统还不够复杂。”

  “因此,鉴于拥有如此海量亟待处理和利用的所有这些数据信息,数据中心行业必须进行改变。而这一改变当然是从过去几年就已经开始的,但我们所观察到的则是:这一改变在未来几年还将进一步加速。这就是我们所看到的整个行业的进化,在接下来的几年里,您将会持续看到我们所推出的不同产品。”

  企业组织在日常的生产过程中所产生的数据量正在进一步扩大的事实是显而易见的。但是,这些数据信息到底是跨多少平台,以多快的速度产生的还有待探讨。此前,爱立信曾表示,预计到2020年,全球范围内将会有500亿台互联的设备,而现在IHS则认为这一数量将为176亿台,而Gartner公司认为将达到64亿台(但不包括智能手机,平板电脑和计算机),国际数据公司(IDC)预测会有90亿台(也限于物联网设备)。

  那么,AMD公司认为处理所有这些设备及其产生的数据需要些什么呢? “这真的是关于机器智能的。这是业界发展的下一步。”苏说。

  “机器智能将涉及到处理来自超过500亿台设备所产生的所有的数据信息,并找出如何使用这些数据信息的合理的方式,如何使用一种有用的方式,使我们可以变得更智能。”


来源:AMD公司

  根据苏介绍,关于这些数据需要注意的是:它们有各种不同的形态和大小。

  “我们当前所收集的包括了文本数据,视频数据,音频数据或其他方面的数据。鉴于有了所有这些不同的数据,使得我们真的是处在​​一个异构的系统中了。这意味着您需要所有类型的计算来满足这些数据的不同处理需求。您企业将需要CPU、需要GPU、需要加速器、需要ASIC、需要快速互连技术。所有这一切都是必要的,其关键是异构环境,异构计算架构。

  “异构计算”这一术语指的是使用多于一种的处理器或核心的系统,目的在于满足现代工作负载可能具有的所有各种处理需求。 “我们在过去十年里一直在谈论异构计算,”Su说。 “这就是我们想要将CPU和GPU整合在一起的原因。”

  早在2013年,AMD公司就已经将异构计算引入了对于服务器的探索追求。彼时,该公司计划推出“Kaveri”产品系列,用于台式机、笔记本电脑、嵌入式芯片和数据中心系统。对于服务器,AMD将Kaveri作为柏林加速处理单元(APU),其被称为“世界上首款具备服务器APU的异构系统架构(HSA)”。

  在柏林加速处理单元推出背后提供支持的是Andrew Feldman。他是SeaMicro公司的创始人兼首席执行官,Andrew Feldman曾经对AMD未来接管英特尔的机会持乐观态度。但在2014年,Feldman离开了该公司,并表示说“AMD旗下的SeaMicro集团比以往任何时候都更强。”该部门于一年后关闭,也使得该款柏林未能按预期出售。

  AMD公司认为,由于在市场上的最新变化,历史本身不会重演。苏说:“当人们不太明白为什么我们这样做时,我们这样做了,然后我们也深入了解了市场。但现在非常清楚的是,在当下这个机器智能的时代,我们需要异构计算。”

  她继续说:“AMD是业内唯一一家能打造真正的、高性能的异构应用程序的。我们已经投资Zen架构四年了,并将看到其在2017年带来回报,这是一款真正的现代CPU。我们还投资于Radeon芯片产品,我们将继续实现Radeon芯片产品的大幅下降。”

  “而其他非常重要的事情是,我认为AMD与业界其他企业是有着显著区别的。当我们在谈论将CPU和GPU在一个高性能的系统中连接在一起时,我们要做的是一款开源的软件平台。我们将用一个开放的互联网络与行业互动。而这正是我们所坚信的下一代数据中心和机器智能时代将获得成功的方式。”


来源:AMD公司

  关于GPU

  AMD公司旗下Radeon技术事业部高级副总裁兼首席架构师Raja Koduri表示说:“当我还在上研究生时,经常看到有一些人对AI和神经网络抱着玩世不恭的态度,当然也有些业界的人在持续不断的推进算法。”

  “而这一切已经发生了,借助我们在算法方面所积累的知识,才使得今天的电脑智能游戏玩家的GPU有了足够的计算来解决复杂的算法。所以,今天我们实际上能够以非常有效的方式训练这些神经网络。”

  Koduri是对的——GPU已经被机器学习社区所接受。但是他们所采用的GPU主要是由Nvidia制造的,Nvidia拥有其Pascal Titan X和特斯拉加速器的扩展系列——全部采用了CUDA深度学习程序,由Nvidia的cuDNN机器学习库提供支持。

  最近,AMD公司为谷歌和阿里巴巴(他们也使用Nvidia的产品)提供了GPU,他们认为其最新产品将改变这一切。

  该公司将其称为“Radeon Instinct”,这是一款围绕Radeon开放计算平台(ROCm,以前称为Boltzmann倡议)的硬件和软件的堆栈。“对我们来说,这实际上不仅仅是一个品牌。”Koduri说。 “这是一个全新的倡议计划。”

  “我们将解决利用通用基础设施的关键垂直领域。这个基础设施的构建块是我们的硬件类产品,我们称之为Radeon Instinct硬件平台,并且我们有完全开源的Radeon开放计算软件平台。此外,我们正在构建优化的机器学习框架。”

  “云服务和超大规模是我们的首要任务,但我们也从事一些金融服务、能源、生命科学和汽车领域。”

  Radeon Instinct的硬件方面包括三款新的被动冷却加速器:MI6、MI8和MI25。

  Radeon Instinct MI6专为推理工作而设计,使用具有16GB内存的Polaris GPU提供高达5.7 Tflops的FP16或FP32吞吐量和224 GB / s的内存带宽。

  Radeon Instinct MI8专为推理和其他HPC工作负载而设计,包含一个带4GB HBM RAM的Fiji GPU,可提供8.2 Tflops的FP16或FP32吞吐量和512 GB / s的内存带宽。

  对于Radeon Instinct MI25来说,了解不多,因为其将与AMD即将推出的下一代Vega GPU一起推出,该GPU尚未完全展示。 MI25是专为AI训练的。


来源:AMD公司

  “训练需要消耗很多的GPU计算能力,需要花费几个小时的时间。”Koduri说。 “大约6-8 Tflops的单个GPU需要几个小时,这将取决于数据集的大小和所有其他方面。推理速度要快得多。因此,GPU被用于这两个任务,我们的策略是同时解决这两个任务。”

  但是,“硬件只是这个市场的问题的一半,”他补充说。 “如果硬件是最重要的事情,那么AMD GPU有方式来解决,在过去10年里,我们比任何其他GPU具备更多的计算性能,我们每毫米平方打包了更多的计算能力,计算成本比我们的竞争对手要低。所有这一切是从2005年开始的。距今已经十一年了。”

  在软件方面,AMD公司的ROCm可以加速诸如Caffe、Torch 7和TensorFlow这样的通用深度学习框架。AMD宣布推出的另一款重要产品是MIOpen。 “这是一个深度学习库,完全开源,针对Radeon Instinct进行了优化。借助MIOpen,我们的机器学习进程的速度提高了三倍。”

  此外,Radeon Instinct加速器将支持使用AMD的MxGPU功能的硬件虚拟化。

  “我们在所有这些市场都有竞争细分。”Koduri说。 “您企业想获得虚拟化技术?您必须购买Grid;若您企业想获得AI技术?您需要特斯拉。而我们的客户都想实现这一切整合在一起,我们为他们提供了跨越整个堆栈的虚拟化功能。”

  Koduri还认为,当涉及到加速器时,选择专有的开放源是一个错误:“如果您了解一下当今的计算基础设施,另一件事情是,他们实际上是基于Linux的同构进程。而专有加速器,具备专有加速器软件和专有加速器互连,才刚刚开始在数据中心领域获得发展。但我们并不相信这会持续下去。”

  “这是关于异构处理器的,这是我们企业客户的系统所真正想要的,他们希望整个软件是开源的。这对数据中心来说是非常重要的。想象一下,今天的数据中心没有Linux的情况是怎样的。开放互连也非常非常重要。开放加速器——加速器,其指令集是开放的,以便人们可以构建自己的定制化编译器,定制软件基础设施。这是未来的计算基础设施。”


来源:AMD公司

  编译器技术也是Koduri对构建GPU硬件的初创公司持怀疑态度的原因之一。 “有许多初创公司,我与其中一些一起工作过,以便了解我们是否应该将它们的一些技术集成到GPU方面。”他告诉DCD网站的记者说。 “但是,当我们与他们沟通时最根本的障碍在于:当我们问他们是否有一款编译器时,他们却表示自己只是雇了一个小团队,他们会为我们编写一个编译器架构。”

  “我们知道我们花了多长时间来得到我们今天的编译器。其实际上开始于为VX8.1编写着色器编译器直到今天,此前我们有一个100人的编译器团队和一个完整的编译器基础。实际上很难为新架构开发编译器技术。”

  当谈到正在由云服务公司自己开发,或至少部分开发的硬件主题,如谷歌的TPU,微软的FPGA和亚马逊的芯片在2015年收购Annapurna实验室时,Koduri同样缺乏热情。

  他告诉DCD的记者说:“令人惊讶的是,他们可以负担得起任何硅芯片,但每家公司都说他们正在构建芯片,他们实际上正在构建一款FPGA作为概念证明,因为构建硅芯片是一个超昂贵的过程,您需要大量的卷才有意义,当您企业表示“我们要制作我们自己的芯片”时,您要使用或销售多少?所以这涉及到一个规模化的问题。最终,这会像我们公司,Nvidia和英特尔一样,销售了数百万,然后自己占了其中的很多使用案例。

  “第二件事情,就像我说的,我们相信,对于下一代机器智能来说,它将是异构处理器。所以它将是可编程的CPU、可编程的GPU、FPGA和具备特殊功能的东西。我们认为互连是一件非常重要的事情,这些如何相互协作将是非常重要的。”

  Koduri补充说:“如果您了解一下数据中心的设施,他们的GPU实际上远远超越了机器智能的用途,所以他们正在执行托管任务,托管专业的应用程序,这在今天是相当大量的。因此,如果一家数据中心有100,000个GPU,那么他们不希望浪费。事实上,他们不希望任何硅芯片资源的浪费,所以如果您企业有一些特殊的目的,并建立一处规模庞大的数据中心,但却并没有被充分使用,这显然不是一件好事。这是特殊功能的问题,他们并没有其他用途。”

  关于CPU

  为了实现这种“在高性能系统中将CPU和GPU连接在一起”的愿景,需要一款具备异构计算的CPU。

  在2017年第二季度,AMD公司将发布 Zen Naples平台(注:消费者关注的Zen的版本已被重命名为Ryzen,但服务器版本仍然称为Zen)。今年早些时候,泄漏规格的产品是运行SMT(同时多线程)的32 Zen CPU内核,允许64个线程和一个大规模的512MB三级缓存。

  “这是一款为GPU和加速器吞吐量计算优化的平台,”Koduri说,宣布 Radeon Instinct具备与Zen Naples平台。

  “它将大大降低异构计算的系统成本。这是最低延迟的架构,具有对等通信,利用大盒支持,以便您企业可以有许多的GPU连接到单个节点。这就是我们的企业客户所想要的。不再试一两个GPU,而是四,八,十六个。

  “这个微小的外形规格意味着我们可以在数据中心业界获得的进展将是相当令人兴奋的。”

  为了配合 Radeon Instinct的推出,AMD还展示了三款服务器来容纳其新技术。

  在小的方面,我们看到了超微Micro SYS 1028GQ-TRT的推出,这是一款1U双Xeon机箱,带有三个PCIe3 16x插槽,全部装有Instinct卡。接下来是Inventec的K888 G3具备Radeon Instinct,一款2U盒,Instinct GPU和两个Haswell或Broadwell Xeons,达到100 Tflops。

  但最令人印象深刻的技术是Inventec PS1816 Falconwitch。 400 Tflop beast打包了16个Instinct MI25卡,以及在2U服务器中未公开的CPU数量。其CPU没有命名,但被认为是基于Zen的Naples。

  Falconwitch可以与Radeon Instinct组合形成Inventec机架,创建一个具备120个Instinct GPU的3 Petaflop机器。

  所有这一切仅仅只是改变数据中心的开始,Koduri告诉DCD的记者说。

  “我认为,在未来几年中,我们将开始看到一些有趣的方法进入边缘数据中心领域,因为今天的基础设施、技术都在不断发展进步。 一旦您看到诸如“可以打造一个小小的petaflop数据中心时”,那么您就会开始考虑您可以把它放在您的蜂窝塔(cell tower)上的事实了。 那么,petaflop计算还应该距离您企业一千英里远呢?”

  “显然已经没有什么好的理由了!”


  责任编辑:DJ编辑

机房360微信公众号订阅
扫一扫,订阅更多数据中心资讯

本文地址:http://www.jifang360.com/news/2017221/n323793472.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
推荐图片