DPU困境：SmartNICs之外的生活_机房360

摘要：专用芯片的存在是因为x86系列处理器在通用任务方面非常出色，但对于特定任务，它们可能比专门构建的系统慢得多。这就是图形处理器芯片(GPU)蓬勃发展的原因，首先是在游戏机中，然后是在人工智能系统中。

　　VMware产品管理vSphere副总裁保罗·特纳(Paul Turner)在一篇博客中说：“我们即将开始IT基础架构的下一次重大体系结构变革。他谈到的新服务器是以一种经济高效的形式构建的，具有最大的可编程性。

　　让这场革命成为可能的是一件简单的事情：让网卡变得更智能。这一过程始于智能网络接口卡或智能网卡，并由此产生了一种专用芯片：DPU或数据处理单元——一种名称含糊不清的设备，具有广泛的应用。

　　特纳预测：“随着这些DPU变得越来越普遍，我们可以预期DPU将处理加密/解密、防火墙、数据包检查、路由、存储网络等功能。”。

　　SmartNICs的诞生

　　专用芯片的存在是因为x86系列处理器在通用任务方面非常出色，但对于特定任务，它们可能比专门构建的系统慢得多。这就是图形处理器芯片(GPU)蓬勃发展的原因，首先是在游戏机中，然后是在人工智能系统中。

　　“GPU的设计初衷是最擅长数学绘制三角形，”新型网络芯片的主要倡导者之一，Fungible公司的首席执行官埃里克·海斯(Eric Hayes)解释道。“Nvidia的Jensen Huang非常出色地将这项技术应用于机器学习，并意识到体系结构非常适合这种类型的工作负荷。”

　　与GPU一样，SmartNIC从一个小任务开始：从CPU中卸载一些网络功能，以便网络流量可以更快地流动。而且，像GPU一样，他们最终发现自己拥有广泛的用途组合。

　　但SmartNIC并不是一个统一的、一刀切的类别。德洛罗集团(Delloro Group)分析师冯男爵(Baron Fung)解释说，随着网络速度的加快，它们开始出现，并且必须承载更多的用户流量。

　　冯在DCD网络研讨会上解释说：“10Gbps现在更像是一种传统技术。”。“在过去几年中，我们看到一般云提供商向25Gig转变，其中许多现在正在向400Gig过渡。”

　　与此同时，“云提供商需要整合成千上万最终用户的工作负载。SmartNIC成为管理所有数据流量的解决方案之一。”

　　冯说，服务器可以使用高达200Gbps的标准或“基础”NIC。“如今，市场上的大多数服务器都有标准NIC。”

　　除此之外，网络供应商已经创建了“性能”NIC，使用专用ASIC卸载网络功能，但SmartNIC不同。

　　“智能网卡比高性能网卡增加了另一层性能，”冯说。“本质上，这些设备可以归结为完全可编程的设备，具有自己的处理器、操作系统、集成内存和网络结构。它就像服务器中的服务器，从主机CPU提供不同范围的卸载服务。”

　　这是一个增长领域：“现在智能网卡的数量相对较少，但在未来几年，我们看到这些设备的采用率越来越高。”

　　SmartNICS正从专业市场转向更广泛的用途：“如今，大多数智能设备都是亚马逊和微软等云超级用户的专利，他们正在为自己的数据中心构建自己的SmartNICS，”冯说。“但随着供应商发布更多创新产品和更好的软件开发框架供最终用户优化他们的设备，我们也可以看到更多的产品被其他市场采用。”

　　SmartNIC在未来几年将以3%的年增长率增长，但仍将是整个市场的一小部分，因为它们价格昂贵：“如今，它们的价格是标准NIC的三到五倍。这种高成本需要得到证明。”

　　在一般网络应用中，智能网卡可以通过提高网络效率来证明其成本。“它们还延长了基础设施的使用寿命，因为这些智能设备可以通过软件进行优化。这确实是一种平衡，无论智能网卡的更高价位是否合理。”

　　但由于不同的供应商使用不同的名称和不同的功能，因此可能会产生混淆。除了SmartNIC和DPU之外，英特尔还加入了广泛相似的基础设施处理单元(IPU)。

　　“不同的供应商有许多不同的首字母缩略词，我们看到供应商试图用他们正在解决的目标应用程序特有的功能来区分，”冯说。

　　输入可替换项

　　其中一家供应商是可替代的。该公司是Pradeep Sindhu的创意，Pradeep Sindhu是一位强大的网络重建者，曾是施乐PARC的科学家，他于1996年创建了Juniper Networks。

　　Juniper的想法是将专用硅用于网络路由器，而不是使用运行在通用网络交换机上的软件。它迅速从思科手中抢走了市场份额。

　　2015年，Pradeep成立了Fungible，再次制造专用设备——只是这次制造了他称之为“数据处理单元”或DPU的网络加速器。他现在是首席技术官，首席执行官的角色已经由长期担任矽业高管的埃里克·海斯接任。

　　Hayes说，可替代的愿景是基于将更多数据从一个地方移动到另一个地方的需要：“到处都是数据，每个人都在收集数据和存储数据。问题真的归结到如何处理所有这些数据?”

　　Equinix建筑师卡拉达尔·沃鲁甘蒂(Kaladhar Voruganti)给出了一个具体的例子：“一架飞机每天每架飞机产生大约4.5 TB的数据。如果你试图创建模型或数字双胞胎，你可以想象一个人必须移动的数据量，”在Equinix首席技术官办公室工作的沃鲁甘蒂说。

　　Hayes说，CPU和GPU的设计并不是为了帮助完成移动和处理数据的任务：当你开始在通用CPU或GPU上运行这些类型的工作负载时，你的效率会非常低，相当于每个时钟都有一条指令。您正在燃烧大量的内核，并且您无法为您燃烧的电量完成大量的工作。”

　　Hayes认为SmartNIC和DPU之间有着明显的区别，它们超越了严格的网络任务：“DPU是为数据处理而设计的。它们是为处理x86和GPU无法高效完成的数据而设计的。”

　　他表示，总体拥有成本的好处是显而易见的：“这实际上取决于添加GPU来完成这些工作负载的增量成本与通用处理量的对比，否则，您将不得不烧掉。

　　根据Hayes的说法，早期的SmartNIC“只是Arm或x86 CPU的不同组合，带有FPGA和硬连线的可配置管道。它们在灵活性方面的性能权衡有限。”

　　相比之下，Fungible的DPU“有一个定制设计的CPU，允许使用紧密耦合硬件加速的定制指令集。因此，该体系结构同时实现了灵活性和性能。”

　　可替换芯片有一个带有紧密耦合硬件加速器的MIPS 64位RISC处理器：“数据路径CPU中的紧密耦合硬件加速器：这是DPU的定义。”

　　DPU可以容纳“一个非常、非常高效的TCP堆栈实现，相对于通用CPU，每个可用时钟的指令级别最高。”

　　DPU做什么?

　　DPU使网络化处理速度更快，但Fungible正在研究三种特定的应用程序，它们动摇了IT堆栈的其他部分。

　　第一个是最明显的：加速网络。

　　由于软件定义网络(SDN)运动，网络越来越多地通过软件实现。“这可以追溯到Nicira(被VMware收购的SDN先驱)的时代，”Hayes说。SDN网络通过软件处理其功能使系统更加灵活。但海斯说，当该软件在通用处理器上运行时，“效率极低”

　　Hayes说，SmartNIC采取了一些措施来改进SDN功能，但“没有达到DPU的性能水平”

　　除了简单的SDN之外，智能网卡将在更智能的网络生态系统中发挥重要作用，例如为实现5G交付而出现的OpenRAN(开放无线电接入网络)系统。

　　重写存储器

　　下一个应用程序更加雄心勃勃。Hayes说，DPU可以通过创建TCP/IP上运行的内存访问协议并卸载这些协议，从而创建“内联计算存储”，从而为以数据为中心的时代重建存储

　　NVMe或非易失性存储器express是一种设计用于访问闪存的接口，通常通过PCI express总线连接。通过TCP/IP运行NVMe，并将整个堆栈放在DPU上，从CPU卸载整个内存访问作业，这意味着闪存不再需要直接连接到CPU。

　　Hayes说：“通过TCP进行NVMe的目的是能够将所有闪存从服务器中取出。”。“您可以定义一个非常简单的服务器，使用通用x86进行通用处理，然后插入一个DPU为您完成其余的存储工作。”

　　就CPU而言,， “DPU看起来像一个存储设备，它的作用就像一个存储设备，卸载通常必须在通用处理器上运行的所有驱动程序。这是x86或Arm必须要做的大量工作，而且它会卸载到GPU，释放所有这些周期来完成您希望服务器i“首先，我不知道。”

　　Hayes说，通过TCP/IP访问的闪存设备可以从本地磁盘变成集中池存储设备。“这变得非常高效。它是内联计算存储，这意味着我们可以实际处理进入存储或返回存储的数据。此外，我们可以在数据静止时处理数据。您不需要移动数据，您可以使用GPU在本地处理数据。”

　　高速GPU

　　在最后一个应用程序中，DPU遇到了另一个重要的卸载工具GPU，并有助于更好地利用它们——因为毕竟，CPU和GPU之间有很多通信。

　　“在今天的大多数情况下，你有一个基本的x86处理器，可以照看很多GPU，”Hayes说。“由于数据必须通过PCI接口从GPU进出，并进入通用CPU内存，这成为一个瓶颈。”

　　Hayes说，将通信任务交给DPU可以让你“分解那些GPU”，将它们分成单独的模块，可以在一臂之遥处理。“它可以减少对GPU-PCI接口的依赖，并使您能够混合和匹配任意数量的GPU，甚至可以跨多个CPU对其进行薄片分割。”

　　他说，在多用户环境中，这比将一组GPU专用于特定的x86处理器要高效得多，也更便宜。

　　DPU的最后一个用例是安全性。Hayes说，他们可以被赋予加速加密和解密的能力，网络提供商对此表示欢迎。沃鲁甘蒂说：“我们希望确保我们拥有的面料是安全的。”。

　　为服务提供商和企业提供更方便的裸机

　　Equinix热衷于使用DPU，它有一个非常可靠的应用程序：Metal，它使用最近数据包收购的技术实现的裸机按需计算服务。

　　在金属领域，Equinix为客户提供了在其设施中使用物理硬件的机会，但它希望为客户提供灵活性。使用DPU，它可能允许相同的硬件执行完全不同的任务，而无需物理重新布线。

　　Voruganti说：“我喜欢Fungible的解决方案，因为它能够在不同的解决方案中以不同的形式使用DPU。”。“我认为在软件定义的可组合模型中，将有新的软件来配置硬件，例如AI服务器、存储控制器头或其他设备

　　“与其用不同的卡配置不同的服务器，并拥有许多不同的服务器SKU，我认为如果我们能够使用软件基本上根据用户需求组合服务器，我们的生活将变得更加轻松。”

　　这听起来像是一个相当专业的应用程序，但有许多企业对Equinix这样的裸机服务提供商也有类似的需求。

　　在“云回归”的旗帜下，现在有一场巨大的运动，在这场运动中，幻想破灭的早期云客户发现，当他们将所有东西都投入云计算时，他们几乎无法控制成本。因此，他们正在将资源移回巨像或自己的数据中心空间。

　　但他们有一个问题，海斯说。“您已经摆脱了云中所有不受控制的成本，但您仍然希望它看起来像您在云中已经习惯的那样。”

　　这些新的企业实施是“混合型”的，但它们需要灵活性。“许多从云端起步的企业，不一定拥有从私有网络起步的公司的网络基础设施和IT人才，”Hayes说。他说，基于DPU的系统，使他们能够轻松地构建、操作和部署这些类型的网络。

　　需要的标准

　　但这还为时过早，Voruganti希望供应商能解决一两件事：“我们仍处于这方面的初始阶段，因此公共云供应商对quote-unquote smartNICs有不同的口味，”他说。

　　“运营商面临的挑战之一是，我们希望行业实现一些标准化，以便运营商能够出于供应链原因在供应商之间切换，并拥有多供应商战略。”

　　然而，现在，由于DPU和SmartNIC供应商提供不同的体系结构，“这是SmartNIC供应商之间的苹果对桔子的比较。”

　　有了一些定义，这个行业就可以有一个生态系统，DPU甚至可以成为或多或少的标准项目。

　　耗电的DPU?

　　他还有另一个不满：“我们也担心功耗。虽然供应商喜欢在电源范围内进行替代工作，但我们认为，整体硬件设计必须与数据中心设计更无缝地集成。”

　　他说，装有智能网卡的机架正在“增加功率范围”。“从历史上看，我们每个机架的功率可能为7.5千瓦，有时甚至高达15千瓦。但我们发现，随着新的计算和存储应用程序的出现，现在每个机架的功率需求在30到40千瓦之间。

　　仅仅在数据中心中添加另一种耗电的芯片类型是没有用的，这种芯片的设计目的是保持上一代硬件的冷却：“我认为这些硬件供应商正在使用的冷却策略必须更加无缝地集成，以获得更好的冷却解决方案。”

　　Equinix的目标是在一定程度上控制特殊处理单元：“我们正在研究Open19标准，并开始与不同的供应商和行业接触，看看我们是否能够实现标准化，以便轻松提出冷却解决方案。”

　　标准还是性能?

　　Hayes接受了这些观点，但他并不热衷于将他的特殊产品商品化，并表示您需要专业硬件来避免过热：“这一切都与软件有关。在我们看来，从长远来看，这个市场的赢家将是能够在尽可能高效的基础设施中构建所有这些服务的人。基础设施越高效，功耗越低，每CPU和每位闪存可以获得的用户越多，因此您将获得越多的利润。”e、 "

　　分析师冯可以看出标准化的困难：“如果有多供应商解决方案就好了。但我并不认为会发生这种情况，因为每个供应商都有自己不同的解决方案。”

　　但他认为，必须形成一个更加标准化的生态系统，如果DPU要接触到更多的客户：“我预测大约三分之一的DPU市场将在较小的提供商和私有数据中心。必须有软件开发工具包，使这些较小的公司能够将产品推向市场，因为他们没有像AWS或Microsoft这样的数千名工程师。”

　　责任编辑：张华

JIFANG360.com - 机房360

DPU困境：SmartNICs之外的生活