机房360首页
当前位置:首页 » 业界动态 » 对话英特尔数据中心负责人:AI训练取得飞跃,IDM 2.0是制胜法宝

对话英特尔数据中心负责人:AI训练取得飞跃,IDM 2.0是制胜法宝

来源:ZAKER 作者: 更新时间:2022/7/19 9:21:31

摘要:面向人工智能(AI)数据分析和推理的计算加速,英特尔是无可争议的领导者。与此同时,它正向英伟达独霸的 AI 训练市场发起冲锋——一方面重回数据中心 GPU 战场,另一方面推出新一代云端 AI 芯片 Habana Gaudi2。

  在数据中心的芯片战场,火药味日益浓烈。

  面向人工智能(AI)数据分析和推理的计算加速,英特尔是无可争议的领导者。与此同时,它正向英伟达独霸的 AI 训练市场发起冲锋——一方面重回数据中心 GPU 战场,另一方面推出新一代云端 AI 芯片 Habana Gaudi2。

  " 通过内置 AI 的 CPU 以及所有新的 GPU 产品和 Gaudi 这样的 AI 加速器,我们在训练方面也将取得巨大的飞跃,这对英特尔来说是一个激动人心的时刻。" 英特尔公司执行副总裁,数据中心与人工智能事业部总经理 Sandra Rivera 说。

  Sandra 是英特尔现任 CEO 基辛格的左膀右臂。去年 6 月,英特尔对其业务部门作出调整,将英特尔数据平台事业部重组为两个全新的业务部门,并任命 Sandra 担任执行副总裁、数据中心和人工智能(DCAI)部门的总经理。

  ▲英特尔公司执行副总裁,数据中心与人工智能事业部总经理 Sandra Rivera

  在接管 DCAI 部门后,Sandra Rivera 负责领导开发基于云领域的领先数据中心产品,以及推进英特尔整体 AI 战略。今年 5 月,英特尔发布两款全新云端 AI 芯片——第二代 AI 训练芯片 Habana Gaudi2 和 AI 推理芯片 Greco。这是英特尔收购以色列 AI 芯片企业 Habana Labs 以来,首次正式发布的 AI 芯片新品。

  如今随着数据量、计算力的不断增长,数据中心和 AI 市场已成为许多芯片企业猛攻的高地。近日,英特尔公司执行副总裁,数据中心与人工智能事业部总经理 Sandra Rivera 与芯东西等媒体进行了深入交流,分享英特尔制胜数据中心的战略布局,以及其 AI 芯片的最新进展。

  一、正面迎战英伟达,对AI训练芯片有信心

  " 我们 AI 战略的核心是我们的软件优势、软硬结合的优势、对开发人员的重视以及我们所打造的强大的开放生态系统。"Sandra 总结说。

  面向 AI 市场,英特尔制定了完善的战略,其整体大战略从传统的 IDM 升级至 IDM 2.0,计划通过重新加大芯片制造的投入来扭转局面——基辛格宣布未来几年内,英特尔将投入数百亿美元建造芯片工厂,同时推出芯片代工服务。

  在 Sandra 看来,IDM 2.0 是英特尔独一无二的制胜法宝,使其始终有能力设计最好的产品、并以最好的方式进行制造,从而实现领先的制程、产品、供应和成本。" 这不仅是为整个芯片的发展奠定了基础,英特尔 IDM 2.0 也为未来人工智能的发展打好基础。"

  硬件层面,英特尔最新发布的云端 AI 训练芯片 Habana Gaudi2 将 Tensor 处理器内核数量从第一代 Gaudi 训练处理器中的 10 个增至 24 个,封装内存从 32GB(HBM2)增至 96GB(HBM2E),板载 SRAM 从 24MB 增至 48MB。

  " 这是第一个,也是唯一一个集成了如此大量内存的加速器,所以在产品实力上,Gaudi2 已处于业界领先水平。"Sandra 告诉芯东西。在权威 AI 基准测试 MLPerf 近期公布的最新测试结果中,Habana Gaudi2 在多项测试任务的训练速度比英伟达 A100 GPU 更快。

  Habana Gaudi1 已在不少 CSP 厂商的实际部署中发挥价值。随着 Gaudi2 的出货,Sandra 相信将有更多厂商采用英特尔 AI 芯片解决业务挑战。

  除了 Habana Gaudi2 之外,英特尔至强可扩展处理器系列也在帮助其广泛客户更好地通过灵活的解决方案完成大规模 AI 训练。此外,英特尔在其产品线中增加了图形处理器(GPU)。两年前,英特尔便透露了自己在 GPU 方面的蓝图,欲与英伟达展开新一轮的较量。

  Sandra 认为,客户更关注的是如何将技术整合到一起形成合力,以实现更快的 AI 部署和更高效的业务。这其中的关键不在于寻找单一的解决方案,而是对 AI 技术进行有机结合,从而帮助企业实现商业目标。英特尔则是那个最能为客户提供完整解决方案的公司,并通过持续在深度学习训练架构和软件创新,提供更具性价比的 AI 训练解决方案。

  此外,她也解释了英特尔 CPU 产品的大小核与同行产品的差别:" 我们推出的产品,无论是能效核还是性能核,都是基于相同平台的,所以我们的客户在同一平台之下就有了能效核和性能核这两种选择。很多客户对这种前景是非常期待和兴奋的,他们可以充分利用基于英特尔架构内嵌的已经写好的软件,并且基于自己的工作负载自由选择性能核或者是能效核。"

  " 英特尔已经整装待发,得益于良好的客户关系、强大的市场地位,以及独特的差异化优势,我们只需要遵循并实施我们的 AI 战略,一切未来皆可期。"Sandra 谈道。

  二、"软件是我们所有工作的核心"

  据英特尔团队观察,AI 芯片在当前整个芯片市场中相对份额较小,但增长十分迅猛。

  对更快、更高效的 AI 计算需求的不断增长,不仅催生了数十家芯片初创企业,也引来领先芯片制造商的大举投资。

  根据美国市场调查公司 Allied Market Research 的调查报告,2020 年 AI 芯片市场总价值约为 80 亿美元,预计其将在 2030 年增至近 2000 亿美元。

  面对这样的趋势,英特尔重整 AI 战略,更加强调软件在计算架构体系内的重要作用,并在软件和开源生态社区方面进行了大规模投入。

  例如,它将为客户提供软件包,使客户既能够使用通用 AI 芯片处理工作,也可以将部分任务交给擅长图像识别或其他工作的专业芯片。同时,英特尔更加强调执行力和推出产品的节奏,以提供具有吸引力的产品。

  英特尔在 AI 策略上坚持 " 软件优先 " 的理念,面向 AI 开发者打造开放且易用的软件堆栈。

  " 软件优先 " 包括安全的 AI 软件组件,即让用户能够利用至强处理器的独特软件和安全功能,如通过英特尔软件防护扩展(英特尔 SGX)进行机密计算,保护使用中的关键数据和软件。

  英特尔继续投资于 oneAPI 这样的开放软件堆栈,以及 TensorFlow 和 PyTorch 这样的行业框架,以促进开发人员、学术界和更广泛生态系统之间的协作。此外,英特尔不仅花费数年时间为 CPU 优化最流行的开源框架和函数库,还开发了 BigDL 2.0 和 OpenVino。

  " 软件是我们所有工作的核心,对于选择 x86 的开发人员来说,未来是光明的。"Sandra 说," 我们始终认为相比封闭、专有的解决方案,开放的生态系统能释放创新能力,因此,我们致力于打造成熟的生态系统吸引更多客户。"

  据她透露,英特尔将继续充分利用制程、技术以及架构的优势,在此基础上叠加软件,未来将会有很多通过软件来实现 10 倍、20 倍、30 倍的性能扩展和提升。

  三、将资源集中于人工智能和数据安全

  " 我相信未来每一个计算平台当中都有 AI 的成分,现在可以说英特尔在所有的平台上都有 AI,无论是服务器还是客户端产品。"Sandra 认为 AI 是一个多角度、多层次的工作负载,从整个人工智能流程来看,从数据的导入、训练、推理到最后的部署,都存在着大量的市场机会。

  按流程来拆分,一开始数据导入阶段往往采取至强 CPU,之后的训练环节可以选择具有 AI 加速功能的 CPU、GPU 或 AI 加速器,在最后的推理及部署阶段,2/3 的 AI 推理是在英特尔至强平台上进行的。" 英特尔拥有完全的能力,已经做好了充分准备去利用这些机会。"Sandra 说。

  她透露道,英特尔将资源和注意力集中在快速增长和高价值的领域:一是人工智能,二是数据安全。而英特尔 SGX 软件防护扩展基于其 CPU 平台,可以充分保障数据安全和隐私。

  Sandra 举了两个具体案例,一个是美团与英特尔合作,优化了基于第三代至强的人工智能推荐系统,通过充分利用 AVX512 指令的功能,实现 AI 训练性能提高 30 倍,从而改善消费者的用户体验;另一个是动力电池领军企业宁德时代利用英特尔 AI+SGX 实时优化数据分析,并借助至强及 SGX,将供应链数据分析时间从原来的 15 小时缩短至 1 小时,同时充分保障了其客户的隐私。

  此外,阿里云、百度云、腾讯云、字节跳动等云服务提供商均利用英特尔 SGX 进行数据分析以及用例的数据隔离保护。

  在她看来,聚焦x86将成为英特尔区别于业内其他厂商的主要差异化优势。英特尔通过 oneAPI 和开源社区打造开放的生态系统,使其能够为客户提供更广泛的解决方案,故而使英特尔能在 AI 领域的竞争中胜出。

  " 深度学习训练和 GPU 性能只是 AI 领域的一小部分。真正让我们赢得客户青睐的是完整而开放的生态系统,以及一个 AI 真正民主化的世界。"Sandra 说,开放的生态系统可释放创新,使计算民主化,并最终战胜封闭的专有解决方案。这意味着为开发人员打开围墙大门,并创造更多选择,以适合客户的方式推进技术。

  她谈道,满足客户需求是英特尔的头等大事,但同样重要的是,致力于帮助推动开发社区内外的创新。大力支持开发社区,亦是英特尔 AI 战略的一个关键举措。

  谈及现阶段 AI 芯片面临的主要瓶颈,Sandra 分享了两点,一是很多时候客户需要跨数据中心的拷贝,如何直接应用 AI 并将其扩展到相应大数据平台上是一大挑战;针对各种 AI 应用,如何使这些智能计算支撑上层 AI 应用场景,亦是一道难关。

  结语:持续投资高增长领域,巩固数据中心护城河

  总体来看,英特尔的 AI 执行战略旨在满足从硬件到软件、从云到边缘的各种碎片化 AI 需求。英特尔一面持续投资高增长领域,结合其在制程、封装、规模以及制造方面的优势,以巩固其与客户在数据中心的竞争力;另一方面打造软硬件最优组合,与中国合作伙伴和客户展开合作,使更多的生态系统合作伙伴加入创新并从中受益,由此持续打造英特尔的差异化优势。

  在人工智能、数据安全和隐私保护等方面,英特尔也会协助其充分利用计算平台的能力,对用户数据进行保护,以满足客户的多样化需求。

  据 Sandra 观察,就 AI 的采用情况而言,这个行业仍处于起步阶段,现在就宣布获胜者或者说行业已经发生转型还为时过早,但英特尔在推动当前和未来 AI 转型方面处于最前沿。

  尽管目前用 AI 取得良好业务成果的公司仍在少数,但她相信,只要注重选择、信任、开放、安全和生产力,就可以使 AI 民主化,并释放 AI 的初期(80%)潜力。

  责任编辑:张华

机房360微信公众号订阅
扫一扫,订阅更多数据中心资讯

本文地址:http://www.jifang360.com/news/2022719/n4786147449.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
转载声明:凡注明来源的文章其内容和图片均为网上转载,非商业用途,如有侵权请告知,会删除。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
推荐图片