机房360首页
当前位置:首页 » 新闻资讯 » 阿里首颗自研芯片含光800诞生!算力相当于10个GPU,打破AI芯片性能纪录

阿里首颗自研芯片含光800诞生!算力相当于10个GPU,打破AI芯片性能纪录

来源:猎云网 作者: 更新时间:2019/9/25 13:15:20

摘要:在今日2019云栖大会上,阿里巴巴集团首席技术官兼阿里云智能总裁张建锋发布了全球最高性能AI推理芯片含光800。

  在今日2019云栖大会上,阿里巴巴集团首席技术官兼阿里云智能总裁张建锋发布了全球最高性能AI推理芯片含光800。

1.jpg

  “含光”为上古三大神剑之一,该剑含而不露,光而不耀,正如含光800带来的无形却强劲的算力。在杭州城市大脑的业务测试中,1颗含光800的算力相当于10颗GPU。

  在业界标准的ResNet-50测试中,含光800推理性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。

WechatIMG1858.png

  张建锋介绍,含光800的研发用了互联网公司的速度,从完成设计到流片只用了一年半的时间。

  “在全球芯片领域,阿里巴巴是一个新人,玄铁和含光800是平头哥的万里长征第一步。今天阿里巴巴有足够的能力去做传统硬件公司能做到的,包括他们不能做到的。他们能做到的是硬件,不能做到的是,我们拿软件变成硬件。因为我们的软件有算法。这两者的结合,使我们用硬件的能力、互联网公司的速度,只花了一年半的时间,就完成了芯片的设计、验证到流片。我们有充分的信心,阿里巴巴今后会成为一家真正软硬件一体化的协同发展科技公司”。

  含光800性能的突破得益于阿里软、硬件的协同创新:

  硬件层面,其采用了自研芯片架构,通过推理加速等技术有效解决芯片性能瓶颈问题;

  软件层面,它集成了达摩院先进算法,针对CNN及视觉类算法深度优化计算、存储密度,可实现大网络模型在一颗NPU上完成计算。

  据悉,含光800已开始应用在阿里巴巴内部核心业务中。

WechatIMG1861.jpeg

  根据云栖大会的现场演示,在城市大脑中实时处理杭州主城区交通视频,需要40颗传统GPU,延时为300ms,使用含光800仅需4颗,延时降至150ms。

WechatIMG1864.jpeg

  拍立淘商品库每天新增10亿商品图片,使用传统GPU算力识别需要1小时,使用含光800后可缩减至5分钟。

  据张建峰介绍,含光800将通过阿里云对外输出AI算力。基于含光800的AI云服务当天正式上线,相比传统GPU算力,性价比提升100%。

WechatIMG1856.png

  2017年,阿里成立达摩院之时,芯片就是达摩院成立之初就规划的重要研发方向之一,为了快速推进该项业务,阿里此次成立集团全资控股的专门公司,将芯片业务完全放入该企业,不仅负责研发,还要进行产业化推广、构建生态等一系列任务,让芯片真正成为阿里巴巴的一项战略业务。

  去年云栖大会上,阿里宣布成立一家独立运营的芯片公司——“平头哥半导体有限公司”。这是阿里去年4月收购的中天微系统有限公司(以下简称中天微)和达摩院自研芯片业务一起,整合成的一家独立的芯片公司。

  全资收购中天微,只是阿里整个芯片布局上的一个节点。实际上,马云从更早的时候就开始关注中天微,包括后来对寒武纪、深鉴科技等AI芯片创业公司的投资,都属于阿里的芯片产业战略的重要布局。

  过去半年,平头哥先后发布玄铁910、无剑SoC平台。随着含光800的发布,平头哥端云一体全栈产品系列初步成型,涵盖处理器IP、一站式芯片设计平台和AI芯片,实现了芯片设计链路的全覆盖。

  责任编辑:张华

机房360微信公众号订阅
扫一扫,订阅更多数据中心资讯

本文地址:http://www.jifang360.com/news/2019925/n2589122368.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
转载声明:凡注明来源的文章其内容和图片均为网上转载,非商业用途,如有侵权请告知,会删除。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
推荐图片