阿里含光800的背后,是X86、ARM阵营之后的平台哥阵营来了

文 |张国斌 图 |张国斌/阿里巴巴 编者注:未来企业的竞争都是生态和平台的竞争,说穿了就是阵营的竞

文 |张国斌 图 |张国斌/阿里巴巴

编者注:未来企业的竞争都是生态和平台的竞争,说穿了就是阵营的竞争,成立短短一年的平头哥为何要频频出手?其背后是要打造一个平头哥阵营,这是继X86和ARM阵营的之后的又一阵营,平头哥会成为RISC-V领域的带头大哥吗?

今天,阿里巴巴平头哥再次刷爆了朋友圈---在阿里巴巴2019云栖大会上,阿里巴巴集团CTO张建峰发布了阿里巴巴平头哥第一款芯片——含光800,它采用12nm工艺,有170亿晶体管!号称是全球推理最高性能AI芯片。而这是平头哥仅仅成立之后就推出的第三个震撼业界的产品。

在此之前,今年7月25日,在2019阿里云峰会上,平头哥发布了业界第一性能的RICSC-V架构处理器玄铁910,它用于高性能开源芯片,可以应用于5G、人工智能以及自动驾驶等领域。

8月29日,平头哥再次出手发布了面向AIoT时代的一站式芯片设计平台“无剑”,宣称可以帮助芯片设计公司,将芯片设计成本降低50%,同时将设计周期缩短50%。

而在今天,平头哥再出手发布了号称业界推理性能第一含光800,其AI性能和能效比吊打老牌AI企业,含光800AI芯片是阿里巴巴第一款正式流片的芯片,主要应用于云端视觉处理场景。

从上表看,含光800在性能和能效比上都超越对手,性能是NV P4的40倍以上,是今年NV发布的T4新能10倍以上!能效更是超越!也超越了其他AI友商。官方数据显示,含光800在芯片测试标准平台Resnet 50上的具体分数为:性能78563 IPS,是第二名(15012)5倍;能效比500 IPS/W,是第二名(150)3.3倍。

含光出自《列子·汤问》篇有“上古三剑”一章,寓意含而不露,光而不耀,象征含光800无形却强劲的算力。玄铁,取自金庸小说,是打造绝世兵器屠龙的材料,而“无剑”也典出金庸小说,取“顶级剑客手中无剑”之意。独孤求败四十岁前使用玄铁重剑,“四十岁后,草木竹石均可为剑,渐进于无剑胜有剑之境。”

玄铁、无剑、含光组合起来,就是给中国半导体产业打造了闯荡IC江湖的无上利器,助力伙伴笑傲江湖。

如今,半导体产业已经有ARM、X86阵营,ARM阵营深耕移动计算领域,是手机里的王者,而X86阵营主打服务器领域,是数据中心的龙头,而昨天平头哥又带来了平头哥阵营。平头哥的模式是提供普惠算力,玄铁系列和无剑系列帮助企业造芯,云端NPU通过云服务为企业提供算力,加上阿里云的先发优势,未来在AIOT领域,平头哥阵营雏形已现了。而张建峰在发布会上也自豪地表示含光800是阿里巴巴第一颗自研芯片,也是互联网公司研发的首款芯片,张建峰称之为“万里长征第一步”。

含光800揭秘

参加完昨天的主题演讲之后,笔者参加了关于平头哥的几个分论坛,基本厘清了平头哥的产品开发思路,首先,分享一些主题峰会上没有公布的含光800信息。

下午的平头哥分论坛是平头哥第一次成立后的技术论坛,吸引了很多人到场,会场爆满,很多人都站着听会,产业界有台积电南京厂总经理罗镇球,新思科技中国董事长兼全球副总裁葛群、中科院计算所研究院包云岗博士等也出席,足见平头哥的影响力。

含光800更多信息:

1、7个月前端设计3个月流片成功

据悉,过去的一年,平头哥团队在不断探索芯片与场景的融合。阿里巴巴拥有丰富的人工智能应用场景,图像视频分析、搜索、推荐这些业务场景都需要AI专用芯片提供算力,而图像、视频对算力的需求量最大。围绕这一目标,平头哥针对场景深度定制了芯片的软硬件,例如自研了架构、软件编译器、框架、工具链等等。后期也针对INT8数据类型做了大量优化,最终在性能、良率、功耗等指标上均表现良好。

值得注意的是,平头哥用最短的时间完成了芯片的设计、流片整个过程,7个月完成前端设计,之后仅了3个月就成功流片。

事实上,平头哥研发芯片并非从0开始,在阿里达摩院的算法以及阿里巴巴集团硬件基础设施多年技术沉淀之上,含光800重构了芯片的软硬件技术栈。

2、算法来自达摩院

含光800性能的突破得益于软硬件的协同创新,芯片架构方面,含光800采用创新的架构,针对深度学习中使用的大量权重参数和张量数据,在支持稀疏压缩与量化处理的基础上,通过独特设计的数据访存与流水线处理技术,大大减低了I/O需求和数据的搬移。NPU同时深度优化了卷积,矩阵乘,向量计算和各种激活函数,通过高有效的硬件资源调度和全并行的数据流处理,把AI运算的性能和能效双双推向极致。

算法方面,阿里巴巴达摩院机器智能实验室过去两年构建了完整的算法体系,涵盖语音智能、语言技术、机器视觉、决策智能等方向,并且取得多个世界领先水平的成果;硬件方面,阿里巴巴此前已在服务器、FPGA以及存储等领域拥有多年研发经验,此外,平头哥团队在体系结构、编译技术等领域拥有深厚的技术储备。基于这些能力,平头哥突破了算法和硬件之间的鸿沟,基于阿里巴巴丰富的场景和达摩院算法能力,自研芯片架构,并且设计了完整软件栈。

含光800主要应用在CNN推理类应用,可以扩展到DNN模型,应用在数据中心、大型端侧设备上。

据悉 ,含光800已开始应用在阿里巴巴内部核心业务中,含光800将通过阿里云对外输出AI算力。基于含光800的AI云服务当天正式上线,相比传统GPU算力,性价比提升100%。端云一体芯片是平头哥的主要方向,终端玄铁处理器可以与云端含光800芯片协同。

在人工智能领域,要提升计算效率,芯片需要根据场景来实现更多的差异化设计。在人工智能视觉场景中,含光800可以提供全球最强的算力。阿里巴巴是全球最大的人工智能应用者之一,丰富的场景为研发人工智能芯片提供了绝佳平台,这是平头哥的天然优势。依托阿里巴巴集团丰富的应用场景,平头哥早期就针对场景做了大量优化,因此实现了性能上的突破。

含光800的算力也不仅仅满足阿里巴巴集团内部场景的需求,还会通过阿里云对外输出,帮助企业用更低的成本获取高性能算力,加速业务创新,例如,对于受限于算力瓶颈的企业而言,含光800可以更高效地运行更复杂、更先进的算法。

目前含光800已经已开始应用在阿里巴巴内部核心业务中。根据云栖大会的现场演示,在城市大脑中实时处理杭州主城区交通视频,需要40颗传统GPU,延时为300ms,使用含光800仅需4颗,延时降至150ms。拍立淘商品库每天新增10亿商品图片,使用传统GPU算力识别需要1小时,使用含光800后可缩减至5分钟。含光800将通过阿里云对外输出AI算力。基于含光800的AI云服务当天正式上线,相比传统GPU算力,性价比提升100%。

平头哥的商业模式是什么?

在下午的平头论坛上,阿里巴巴研究院孟建熠博士分析了平头哥的商业模式,他说平头哥致力于做普惠芯片,无剑SoC平台和玄铁处理器IP来帮助企业降低芯片设计门槛;而含光800通过阿里云AI云服务的形式让企业随时随地可以享受高性能计算服务。

平头哥去年在云栖大会上成立后,很多人认为平头哥也会加入到芯片红海中搏杀,但是从平哥发布的产品来看,平头哥的目标不是卖芯片,而是开启了一个新的“平头哥”模式,这也延续了母体阿里巴巴集团“让天下没有难做生意”的愿景,--就是让降低芯片设计门槛,提供普惠算力,让更过享受算力和芯片带来的好处。

目前已经平头哥拥有全栈芯片产品家族,涵盖终端处理器IP、终端芯片设计平台SoC、云端AI芯片。实际上,平头哥提供的是端云一体的共性技术技术体系。

随着含光800的发布,平头哥端云一体全栈芯片产品家族雏形已现,实现了芯片设计链路的全覆盖,涵盖处理器IP玄铁系列,一站式芯片设计平台无剑SoC,以及AI芯片含光800:

基础单元处理器IP,C-Sky系列、玄铁系列为AIoT终端芯片提供高性价比IP;

一站式芯片设计平台,无剑SoC平台集成CPU、GPU、NPU等,降低芯片设计门槛

AI芯片,含光800通过AI云服务为人工智能场景提供极致算力。

这三大产品系列构建起端云一体的芯片生态,为企业提供普惠算力。

在云端,全球前三、亚太第一的阿里云为平头哥服务企业提供了绝佳平台,未来企业可以通过阿里云轻松获取含光800的极致算力。

在端侧,平头哥已拥有成熟的生态体系, CK801、CK802、CK803、CK805、CK807、CK810、CK860等7款自研嵌入式CPU IP核均已得到大规模量产的验证,授权客户超100家,累计销售超十亿颗,广泛应用于机器视觉、工业控制、车载终端、移动通信和信息安全等领域;除此之外,基于RISC-V架构的玄铁处理器也获得很多客户采用。

平头哥的无剑SoC平台可以把企业芯片研发周期缩短50% ,开发成本降低50%,据悉,很多企业已经开始采用这个平台研发芯片,如清微智能(Thinker)、云天励飞、炬芯、奉加微(通信芯片)、联盛德微、艾派克、博雅鸿图等。

我们已经进入了万物互联万物智联的AIoT时代,AIoT场景需要新的计算架构,需要安全、在线和智能等新的特性,所有芯片面临升级,这必将在芯片行业将引起一波全新技术革命和产业浪潮。但AIoT市场有强应用驱动和场景碎片化等特点,芯片公司按照传统的方式设计芯片很难去适应未来的需求,我认为平头哥是希望通过端云一体芯片生态为各行业提供普惠算力。

我预测未来平头哥有几个发展步骤,一个是会杀入AI训练领域,据悉目前平头哥还在研发用于阿里云神龙服务器的SoC专用芯片,以满足更多场景的算力需求。

另外一个方向是帮助本土IC设计公司降低设计门槛,这又分几个方向,一个是继续拓展RISC-V生态体系,继续发布小型化的RISC-V处理器IP,深入到物联网节点端,形成完整的RISC-V产品体系,覆盖低中高端,这样,平个头就成为了RISC-V领域的带头大哥。

还有一个方向就是跟EDA工具厂商合作,降低IC设计门槛,在昨天的分论坛,平头哥就和新思科技发布了EDA上云计划,未来让用户在云端可以轻松设计IC。

从未来发展来看,芯片所有计算力的核心。计算力则是所有互联网应用的基础。研发芯片也是帮助阿里巴巴构建了一个更完整的生态体系,也是从用户需求出发的战略,芯片、AI和云计算之间是相互融合、协调发展关系,阿里巴巴坚持的是芯片、AI和云计算三位一体、协同发展:人工智能算法逐渐集成到芯片,集成算法的专用芯片为云服务提供了更强的性能,而云计算本身则加速了人工智能应用的大规模落地。

孟博士说平头哥的芯片开放社区可以让用户一天上手开发,5天完成原型,20天完成产品开发!

我预测未来平头哥还会和晶圆制造、封测体系以及IP供应商形成合作,构建一个涵盖IP、EDA工具、封测晶圆制造体系的完整生态链,打造平头哥阵营,这个阵营是个既有纵向产业链也有横向产业合作的立体阵营,让本土IC设计公司已经用户享智慧带来的便利,加油 ,平头哥!(完)

打开APP阅读更多精彩内容