全球最大AI芯片WSE迎首批客户,美国能源部率先“接盘”

芯潮(ID:aichip001) 文 | 韦世玮

导语:在业界一边为WSE的诞生振奋却又担忧其商业价值时,美国能源部的两大实验室成为了“第一个吃螃蟹的人”。

智东西9月18日消息,据悉,全球有史以来最大的计算机芯片Cerebras WSE终于要真正地落地使用了。该芯片将被用于美国能源部的阿贡国家实验室(Argonne National Laboratory)和劳伦斯·利弗莫尔国家实验室(Lawrence Livermore National Laboratory)的AI计算机中。

这颗芯片由美国创企Cerebras在今年8月的Hot Chips大会上发布,以46225平方毫米的面积成为有史以来规模最大的AI芯片,同时它还包含1.2万亿个晶体管,旨在用于深度学习的加速神经网络训练。

此前,Cerebras计划在今年第四季度开始销售基于笔记本大小芯片的电脑。而美国能源部的这两个实验室也将成为全球首批安装采用Cerebras WSE芯片制造的AI计算机的机构之一。

一、比Tesla V100大56倍,支持超大规模神经网络训练

目前,加速神经网络训练通常在基于GPU的服务器的大型数据中心里进行。

而英伟达的GPU则占了深度学习芯片市场的绝大多数份额。该公司在2017年发布的旗舰GPU Tesla V100,其核心面积达到815平方毫米,晶体管超过210亿个。

但Cerebras WSE的出现,也许将给这一市场带来新的激烈竞争,仅从它46225平方毫米面积和1.2亿个晶体管的参数来看,就已经是Tesla V100的56倍有余。

更具体地说,这颗比ipad还大的WSE芯片的每边约22厘米(约8.5英寸),采用台积电16nm制程,拥有400000个AI优化核心和18 Gigabytes片上内存。

带宽方面,WSE还有着9 PByte/s内存带宽和100 Pbit/s fabric带宽。

虽然与通常的芯片相比,WSE又大又厚,但它却可以承载起谷歌和亚马逊等科技巨头所创建的超大规模神经网络所需的并行处理速度。

针对这一方面,Cerebras创始人兼CEO Andrew Feldman表示,这个巨型处理器不仅能够完成数百个GPU的集群工作,其具体能完成的量将取决于手头的任务,同时它也将消耗更少的能源和空间。

二、WSE的三大特性

在训练AI系统方面,Feldman曾表示WSE的速度可以比现有的硬件快100到1000倍。

总的来说,WSE主要在AI算力、存储、带宽这三个方面,拥有超乎目前市场上绝大多数AI芯片的优势。

在AI算力方面,WSE包含了400000个稀疏线性代数(SLA)内核,每个AI优化核心都灵活可编程,并针对支撑大多数神经网络的计算进行了优化。

基于它的可编程性,WSE还能确保内核在不断变化的机器学习领域中运行所有的算法。同时,它还能够提供更快的AI训练速度。

在存储方面,WSE拥有更高效、高性能的片上存储优势。它具有18 GB的片上存储器,可在单个时钟周期内访问,并提供9 PB/s的存储器带宽。

此外,与英伟达的Tesla V100相比,WSE的容量是它的3000倍,带宽是它的10000倍。不仅如此,WSE还能实现更快速灵活的计算、更低的延迟和能耗。

在带宽方面,WSE拥有更高宽带和更低延迟的通信结构。它的400000个内核能够通过一个名为“Swarm”的片上通信结构,连接在一个带有100 Pb/s带宽的2D网格中。

Swarm能完全可配置,以支持训练用户指定模型所需的精确通信。同时,对于每个神经网络,它还提供独特且优化的通信路径。

三、将集成至美国能源部超级计算机中

在WSE面世时,Feldman并未就芯片的成本 、售价和实用性作出相关的回应。因此,在WSE给人们带来惊喜时,其商用价值也受到了一部分人的质疑。

而如今,美国能源部的两个实验室宣布采用这一芯片,也将为WSE商业应用的可行性作出一次尝试与证明。

(图为阿贡国家实验室)

“将有史以来最大、最快的AI芯片纳入我们的先进计算基础设施,这将大大加速我们在科学、工程和健康方面的深度学习研究。”阿贡国家实验室的计算主管Rick Stevens在一份新闻稿中表示。

在他看来,WSE将帮助他们发明和测试更多的算法、更快地探索想法,以及更快地发现科学进步的机会。

在应用中,阿贡国家实验室和劳伦斯·利弗莫尔国家实验室将把WSE集成到现有的超级计算机中,作为这些计算机的AI加速器。

同时,阿贡国家实验室计划在2021年成功研发美国第一台百亿亿次计算机——Aurora,其每秒能够进行超过10亿次计算。

而劳伦斯·利弗莫尔国家实验室也有望凭借El Capitan计算机达到百亿次的运算能力。这台造价6亿美元、运算能力为1.5 exaflop的计算机也将于2022年底投入使用。

值得一提的是,劳伦斯·利弗莫尔国家实验室还拥有世界排名第二的Sierra超级计算机,以及世界排名第十的拉森超级计算机。

实际上,为了更好地利用AI来解决美国国家实验室所攻克的各种问题,美国能源部在9月初成立了AI技术办公室。

同时,在Cerebras方面,该公司计划在未来几个月内,将WSE的应用合作从阿贡和劳伦斯·利弗莫尔进一步扩展到美国能源部的其他实验室中。

结语:推动WSE商业落地进程

此前,由于Cerebras未曾披露芯片的性能统计和基准测试数据,业内在为其振奋的同时,为未免对它的商业价值和落地应用进程表露担忧。

而如今,美国国家能源部的两大实验室率先与Cerebras达成合作关系,将WSE应用到国家实验室的超级计算机中,不仅成为了业界关注的重点,也是对WSE是否能真正商业落地的一次尝试。

总而言之,一面拥有全球顶尖的先进计算基础设施,一面是全球最大、性能领先的计算机芯片,二者的结合,是否将会为世界展示AI领域的更多突破和可能性?让我们拭目以待。

打开APP阅读更多精彩内容