麒麟芯片发展史

文︱华为大学 图︱网络 在近年历次华为旗舰手机的消费者调查中,作为支撑华为手机商业成功的重要力量,麒

文︱华为大学

图︱网络

在近年历次华为旗舰手机的消费者调查中,作为支撑华为手机商业成功的重要力量,麒麟芯片越来越受关注。

但实际上麒麟一路走来的艰难险阻,只有经历过的人才有深刻体会。

这里,我们希望通过2003年以来的若干小故事,来探究麒麟的奋斗和变革历程。需要说明的是,麒麟只是一个代称,实际上是指用于手机的一系列芯片或部件,即华为无线终端芯片,包括麒麟、巴龙、HiKey(氦客开源开发板)、RF、 Connectivity、PMU(电源管理单元芯片)、 Codec(编解码器)等。

以下是文章正文:

华为无线终端芯片要从2003年说起。那时,公司决定研发用于WCDMA(宽带码分多址)的手机芯片——代号是 梅里 。可惜这个项目不太成功。2007年中,公司正式宣布停掉梅里项目。时任海思总裁徐直军表示,尽管梅里这个项目不做了,无线终端芯片领域还有更多挑战值得攻克,鼓励大家坚持下去。他说:“我们华为就是‘傻傻地投’。”

梅里这款产品虽然最终没能成功商用,但给团队积累了最为珍贵的产品经验与教训,更重要的是培养了一批人。梅里项目的结束其实是一个全新的开始,公司决定兵分三路在3G Modem(调制解调器)和AP(应用处理器)处理器领域分别积蓄力量,另一方面也开始了4G LTE新技术的预研和探索。

于是三个团队分别重新踏上征途。王劲和King带领团队开始3G Modem(含2G)研发,Jerry则带领梅里团队的一部分核心力量,在高端AP领域继续探索;第三个团队则专攻4G LTE方向。

2007年底,华为无线产品线研发4G网络设备需要配套的4G测试终端。Sean曾经有过3G测试终端的开发经验,责无旁贷地挑起了LTE测试终端开发的大梁。同时,由于缺人,公司决策将高端芯片专家 William从发展得如火如荼的数字媒体芯片领域抽调到LTE领域,负责LTE芯片的开发。William是一位非常有经验的芯片开发专家,在数据通信芯片、安全芯片、数字媒体芯片等领域有着成熟的产品开发经验。后来证明,正是这样才实现了4G乃至5 G Modem芯片的“星星之火,可以燎原”。

新鲜血液的加入,不仅带来了成熟的SoC(片上系统)架构和电路设计经验,还带来项目开发的新思维。William说:新团队没有经历梅里项目的磨难,但正是因为不了解,反倒有更多勇气去挑战,真正激发出团队潜力。与此同时,Sean带领的团队也燃起全新的奋斗热情,坚守的兄弟们一心都想把项目做好,他们的心中始终燃烧着一团熊熊烈火。但不论团队如何热情高涨,艰难困苦一如既往地在前面等着大家。

01

第一代LTE单模 Modem巴龙700:是25Mbps,还是100Mbps?

在定义第一代LTE芯片巴龙700的最高速率时,大家在25Mbps(传输速率单位,兆比特每秒)和10Mbps之间摇摆不定,当时 HSDPA(高速下行分组接入)的下行峰值速率在36Mbps左右,有些人觉得LTE做100Mbps太高了,能做到25Mbps就行。但 William不这样想。基于路由器领域的经验积累,他认为,4G初期的速率在无线领域看来确实很高,但在路由器领域,这个速率差不多是10年前的水平。尽管传输的原理不同,很多核心技术却是相通的。William坚持100Mbps没什么问题,物理层以上的题能够解决。

这是一款LTE单模芯片,支持LTE FDD/TDD(频分双工/时分双工),不支持2G/3G。在当时LTE网络没有大规模部署的情况下,单模LTE应用场景受限,既不能做手机,也不能做数据卡,只能放在固定位置用于CPE产品形态。而且彼时行业已经推出成熟的2G/3G/4G多模LTE芯片,并且在主流市场商用发货。从这个角度说,单模LTE芯片巴龙700是一个彻头彻尾的“落后”的产品,既然这样,为什么还要设计这样一款产品?

其实这是有原因的。负责产品规划的专家Benjamin说:2010年恰逢德国政府发布国家宽带战略,号召运营商在DD800MHz( LTE Band20,运营商的一个频段)频段上开展移动宽带业务,弥补德国广大乡村地区无线宽带接入的缺口,消除数字鸿沟。这在对手眼里,不算肥肉,但对4G Modem巴龙团队来说却是天赐良机,于是才设计了巴龙700。Sean和William团队完成了巴龙700的交付,德国的运营商同意采用基于巴龙700平台的CPE,4G巴龙芯片获得了一次宝贵的机会。在当时业界已经推出多模芯片的背景下,一款单模LTE芯片能够获得德国运营商的认可,实属不易。

借此契机,华为充分发挥端管协同优势,成功支持德国几家重要的运营商利用DD 800MHz“数字红利频谱”在全德范围内部署移动宽带网络,巴龙700成功在夹缝中打开市场。开头提到的在德国郊区进行信号测试,就是这个时候。

趁热打铁,基于对中国移动TD LTE频段的支持,巴龙700在上海世博会演示的即摄即传体验峰值速率达到了100Mbps,海思也成为最早完成工信部 TD LTE测试的厂家。基于巴龙700的数据卡还支撑华为网络完成在日本运营商的拓展。这就是LTE单模三年技术攻关播种下的革命火种。

02

第一代LTE多模 Modem巴龙710:选择成熟的3G架构,还是面向未来的LTE架构

2012年,多模已经成为行业主流,业界LTE芯片已经做到第二代,甚至第三代,海思也迅速转入多模4GLTE芯片巴龙710的研发和攻关。这时他们遇到了多模Modem架构选择的问题。

此前,2G/3G Modem芯片开发架构基于ARM9(此处ARM为英国ARM公司,下同)和ZSP(一款数字信号处理产品),有成熟的解决方案的交付能力;而之后的4G LTE单模Modem芯片则基于新的ARM 11 CPU(中央处理器)和CEVA(思华科技,公司名,也是其产品的名字)处理器,开发了全新的更有竞争力的架构。

对于LTE多模Modem的架构,两个团队进行了激烈的讨论,一方认为应该选择成熟的3G架构,有利于产品的快速量产;另一方认为应该选择面向未来的LTE架构,有利于未来演进。双方相持不下。时任海思研发管理部部长的何庭波没有立即拍板,而是给大家讲了一个故事。

2G时代,半导体巨头TI(德州仪器)英飞凌,基于成功的2G Modem去开发3G Modem,结果失败了。而后起之秀高通则是先开发了3G Modem,之后把2G功能融合进去,结果成功了。何庭波沉默了一会,对大家说:“现在我们面临同样的历史时期,要从3G向4G切换。采用旧的成熟的架构,加入新的功能,事实证明是不适用的,无法很好地演进。我们的4G技术架构选择,要面向未来。”于是最终决定:采用4G LTE架构,把2G/3G功能融入进去。正是这次选择,奠定了巴龙LTE未来芯片的清晰演进路线,从LTE Cat 4的150Mbps,到Cat 6的300Mbps,再到Cat 12的600Mbps,整个架构支撑了华为无线终端芯片在LTE上的持续演进。

03

万里征程:从4G LTE正迎头追赶,到5G时代全球领先

2013年CES(国际消费类电子产品展览会)期间,公司从产品竞争力的角度出发,决定把Modem和AP合起来,选择走soc的发展道路。当时距离交付只剩下八个半月的时间,时间紧、任务重,团队克服重重困难按时交付,并且在巴龙720这代产品上实现了很强的竞争力,创下了最短开发周期的纪录,同时这款Modem也持续为麒麟920/930/950等提供着强劲的通信能力支持。

从巴龙720开始,巴龙750、巴龙765等后续产品逐渐走上正轨,随后推出的每一代产品几乎都实现了业界最强的规格,在LTE时代站稳脚跟。2019年1月24日,华为正式面向全球发布业界领先的5G多模终端芯片巴龙5000和基于该芯片的首款5G商用终端——华为5G CPE Pro,领航5G时代。

5G的形势和4G相比已经大不相同。在巴龙5000与网络系统设备商联调的过程中,Sean和William及团队听到最多的反馈就是“你们真的很快”。2019年6月28日,中国移动发布首份5G芯片和终端评测报告,巴龙5000不论在网络兼容性、吞吐率上还是在续航上,都一骑绝尘。

经过4GLTE时代艰苦卓绝的奋斗和积累,巴龙 Modem芯片终于在市场上喊出了自己的声音,也让行业内的其他厂商刮目相看。“做全球最好的 Modem”成为现实。

04

麒麟920:初露锋芒,爆款产品是如何诞生的?

2007年,如上文讲到的,梅里项目结束后,公司决定兵分三路。经过几年艰难探索和尝试,三个方面军陆续都取得了一些突破:

3G Modem巴龙芯片经过几代的更迭,陆续突破了欧洲、日本等重要的运营商;

AP处理器经历K3V1的小规模出货,到K3V2,支撑华为D1、P6、G710、Mate、D2,P1、Dl XL等手机产品以及平板、电视盒子和电子相框等大规模出货,奠定了关键技术基础,摸索和积累了一系列产品研发和量产的方法学,在市场上初步打开局面;

4G LTE团队是革命火种,在3G向4G变迁的大潮来临之前储备力量,艰苦研发与攻关,终于在4G来临时打出了场又一场漂亮的通信胜仗。

2012-2013年,国内4G即将开始大建设;2G/3G Modem、4G Modem、AP齐头并进,但分立的K3V2和巴龙710难以担负起业务发展的使命,要支撑华为手机发展,多模SoC推出至关重要。历经昏天黑地的艰难攻关,华为推出了首款手机SoC麒麟910,支撑Mate2、P6S、P7、H30等手机规模发货,获得了良好的口碑。

麒麟为上古时期灵兽,聪慧、祥瑞,拥有来自东方的神秘力量,赋予芯片非凡的智慧和强大的力量。麒麟910开始了华为手机SoC时代,而最大突破却是来自麒麟920。

05

麒麟920的一波三折

麒麟920和麒麟910几乎是并行开发和交付的,这被称为“拧毛巾模式”。但它的诞生却是一波三折。

早在2012年12月28日,大家就在讨论开发一个K3V2 pro版本,作为K3V2的升级版,重点解决一些问题。但后来大家觉得它的竞争力不太强。2013年1月,公司决定:不要再犹豫了,果断停掉K3v2 pro。

2013年公司新立项一个产品,名称为K3V3。当时的想法是做一颗规格领先的独立AP芯片(为什么业界总有K3V3的传说原来不是空穴来风),外挂一颗全球首发支持 LTE Cat.6的巴龙720芯片,采用AP+ Modem的模式,交付终端客户。就在项目按计划进行的时候,芯片研发主管William敏锐地发现,这种模式的交付,对客户来说,成本竞争力很不够。有没有办法,在保证规格竞争力的同时,大幅降低整体成本,从而为客户提供有竞争力的解决方案版本?

办法总比困难多,通过整体的系统架构设计、规格分析、成本分析,最终项目团队确定,采用整合AP和 Modem的SoC方式可以在保证规格竞争力的同时,大幅降低芯片成本。确定方案可行之后,William立即就投入了沟通说服工作,得益于海思专家主管一体的高效机制,方案很快就获得了大家的认可并拍板执行。确定投片时间为2013年4月。

无限风光在险峰,虽然优化方案得到了认可和实施,但是留给项目组的开发时间却极其有限。整体架构需要重构,媒体部分需要重构,手机验证平台需要重构……一个关键模块的显示子系统,本来是一位新加入的海外高端专家负责,两个月前就觉得快搞定了,可是过了两个月一看,发现还是处于“快搞定”的状态。怎么办?推倒重做。

这时候,芯片专家James Wang带头投入,负责关键模块的代码重构和编写开发,两周搞定;验证专家Tom又带人扑上去,三周搞定;手机验证平台对交付影响巨大,没有熟悉的人,怎么办?原本做Modem验证但从没做过手机芯片验证的专家Martin牵头,成功地完成了手机验证平台的重构,这个平台在后来历代麒麟芯片验证交付中发挥了巨大作用。

麒麟920采用了ARM big. LITTLE(大核CPU与小核CPU相结合的CPU架构设计)架构,四个大核A15,确保强劲的性能;四个小核A7,确保优秀的能效。这是当时业界最先进的八核架构,性能和功耗完美均衡。实际上此前大家曾经对这个架构还很犹豫,纠结于大小核的升级,最后海思总裁何庭波坚决拍板: 用大小八核架构,并在专家James Fang带领下实现业界第一个真八核HMP(异构多处理器架构)方案, Benchmark(跑分)和操作体验全面领先,一举超越多家竞争对手。

在2013年初的那个阶段,麒麟910还在攻关中,甚至巴龙720也还没有完全稳定下来。但这不影响麒麟920紧锣密鼓的研发。2014年春天,麒麟910经历了艰苦的攻关,搭载麒麟910的几款手机(尤其是P7)基本上赢得了消费者不错的口碑,但大家都有点心有余悸。在这种情况下,麒麟920的表现尤其值得期待。这时候麒麟920的各项测试指标基本出炉,大家有点不太相信自己的眼睛——实在太强悍了。

2014年6月6日,麒麟920在华为北研所发布。没人会想到,这样一款强悍的产品是在华为院士艾伟的自黑中开始的。只有很少的专业媒体受邀参加了本次发布,他们已经被这款产品所震撼。随后,2014年6月底发布的荣耀6,以及9月份发布的华为Mate7,成为爆款手机,进一步提升了麒麟920的声誉和影响力,它被誉为“国产最强芯”。文章开头所说的Mate7一机难求的故事,就是这个时候发生的。

此后,大家对SoC手机芯片的开发更加有把握.更加自信,也更加出神入化。

2014年12月,麒麟620发布,这是华为首款64位的手机SoC,其支撑的荣耀6X手机成为公司首款出货量超一干万台的手机。可能没人知道,此前公司规划的是麒麟610,是32位的。后来大家果断终止了610,改为了64位的620。这一做法后来被称为“壮士断腕,绝地重生”。

2015年3月,麒麟930发布,它也完成了从32位到64位的转化,采用了性能和功耗更为均衡的A53核,巧妙跳过了手机上的“火炉”A57这一做法后来被称为“四两拨千斤”。

2015年11月,麒麟950发布,业界率先导入16 nm FinFET(鳍式场效应晶体管)顶尖工艺,这是中国半导体厂商第一次站上了半导体工艺的最前沿。其研发历程异常艰险,后文详述。

2016年4月,麒麟650发布。这是业界首款在中档位手机SoC上导入16 nm FinFet顶尖工艺的芯片,并且实现了全模,即补齐了自研CDMA2000(码分多址,3G移动通讯标准之一,下文简称CDMA)通信制式。16nm顶尖工艺支撑麒麟650更长的生命周期,成为海思首款出货超亿套的手机SoC芯片。这一做法后来被称为“神来一笔”。

06

组织架构的调整

Paul是无线终端芯片部门主管。在麒麟910和920“拧毛巾”开发的过程中,作为事业部主管,他面临一系列难题—一不仅是技术的难题,还有团队融合的难题。他既要融合4G Modem和2G/3G Modem团队,还要融合K3团队。他们原本都各自拥有端到端交付能力,都有芯片、物理层、架构、解决方案、测试等各模块。这在以前各自独立交付的环境下是有效的,但现在要做SoC的开发,这样的组织架构就有很多问题。

为此,在海思领导的支持和帮助下,Paul进行了组织架构的调整,把这种各自端到端的交付组织,改为按模块分别交付的组织——芯片、物理层、架构属于公共部门,服务于麒麟和巴龙解决方案部,最终由麒麟和巴龙解决方案部交付给终端公司。

多年后,回顾此次组织架构的调整,大家开玩笑地做了个比喻:一家食品铺子里有几个组,分别负责制作包子、烧麦、饺子等,每个组都有做馅、做皮、捏在一起等完整的能力。现在,重新分组,每个组分别负责生火、做馅、做皮等,最终交给另外的组捏在一起,再卖给消费者。每个组把自己所负责的那项能力做精,最终的产品质量大大提升,受到消费者的喜爱。这种组织架构一直沿用到现在。

07

补齐通信制式:TD-S CDMA和CDMA,每次都掉一层皮

麒麟910是首款SoC,其不仅要融合AP和Modem,即K3v2和巴龙710(4G Modem)、巴龙2G/3 G Modem,还必须支持中国移动的TD-SCDMA制式(时分一同步码分多址,3G移动通讯标准之一,下文简称TD-S)TDS标准没有国际大厂商投入,只有国内厂商投入,产业链各个环节,仪表、设备、标准的细节、产业化等,都不完备,困难很大。

公司几经讨论,最终决定与中国一家早期研究TDS制式的高校合作,从其获得授权。但拿过来之后,发现存有大量问题,诸如代码混乱,时序变化,测试力度不够,商用困难,出问题很难定位,即使定位到,也很难修改。公司花了很大代价开发和稳定这个版本。TDS制式的研发负责人Andrew说:2013-—2014年的冬天,TDS团队几乎所有的人都去做测试工作了。大家开着自己的私家车,一遍一遍地跑外场,做测试。外面下着大雪,大家边开车,一边拨打测试电话。现在想想,还真挺危险的。

从2013年下半年,一直到2014年第二季度,中间经历了长达9个月的艰难历程。2013年底,Paul临危受命带领大家攻关,Jim是攻关组长, Andrew是解决方案软件组长,几乎每天晚上9点大家都会开晚例会,分析问题,分工解决问题,通常开完会都十点多了,会后还要继续工作。

2013年底,一个寒冷的冬夜,Paul出差北京开完攻关会议回到酒店,接到一个同事电话,请他参加他们部门的年会,Paul婉拒了。因为他实在太忙了,摆在他面前的难题太多了。这个身经百战、战果累累、年底这段时间本应拿奖拿到手软的部门主管,此时此刻却几乎要哭出来了。他在想:“我为什么要来负责这块业务?我能做好吗?”

来自内部和外部的压力很大,兄弟们工作很艰苦。很可惜有的人离职了,包括一些骨干。但大部分人仍然在坚持,这些兄弟在这个领域默默坚持了近10年,这是他们大好青春的10年。Paul曾经问过这些兄弟,为什么能一直坚持。他们说,没有为什么,既然定了目标,就一定要做出来。Paul说,有这群兄弟在,心中就有目标,坚持下去,一定能取得突破。

到2014年四五月份,TD-S的问题终于解决,搭载的手机陆续量产。麒麟910背水一战、九死一生的攻关历程,成为大家刻骨铭心的回忆。麒麟手机SoC从910开始,到620、920、930,在通信制式上一直稳定,但还缺一个制式—一麒麟芯片一直不支持中国电信的CDMA制式。这个问题随着全网通手机的普及显得越来越严重。

那时的华为全网通手机,要么采用其他厂商的SoC,要么釆用麒麟芯片加外挂其他厂商的 CDMA Modem。在要不要自研CDMA制式芯片这个问题上,大家有所争论。有的专家认为,随着4G的普及,CDMA可能将逐渐被淘汰,没有必要去开发一款产品来支持将被淘汰的制式。但也有很多专家认为,即使CDMA本身不演进了,但其还会存在一段时间,全网通一定是大势所趋麒麟如果没有全模芯片,华为手机的竞争力将受到很大影响。最终,大家达成一致:集成CDMA制式。

然而,在是采用其他厂商的授权的CDMA还是自研的问题上大家又开始了争论。Jim是CDMA开发主管,鉴于先前TDS的痛苦经历,他对领导Paul说:“你不要从外面买CDMA。我一定能做出来。”

考虑到时间进度,公司还是和其他CDMA厂商开展了谈判决定从其获得授权。坊间传说,双方基本谈成,但在最后一刻对方狮子大开口,海思决定不再购买其授权了。于是,开发CDMA的任务责无旁贷地落到Jim身上,2014年,他带领团队加紧攻关,终于完成CDMA制式。CDMA的研发,华为公司坚实的通信功底起到巨大作用。

架构主管Jary说:由于华为基站早就实现了CDMA制式,所以从网络侧抽调了若干专家,一起攻关CDMA终端芯片。但这中间也遇到了很多困难,例如,Jim曾经发现RF芯片锁死,大约每200台手机就有一两台出现这种情况,很难定位问题。他和团队以及RF的同事,一行一行地检查代码,做压力测试,终于定位到问题并解决。最终CDMA制式在麒麟650上成功交付,也为后面所有的麒麟芯片的全网通制式扫清了障碍。此后麒麟950、960、970、980等在通信规格和性能上一直高歌猛进,并延续到5G时代。

08

麒麟950:跨越自我,从鲁莽时代到业界Tier1

2015年秋天,史上最牛的跨越之作麒麟950即将量产。作为麒麟解决方案的主管,King要对套片解决方案端到端量产负责,他这时候有点焦头烂额。他给海思领导 Julian写了一个邮件,列出麒麟950的若干问题和风险,包括SoC、PMU、RF等。他说:“麒麟950有可能重演当年梅里的风险。他的邮件发出去没一分钟,就收到了 Julian的回复:“你赶紧去产线上盯着。问题不解决不要回来!”King看着邮件,脑子一片空白,这时电话响了,Julian说:“你走了没?”

为什么说麒麟950是一款超越之作?是因为它在很多方面实现了很大的跨越,不仅超越了自己,而且超越了同时期的业界其他旗舰。比如:

1、第一次站上了半导体工艺的最前沿,导入16 nm FinFET顶尖工艺。

2、首次自研ISP(图像信号处理)并商用,确定了华为手机在拍照领域的领导地位。

3、首次商用ARM最新CPU、GPU(图形处理器):麒麟950首次商用 ARM Cortex A72 CPU和 ARM Mali T880 GPU,在性能上实现了新的突破。

4、首次自研DDR(双倍速率同步动态随机存储器)Phy(端口物理层)并商用,同时支持已经成熟的 LPDDR3(低功耗内存技术)和标准还未完全确定的 LPDDR4,支撑华为手机当前和未来的成功。

5、首次商用自研PMU:新的GIC500(通用中断控制器)、新系统总线以及FBC(帧缓冲压缩)技术应用,使得麒麟950具备更强大的硬件性能基础。

6、Modem算法的优化:基于对业务的理解和行业标杆的分析,海思把 Modem的算法和物理层识别为关键业务,围绕算法设计和工程化能力建设的主线,通过不断优化整合,分层能力建设,逐步确定了在 Modem上稳固的领先优势。

7、新一代自研射频芯片Hi6362,支持更广泛的全球漫游。

8、新组织架构的首次全方位练兵。一款手机SoC芯片,通常是提前2~3年开始研发,从规划、设计到生产,环环相扣,每个环节都很重要。2014年中,无线终端芯片业务部完成组织架构调整,可以说麒麟950是组织结构优化调整后第一个真正意义上的芯片团队和解决方案团队通力配合研发出的产品版本。新的组织架构需要磨合,到底是否有效,产品说了算。

2015年春天,麒麟950回片,团队在上海举办了开工会,海思总裁何庭波在开工会上给大家总结了十二个字:夯实基础、踩稳节奏、开放创新。每个模块的负责人都立下了“军令状”,团队开足马力向“跨越”这个目标挺进。但到了下半年,因为麒麟950的高规格,全新的工艺、处理器、模拟IP(知识产权)、PMU、RF,导致套片量产过程中出现了种问题,工艺和功能问题耦合在一起,DDR误bit(比特,二进制制位,信息的最小单位)问题、供应商模拟IP的低概率问题、PMU的应力不足的die crack(芯片裂纹)问题、RF的ESD(静电阻抗器)问题,每个问题都非常棘手。

最要命的是,那时距离手机产品上市只有2个月了。这才出现了前文King所说的:“麒麟950有可能重演当年梅里的风险。”这话并不过分。庆幸的是,这时候的团队已经不是梅里时的团队。海思领导Julian亲自带头连夜跑到供应商处解决问题,Paul也身先士卒和大家一起讨论解决方案,King立即赶赴产线,在一线集合海思SoC、RF、模拟封装、可靠性、产品线等各方面专家集中攻关两个月。

在所有兄弟的共同努力下,终于麒麟950得以成功量产。那么这些问题是如何解决的?先看看麒麟950上惊心动魄的RF问题。麒麟950配套的RF芯片是H6362,海思从3G时代自研RF芯片,到4G时代已经基本追平了业界主流水平,Hi6362已经是第二代4GRF芯片,大家信心满满。2015年秋天,那时Mate8手机已经投入试产,大家在紧锣密鼓地测试中。一天,由于被测试手机比较多,检测人员无意中发现两台Mate 8手机叠放在一起信号会立刻失效。这太恐怖了。

RF专家Orion立即带领团队进行问题定位,经过两个多月的攻关,终于发现是ESD出了问题,也就是RF芯片生产过程中少了一层膜(mask),这个失误会直接影响到RF芯片的可靠性,最终导致芯片无法正常工作。发现问题的当天下午,开发团队第时间奔赴RF的代工厂,与对方专家一起看版图,最终在凌晨3点半发现版图调错的问题,并对另外一个量产版本做了检查,幸运的是这个版本是正确的。完成这些工作已是第二天早上6点,大家都如释重负,两个月来的攻关终于尘埃落定了。旧版本全部报废,开足产能生产新版本。

到这里,问题似乎解决了。但一个更棘手的问题摆在大家面前:那时已经生产出来6万台Mate 8手机,怎么办?按照测试人员的说法,只有两台手机靠在一起,才会出现问题,这种概率比较小。从这个角度来说,这些手机可以销售。而如果出问题,则会直接影响到华为手机的口碑。考虑到如果这些手机全部报废,会出现价值几亿元的损失,大家不知道怎么办才好。最终海思总裁何庭波果断决策——6万台有问题的手机直接报废,因为华为手机的品质和消费者的信赖是公司生命之本。

麒麟950上除了RF问题,还有前面提到的工艺问题、ISP问题等,都一一得到解决。这些内容我们后面分别详细介绍。

2016年6月20日,任总给麒麟950(含巴龙)研发团队颁发了总裁嘉奖令。2016年6月28日,海思举办主题为“跨越”的庆功会,徐直军、余承东、何刚、李小龙等均到场,祝贺麒麟950的成功,并对未来的麒麟提出了更高的希望。

无线终端芯片业务部主管Paul说:“别人说我们是奇迹,每一步都很成功,其实每个成功的背后都是大家的艰辛付出。我们是一群普通人,却做出了一流的产品。这其中,目标导向的价值观起到很大作用,大家力出一孔,艰苦奋斗,致力于把事情做好。不服输,长期坚持朝目标努力。新征程,现在,我们要面向未来。”

09

先进工艺:提前布局决战巅峰

2013年1月个寒冷冬日的午后,Leo和几位领导和同事一起去拜访台积电,目的是希望和对方合作开展业界顶尖的16 nm FinFET工艺。当时的海思在工艺上并不领先;规模上,在台积电的客户清单上排名50位左右。所以,导入16nm,这几乎就是“ mission impossible”(不可能完成的任务)。这个任务能完成吗?

作为一家半导体设计公司,海思对先进工艺的追求是锲而不舍的,而先进工艺又是最难的。按照提前2~3年立项的时间节奏,2013年,海思就开始规划麒麟950,工艺是一项重要规格。那时手机芯片的主流制造工艺是28nm。对于2年后要上市的麒麟950,海思如何选择?

10

为什么选择16 nm FinFET?

持续数十年的 Bulk cmos(体效应互补金属氧化物半导体工艺)工艺技术在20nm走到尽头,加州大学伯克利分校胡正明教授在20年前就开始探索并发明的基于立体型结构的 FinFET晶体管技术和基于SOI的超薄绝缘层上硅体技术的UTB-SOI(超薄通道绝缘体上硅)技术,也就是行业内常说的FD-SOI(全耗尽绝缘体上硅)晶体管技术,能解决半导体制程到25nm后的制造和功耗难题,成为半导体产业仅有的两个重要选择。因为他的两个重要发明,摩尔定律在今天得以再续传奇。

但实际上,从胡教授在20世纪90年代发明 FinFET技术,到2015年 FinFET技术量产,这中间却用了近20年的时间。

海思很早就意识到了手机芯片工艺的技术极限,2012年底,海思总裁何庭波拜访胡正明教授,向其请教 FinFET技术在16nm工艺上的可实现性,做出了通过技术创新突破瓶颈的选择:跳过20nm,开始了16 nm FinFET+工艺的技术突破之旅。在两年后的2015年,在麒麟950发布会上,胡正明教授谈16 nm FinFET技术的视频,令所有与会者震撼。这是后话。

11

台积电:为什么要和海思在顶尖工艺上合作?

虽然做出了选择16 nm FinFet+工艺的决定,但要真正实现商用却面临着巨大的难题和挑战。

首先是16 nm FinFET工艺的生产和制造问题,当时在手机芯片制造领域拥有 FinFET技术的芯片制造商台积电(TSMC),对芯片设计厂商的技术水平、技术积累、商用经验和商用规模都有着极高的要求。

2013年初的海思,手机芯片的量确实不大(麒麟910是2013年下半年才商用),更没有后来成为爆款的麒麟920,所以在台积电那里根本算不上大客户。在先进工艺上海思又一直处于跟随的状态,并没有率先商用顶尖工艺的经验。所以,当时几乎看不到台积电与海思在顶尖工艺上合作的可能性。

2013年1月,一个寒冷的午后,海思总裁何庭波带领骨干成员去台湾拜会了时任台积电轮值CEO刘德音先生,Leo是其中一员。他回忆道:到达台湾的当天,何庭波不巧生病了,发着高烧,但她还是坚持第一时间去台积电拜访。正是这次重要的会面,促成了双方在16nm FinFET上的战略合作。

海思作为大陆领先的芯片设计厂商,在台积电有着优秀的量产纪录,和台积电有着良好的合作关系,更重要的是具有清晰的战略思路。那时,华为手机已经决定做自有品牌高端手机,而其他领先芯片设计公司大多选择了在其他代工厂生产,台积电迫切需要一个与之抗衡的大客户这个大客户很可能就是海思。可以说,台积电看到了海思芯片在华为手机未来全球版图规划中的重要性,深刻地意识到此次合作对于双方的战略意义,于是选择海思作为16nm全球首发芯片合作伙伴,麒麟950终于拔得16nm头筹。

同样是16nm,麒麟950还做了几次切换:先是16nm LL(能效比较好),后来切换到GL(性能比较好),最后确定 FinFET Plus。芯片主管 William说:这无异于一辆汽车在飞驰中换引擎,开发工作量非常大。2013年10月21日立项,在2014年底投片之前,大家都异常焦虑。果然,一堆问题冒出来了。)

12

首款自研 LPDDR:为什么要走钢丝?

先进的工艺总是伴随着很多工程化的难题,16 nm FinFEE新工艺要求单芯片集成的晶体管数目从20亿个增加到30亿个,金属互连的难度成倍提升;基于3D结构的晶体管,工艺复杂度大幅增加。

与此同时,麒麟950还首次搭载自研的 LPDDR,这是当时最有挑战性的技术方案之一。在选择更有竞争力但技术风险更大的LPDDR4,还是技术成熟风险更小的 LPDDR3的问题上,当时内部意见很不统一。经过五次反复,最终决定两代都做。同时兼容LPRRD3和 LPDDR4,业界没有可以参考的经验,甚至第一次面对定义封装的问题,首款、自研,这些字眼里充满了风险,负责芯片开发的高层主管 George亲自和 William带了30人的团队,一起和DDR研发主管Leo的团队检验设计,每天看代码、看设计。期间出现的警告log(日志)多达几万条,大家就一条一条过,每天都忙到夜里十一点,有同事甚至累到病倒。当时还赶上春节,大家也都基本没有休息,时刻在担心最终的效果。Leo说:那时候简直像在走钢丝。

庆幸的是钢丝终于走过去了。回过头来想,同时实现LPDDR3和LPDR4是多么英明的决策: LPDDR3已经成熟,可以快速调试和部署,争取宝贵的时间窗口,不影响整体芯片的开发,并且可以支撑中低端手机; LPDDR4面向未来,增强竞争力。

此外,团队还解决了铜污染、MIM(金属注射成形)技术等各种问题。每个问题也是艰苦攻关才得以解决。

13

麒麟950:终于站上工艺最前沿,这是整个中国半导体产业的创举和骄傲

最终,华为在16 nm FinFET工艺上,在2014年4月实现业界首次投片——在海思的网络处理器Phosphor 660(它就是现在的鲲鹏920的前身)上,2015年1月实现量产投片——在麒麟950上,并于10月实现量产发货。麒麟950终于实现了16 nm FinFeT工艺的率先商用。从 FinFET技术概念的提出,到今天16 nm FinFET技术在华为麒麟芯片得到商用,20年的过程艰难又曲折。

自此,海思开启工艺领先之路。麒麟960第一次在封装工艺上站上业界最前沿,并且其安全性达到了金融级安全标准。2016年11月,麒麟960荣膺第三届世界互联网大会“领先科技成果”。麒麟970采用了当时业界最顶尖的10nm工艺。但更重要的是,麒麟970首次在手机SoC中集成了专用NPU(嵌入式神经网络处理器),开启了端侧AI行业先河,其难度也是非常大的。麒麟980是业界首款7nm工艺的手机SoC芯片。7nm相当于70个原子直径,逼近了硅基半导体工艺的物理极限,麒麟980实现了在针尖上翩翩起舞。

14

ISP:全球人才布局,麒麟拍照如何做到从追赶到一骑绝尘?

2013年夏天的一个周末,在法国海边小城尼斯,Joe和8位“居家好男人”一起“组团”去家具城买家具,他们买了若干桌子、椅子、柜子等,用自己的私家车运到空空如也的办公室,卸货,组装,忙得不亦乐乎。终于,他们拥有了像样的办公环境。

那天正好是中国的传统节日端午节。Joe去超市给法国同事们买来了粽子,想让他们尝尝中国的传统美味。法国同事们对中国文化和美食非常感兴趣,让Joe觉得好笑又温暖的是,因为是第一次吃粽子,他们不知道粽子皮能不能吃。作为图像图形学的科学家, Stephen解决这个问题的办法是:试下。他咬了一口,觉得粽子皮太硬了,于是得出结论:应该不能吃。

他们是麒麟芯片拍照团队的成员。

在麒麟950之前,华为没有自研的ISP。早在2011年,就有人反映华为手机拍照功能不尽如人意。在一次高层会议上,任总问海思总裁何庭波:“为什么华为手机的拍照不强?”何庭波说:我们缺乏自研ISP。”任总说:“为什么不投资做自研ISP?”何庭波说:“没钱。”任总说:“没人投,我投!”

经过多方论证和准备,2012年,麒麟团队终于启动了自研ISP的立项,商用目标是2015年的麒麟950及Mate 8手机。随后,ISP团队、3A(自动对焦、自动曝光、自动白平衡)算法团队和PQ(图像质量)团队开始筹备和构建,但还是缺人,缺专家。

2012年,TI解散了他们的ISP团队OMAP(TI的开放式多媒体应用平台)听到这个消息,负责芯片研发的老大 George第一时间飞到海外,希望将Ti的ISP团队吸纳过来。可是,他见了OMAP在全球不同城市的人,都没有收获,很多优秀的人才要么已经被其他公司抢走,要么就是不符合海思的要求。George很失望。

正在这时,一位朋友告诉他,TI在法国尼斯还有个团队,可以去碰碰运气。于是 George立即飞往尼斯。这次运气不错, George与温文尔雅、思维缜密的Stephen相见恨晚,力邀其加盟。自此,ISP团队正式组建,除尼斯外,还有北京、深圳、上海、日本等团队,大约100多人,全力投入ISP技术攻关。Robin和Joe就是那个时候从其他团队抽调过来的, Robin担任ISP芯片团队主管,Joe是SE(系统工程师)。

Joe于2013年5月去尼斯,与Stephen等8位同事并肩作战。刚开始的时候,没有办公室。大家在一个公共写字楼里租了一间大约20平方米的会议室,里面只有一张会议桌,9位同事围着这张桌子办公。没有网络,大家只能靠手机的无线信号网络工作。

这种情况持续了一个半月左右,办公地点终于定了下来,有了自已独立的办公室,但里面什么都没有,也没有行政人员帮忙。按照当地的办事流程,这些都配齐,可能还要两三个月,于是就出现了文章开头所描述的场景:大家干脆自己去家具城买办公家具,自己动手组装。这期间,Joe与尼斯团队一起经历了跨国工作的磨合期——大家来自不同的国家,面临语言障碍和文化差异,粽子皮能不能吃,只是文化差异的一个小缩影。最终,大家克服语言障碍、团队熟悉度不足、工作习惯和环境差异等问题,形成了协同、高效的战斗力和良性的工作氛围。

大家都很关注自研ISP的成像效果,不同部门的人也都在积极配合。Robin回忆,当时华为终端部门对麒麟自研ISP非常重视,硬工部老大亲自坐在电脑前,一张一张地对比图片成片质量。秘书们义务帮忙,进行图片盲测,对麒麟芯片以及其他手机拍摄的图片进行对比和排序,发现有不好的,及时返回给算法改进。

用户拍照体验好不好,除了ISP芯片本身,软件和算法解决方案也至关重要。Robin和Joe的芯片团队已工作了近两年,而大量的解决方案软件和算法亟待开发或成熟,时间已非常紧张。2015年4月,Roc加入拍照团队,担任麒麟拍照解决方案研发主管,那时距离自研ISP回片时间不到一个月,距离首产品Mate 8手机商用也不到半年。他紧急整合解决方案软件、算法、PQ团队,与ISP芯片、终端、2012媒体工程部等兄弟团队集中队伍、协同作战。开始时拍照的体验很不理想,功耗、性能、基础效果体验都大幅度落后竞品,他带领联合团队持续开发、攻关和优化,在Mate8上市前的半年时间里,经常每天晚上11点开晚例会,每月休整1~2天,终于功耗、性能、基础效果体验的问题都陆续得到解决,拍照体验的竞争力开始浮出水面。

经过3年多的艰难攻关,在2015年推出的麒麟950上,海思第一代自研ISP正式亮相。首产品即商用,这在海思历史上还是很少见的,但这次自研ISP不负众望,支持14bit双ISP,吞吐率性能提升4倍,高达960 MPixel/s(每秒百万像素),让Mate 8手机拍照效果实现了大幅提升。但Roc的团队几乎一口气都没有歇,立即投入P9的拍照能力的攻关。它们两个最大的不同是:Mate8只考虑单摄像头,而P9是双摄像头,所以需要修改架构。

终于,到第二年第一季度,自研ISP技术与徕卡双镜头“双剑合璧”,助力P9、P9 Plus成为2016年的明星手机产品,黑白彩色双摄开启了华为手机拍照优势的新篇章。当时一家著名分析机构的首席分析师如此评价麒麟自研ISP:“这比买商用ISP肯定更贵,但值得。”

事实证明一切,麒麟960拍照性能继续提升。麒麟970不仅ISP性能得到提升,还开创性地融入了AI,搭载麒麟970的华为Mate10和P20手机都分别冲上了 DXOMark(法国知名图像处理软件DO公司推出的成像质量排行榜)榜单第一;而P20 pro更是在 DXOMark榜单第一的位置上稳居一年多,直到被后来的搭载麒麟980的P30 pro超越。

唯坚持,得突破。选择最难走的道路,看最美的风景,这需要智慧和勇气,更需要巨大的努力和付出。每一代麒麟的演进,都“太难了”,但即使是在最难的时刻,团队也没有放弃对创新的追求。麒麟为什么能成功?是因为大家长期坚持追求三个词Focus(聚焦)、 Persevere(坚持)、 Breakthrough(突破)。

注: 文中 Julian、Paul、 George、 William、King、Sean、Benjamin、 Orion、Jerry、Jim、 Andrew、 Robin、 James、Jary、Joe、Leo、Roc等均为化名。他们可能不是特定的某个人而是这么多年来矢志奋斗的麒麟和巴龙团队的缩影。

本文摘自华为大学编著的《熵减:华为活力之源》。初稿由林江艳主笔,陶玉柳、董国立、欧阳飞、田书丽等进行了补充。

打开APP阅读更多精彩内容