人工智能公司的“操作系统”之战

某种意义上说,过往科技行业的竞争是操作系统的竞争,谁拥有了操作系统的话语权,谁就掌握了生态、开发者以

某种意义上说,过往科技行业的竞争是操作系统的竞争,谁拥有了操作系统的话语权,谁就掌握了生态、开发者以及应用。从 PC 到智能手机,掌握操作系统的几家美国公司不仅成为这个星球上最赚钱公司,还紧紧握着全球科技发展的「命脉」。而在 AI 时代,深度学习正在推动人工智能进入工业大生产阶段,深度学习框架则是智能时代的操作系统。

近几年来,深度学习的研究和应用的热潮持续高涨,各种开源深度学习框架层出不穷,包括TensorFlow、Keras、MXNet、PyTorch、CNTK、Theano、Caffe、DeepLearning4、Neon 等。谷歌、微软、亚马逊、Facebook等商业巨头都加入了这场深度学习框架大战,国内的百度、旷视也在研发使用自主开发的深度学习框架。

在当下工业革命和人工智能发展的大背景下,深度学习的通用性特点,加上深度学习框架及平台的发展,正在推动人工智能标准化、自动化和模块化,进入工业大生产阶段,有望推动人工智能产业落地进入“井喷期”。我们正身处人工智能为核心驱动力量的第四次工业革命浪潮之中,人工智能正将人类社会带入智能时代。

在智能时代,深度学习框架起到了承上启下的作用,下接芯片、大型计算机系统,上承各种业务模型、行业应用。因此,它是“智能时代的操作系统”。

以百度PaddlePaddle为例,作为国内完整、全套的深度学习平台,PaddlePaddle包括核心框架、工具组件和服务平台三大部分。在核心框架层面,它可以提供开发、训练和预测一整套的技术能力;在此之上,又提供了包括视觉、自然语言等在内的丰富模型,形成完整的模型库,通过模块化的方式提供给使用者。

除此以外,适应工业大生产阶段的“标准化、自动化和模块化”,PaddlePaddle还提供了包括迁移学习、强化学习、自动化网络结构设计、训练可视化工具、弹性深度学习计算等在内的工具组件。而在服务平台层面,PaddlePaddle则提供了零基础定制化训练和服务平台EasyDL和一站式开发平台AIStudio。这一整套的框架和服务,可以帮助广大开发者和企业利用工具化、平台化的方式,进一步降低深度学习应用门槛,加速推动产业智能化变革。

在深度学习框架领域,国外具有很大的领先优势。无论是谷歌、亚马逊、微软、IBM 等互联网巨头,还是美国各大科研院所,都为开源世界贡献了品类繁多的机器学习工具。当前比较主流的当属TensorFlow、Keras、MXNet、PyTorch。

TensorFlow是Google Brain基于DistBelief进行研发的第二代人工智能学习系统,其命名来源于本身的运行原理,于2015年11月9日在Apache 2.0开源许可证下发布,并于2017年12月份预发布动态图机制Eager Execution;Keras是一个用Python编写的开源神经网络库,它能够在TensorFlow,CNTK,Theano或MXNet上运行,旨在实现深度神经网络的快速实验,它专注于用户友好,模块化和可扩展性,其主要作者和维护者是Google工程师FrançoisChollet。

MXNet是DMLC(Distributed Machine Learning Community)开发的一款开源的、轻量级、可移植的、灵活的深度学习库,它让用户可以混合使用符号编程模式和指令式编程模式来最大化效率和灵活性,目前已经是AWS官方推荐的深度学习框架,其很多作者都是中国人;PyTorch是Facebook于2017年1月18日发布的python端的开源的深度学习库,基于Torch,可支持动态计算图,提供很好的灵活性。在今年(2018年)五月份的开发者大会上,Facebook宣布实现PyTorch与Caffe2无缝结合的PyTorch1.0版本将马上到来。

面对国外深度学习框架的来势汹汹,所幸的是,国内还是有公司意识到了在深度学习上高度依赖国外公司所潜在的风险,从而埋下了一招先手棋,避免了我国AI技术在关键时刻被国外公司卡脖子、打七寸。

除了百度之外,2018年10月10日,华为在上海全联接大会上首次发布华为AI战略与全栈全场景AI解决方案就包括MindSpore深度学习框架;2018年11月,阿里巴巴宣布,其大数据营销平台阿里妈妈将把其应用于自身广告业务的算法框架XDL(X-Deep Learning)进行开源,正式加入开源学习框架的激烈竞争;2018年6月28日,小米首席架构师、人工智能与云平台副总裁崔宝秋宣布正式开源小米自研的移动端深度学习框架(MACE) Mobile AI Compute Engine。

而人工智能领军企业旷视早在2014年就开始自主研发深度学习平台Brain++,虽然还未开源,但是是所有创业公司中唯一一家自研深度学习引擎并且全员使用的公司。到现在为止,旷视全员使用的版本已经是8.0版本,颇为值得关注。

旷视Brain++是训练算法的核心深度学习框架,可帮助算法训练及模型改进过程流程化,减少人员参与而不牺牲训练质量,大幅提高算法训练效率。

根据灼识咨询报告,旷视是全球为数不多的拥有自研深度学习框架的公司(包括Alphabet及Facebook等科技巨头)之一。它具备以下独特优势:

针对视觉任务定制化优化。Brain++深度学习框架针对视觉任务做出了定制化的优化,使处理图像与影像更高效。经过优化的Brain++特别适合大量图像和视频训练,以及完成复杂的视觉任务,如图像分类、物体检测、物体╱场景分割、影像分析等。

配备AutoML技术。Brain++将深度神经网络设计、参数调整及设备适配等过程自动化,显著降低人力成本并大幅提高开发效率,构建出一条不断自我改进、不断变得更加高效的半自动的算法开发生产线。

强大的多任务及多用户调度能力。Brain++可智能地调度信息技术基础设施的计算能力,可以支持数百名研究人员同时在数千个GPU芯片上执行逾万个训练任务,从而显著提高训练效率。

得益于其高效及良好的适应性,旷视研发人员及软件工程师全员可直接使用Brain++搭建深度学习模型并训练算法,而无需依赖第三方开发的深度学习框架。此外,拥有自研的深度学习框架还使旷视可以面向其算法训练及解决方案开发过程中快速进行定制化的优化。

打开APP阅读更多精彩内容