李彦宏的语音战争

小度 " 坐二望一 ",语音一战,李彦宏正迎来 AI 中国时刻。 李彦宏是什么时候爱上小度的? 没人

小度 " 坐二望一 ",语音一战,李彦宏正迎来 AI 中国时刻。

李彦宏是什么时候爱上小度的?

没人能准确说出个时间点,只是隐约记得,在食堂看到李彦宏吃饭,他全程都用语音技术和小度聊天。

几天前,知名市场调研机构 Canalys 发布了 2019 年第二季度全球智能音箱出货量报告,小度第二季度出货量 450 万台,首次超越 Google 位列全球第二,创造了中国智能音箱季度出货量最佳排名。

李彦宏对小度一直是偏爱的。今年 AI 开发者大会上,带着熟悉的 Robin 式笑容,身着白色衬衫的李彦宏在台上一边与小度聊天,一边与场下观众亲密互动," 能听懂,会应答 " 的小度赢得了场下观众的阵阵掌声。

(百度 AI 开发者大会现场)

台上的李彦宏气定神闲,台下的技术人员一身冷汗。现场噪音很多,小度几次唤醒都不够灵敏," 翻车 " 这种事在科技圈不是没有发生过,一向以技术见长的百度如果在现场演示时出了错,砸的可是百度的金字招牌。

没有人敢冒这个险,除了李彦宏。从首款带屏智能音箱 " 小度在家 " 发布,到全双工免唤醒的小度助手 5.0 更新,每一次小度亮相,李彦宏都坚定地站在台前,充当小度最帅的代言人。

得益于李彦宏在人工智能领域的长期思考,百度一直对 AI 拥有着最敏锐的嗅觉。

今年重庆智博会上,李彦宏提到,人工智能已经从过去津津乐道的酷炫效果变成了一个社会共识,上升为一个国家战略。一个明显的变化是,人工智能 " 脱虚向实 " 逐步渗透到了各产业领域,真正融入了人们的日常生活。

贝恩此前出具的一份报告中称,未来人机交互方式中,语音交互会占到 30% 左右。对于被视为 " 中国 AI 名片 " 的百度来说,语音技术是智能音箱的灵魂,也是百度一块必须抢夺的高地。

这场战役,李彦宏不能输。

语音大战背后

说起来,语音交互的发展历史已经有差不多近百年了,自计算机诞生之初,人类就在探究语音识别,想要实现机器与人类的交流对话,不过仅 " 让机器正确识别人类说了什么 " 这一步,就走了几十年。

直到 90 年代 IBM 的 viavoice,Microsoft 的 Whisper 等一众语音识别产品相继问世,识别人类语音的正确率才算有了重大突破,智能语音也才具有了一定的商用价值。

近几年在人工智能技术的加持下,智能语音的发展开始呈火箭般急速蹿升,仅过去一年,语音技能交互次数就提升近 2000 倍,语音技能增长 800%,技能类型增长 126%。

(小度智能音箱 Play)

近两年语音大战格外焦灼,但早在六年前,李彦宏就已布下了局。

2013 年,在大家都没感知到语音技术的重要性时,他就提出 " 语音技术会根本性地改变人们使用互联网和手机的方式,人机对话最近几年会很快进入实用阶段 ",并花费百万美元重金奖励中文语音识别引擎团队。

同年,也就是 2014 年,亚马逊的 Echo 拉开了智能音箱这场大战的序幕,很快阿里、百度、小米、华为等众多国内科技巨头纷纷入局,天猫精灵、小度智能音箱、小爱同学、小艺 …… 从无人问津到 " 千箱大战 ",智能音箱四年销量翻了近千倍。

市场急速升温,入场玩家更是拼杀激烈,拿出 " 不破楼兰终不还 " 的气势重金补贴,阿里将 499 的天猫精灵直接降到 99 元,百度以 299 元的小度在家试水后又推出了 89 元的小度智能音箱,李彦宏为此投入了上亿元的补贴费用。

(小度人工智能音箱 1S)

为何要如此 " 下血本 " 抢夺市场?很简单,五年过去,智能音箱早已不仅是音箱了,它背后展现的是一个企业的 AI 能力,更承载着互联网巨头抢占语音交互时代流量入口的深厚期待。

智能音箱的火爆,映射的正是移动互联网向 AI 时代转变的轨迹。

百度 Q2 财报最新数据显示,小度累计激活设备数已经超过 4 亿台,同比增长 4.5 倍,每月语音查询超过 36 亿次,同比增长 7.5 倍。一个能听懂你的意思,并按照你的要求为你提供服务的智能助理成为越来越多人想拥有的伙伴。

研究公司 Ovum 预测称,到 2021 年,地球上语音助手的数量会和人类一样多,人们会越来越倾向于向语音助手寻求情感助。

这种需求也直接转化为了金钱,单就智能对话市场来说,2018-2022 年复合增长率为 53.2%,2022 年市场支出规模将达 270.5 亿元。

今年美国投资机构 Mangrove Capital Partners 发布的 2019 年语音技术报告中也预测,到 2025 年,语音经济的规模将超过移动应用达到 1 万亿美元,语音会为新一代科技公司创造巨大的商业价值。

事实证明,李彦宏赌对了。

语音战争之上

在李彦宏的带领下,2018 年百度凭借实时语音翻译技术及服务以 " 关键玩家 " 的身份入选了 MIT " 全球十大突破技术 ",成为唯一连续三年入选该技术榜单的中国公司。

今年年初,百度公布了在语音领域的四项重大技术突破,其中在线语音领域全球首创的流式多级的截断注意力模型(SMLTA)被业界人士称为 " 登月计划 "。

语音战争之上,百度枕戈待旦。

今年 3 月搭载百度 DuerOS 系统的 " 小度在家 " 首发时,李彦宏曾说," 小度在家就是由 AI 催生的新产品形态,是中国市场革命性的 AI 新物种,也将打开新的应用场景。"

4 个月后李彦宏就对小度完成了一次 " 自我革命 "。百度 AI 开发者大会上演示的小度 " 全双工免唤醒 " 功能,不仅实现了 " 一次唤醒,多轮交互 ",还能在与他人对话的同时互不干扰地实现人机交互,无限对话和全双工刷新了人机交互的上限。

除了全双工免唤醒功能,小度助手 5.0 还首创了家庭信息流和行业领先的家庭通讯与通知功能,可以为用户提供 24 小时个性化、人性化的智能服务。

三年前," 小度 " 还叫 " 度秘 ",一个用起来有点 " 僵硬 " 的语音助手,三年后," 度秘 " 变身 " 小度 ",从 1.0 迭代到了 5.0,蜕变为既整合了百度 AI 语音和图像技术,又能赋能第三方的 " 开放平台 "。

为了大幅提高深度语音识别技术的准确率,尤其是抗噪能力,百度技术团队收集了近 7000 个小时的语料数据,在样本中加入了十五种背景噪音,比如餐厅、汽车、地铁等,将样本扩张到了 10000 小时,然后让系统在噪音中去识别这些语音信息。

这还仅是识别技术抗噪能力的测试,还有语音合成,语音交互,神经网络架构等等,每一项技术研发背后都是团队一遍遍的数据收集、测验、分析、改进 …… 不厌其烦,可是这些,外界根本看不到,甚至百度很多内部员工也不甚了解,因为技术大牛们都泡在实验室里闷声做事,也不说话,只有对外发布新产品的时候,大家才意识到:哦,技术又更新了。

三年,1095 天,五次迭代升级,数不清的技术打磨,即便有了先发优势,李彦宏也从未放缓前行的脚步。

(小度家族)

今年一季度百度业绩首次出现了亏损,外界对其质疑声不断,内部又大力推行改革,引入 OKR 考核系统,全面取代 KPI,很多人用 " 内忧外困 " 来形容百度如今的处境。

不过对于这些,李彦宏从未公开表态,也没有向外界解释,只是在建国 70 周年的时候,为耄耋之年的抗战老兵送去了一份礼物:通过百度大脑智能语音合成技术合成了一位已故老排长的声音。

分别 64 年后,老兵以这样的方式听到了消逝的声音,与排长完成了隔空对话。这一刻,冷冰冰的技术也开始有了温度。

《今日简史》中说,在一个信息爆炸却多半无用的世界,清晰的见解就成了一种力量,思考,是你我与众不同的真正力量。老兵脸上的两行热泪,胜过外界万千赞许。

Do Better,科技为更好,也许,这就是李彦宏经过思考后向外界传递的百度力量。

小度助手挂帅

百度 AI 领头羊的地位已经开始凸显,尤其语音技术更是可圈可点。

今年李彦宏携五大高管集体亮相,发布了远场语音交互 AI 芯片鸿鹄,百度大脑 5.0,小度助手 5.0,小度大金刚等四款音箱新品,每款产品背后都离不开小度助手的支撑。

小度已经成为李彦宏打造 AI 时代的交互中枢,超级入口和操作系统,由小度延展出的百度 AI 生态体系的轮廓,也渐渐清晰。

小度的总负责人景鲲算得上百度近两年上升最快的一位年轻人,来百度之前,他曾是 " 微软小冰 " 的创造者,来百度之后,他成为了 " 小度 " 的掌舵人。

从创建度秘到推出对话式人工智能操作系统 DuerOS,成为国内最具影响力的 AI 开放平台之一,景鲲仅用了三年。用他自己的话说,小度助手已经从 " 运筹帷幄之中 " 到 " 决胜千里之外 " 了。

作家海明威曾在《流动的盛宴》中写下一句经典:假如你曾去过巴黎,这辈子巴黎都会在你左右。

对景鲲来说,语音交互就是他心中永远无法磨灭的巴黎。他是个典型的理想主义者,在人们都质疑 AI 发展的时候,他坚信对话式人工智能将无处不在," 我是一个愿景驱动的人,我很清楚知道自己在做什么,我有我的信念和理想,我希望为我的信念和理想奋斗。"

(百度 AI 开发者大会景鲲展示 DuerOS)

一个细节看出景鲲的做事风格。据百度内部人士透露,今年的 AI 开发者大会彩排那天,景鲲为了一张 PPT,反复让技术后台演练,尝试了 N 次,直到自己觉得顺了才翻了篇。" 一场彩排一张 PPT 就如此较劲,可想而知景鲲对产品的打磨该是怎样的严格。"

这些年,小度助手一直保持着稳定的迭代速率,从 2015 年的 " 度秘 " 到 2017 年发布的 Duer OS,2018 年发布的小度在家 1S、小度电视伴侣等一系列智能硬件产品,再到 2019 年推出的小度助手 5.0,每隔一段时间,李彦宏都会向外界交出一张展现 AI 实力的答卷。

全面挺进 AI

李彦宏不喜欢讲故事,喜欢聊技术,在他眼里,技术就是百度的基因。

翻遍他的采访也会发现,他三句话不离技术,想挖点公司发展过程中有趣有料的小故事,都要通过身边的人,典型的理工男。

创始人的基因很大程度上决定了公司的气质,百度的技术骨干也大多沉默寡言,没办法,物以类聚人以群分。

可低调不说不代表什么都没做,Apollo 自动驾驶开放平台,对话式人工智能交互平台小度助手和百度大脑已经成为支撑百度 AI 生态体系最核心的 " 三驾马车 ",也是李彦宏决胜 AI 时代的最大底气。

(百度 AI 开发者大会王海峰展示百度大脑)

今年智博会李彦宏又呼吁,希望人工智能的发展能够更加关注安全和效率,加快基础设施的建设,充分利用开源和开放平台,把自主权握在自己手中,技术进化再度提上了日程。

百度人对技术有一种执念,且自百度成立之初就已根深蒂固。

一位智能语音团队的高级工程师回忆了这样一个细节。

去年百度世界大会的时候,百度 CTO 王海峰想在现场演示小度最新的智能语音交互技术—— Endless Conversation,但毕竟是 " 现场直播 ",环境嘈杂,还有太多不可控因素,大家担心演示会失败。

有人在开会时用了二十多页 PPT 希望说服李彦宏放弃现场演示:" 过去的经验告诉你,现场演示是不可能的!"

这时,一向低调的王海峰站了出来,坚定地说:" 我们的语音技术没有问题,你尽管去做,搞砸了算我的!" 一句话让在场的人都愣住了,一旁的李彦宏沉默了片刻,说道:" 你们去做吧。"

后来的结果证明,百度经受住了考验。

年复一年,百度不停向外界展示着一家科技巨头的技术实力。

如今 5G 等新技术的出现给 AI 发展带来了新的挑战,推进人工智能发展的路上依旧面临重重困境,不过就像李彦宏在今年的开发者大会上所说的那样,"AI 前进的道路上,会有各种意想不到的事情发生。但我们前行的决心不会改变,坚信 AI 会改变每一个人的生活。"

大战还在继续,战场上硝烟弥漫,但李彦宏进击 AI 的决心,从未动摇。

来源:新摘商业评论 子雨

打开APP阅读更多精彩内容