中美科技巨头各家“小秘” 你会看上谁?

为抢夺下一个交互入口,BTA,苹果、谷歌、微软、亚马逊,各方科技巨头加入混战。

智东西  文 | 寓扬

导语:近日,腾讯推出了其语音助手“腾讯叮当”,至此BAT三巨头都已入局智能语音助手市场,接下来又将上演怎样的厮杀?还有其它语音助手之间又会有怎样的故事?智能语音助手背后又是怎样的技术逻辑?这个市场到底如何?与我们的智能家居又有何关系?

近期,无论国外还是国内,智能语音助手都是一个相当火热的话题。

在国外,谷歌的Google Home 和亚马逊Echo的斗争十分激烈,一方面不断升级语音助手服务,另一方面不断向第三方开放其语音助手平台。如4月15日亚马逊向第三方授权其Echo的关键语音技术;再如4月20日Google Home 推出其智能音箱可同时支持6人使用,提供个性化服务 。此外,4月23日奔驰也将其新车接入Alexa和Google Assistant,提升其车载系统和对智能家居等的远距离控制。

而在国内,4月14日,乐视推出其语音助手“乐乐”来实现对手机APP的语音操作。4月18日人工智能公司出门问问推出其语音助理“问问”和智能音箱Tichome,并向第三方开放语音平台。4月25日,腾讯推出语音助手“腾讯叮当”,又一巨头入局智能交互领域。

随着人工智能和智能家居的发展,以音箱或手机等为硬件的语音助手可能将成为家庭的交互入口,而这背后是整个智能家居产业链和广阔的市场。谁将掌握这个控制中心,谁就赢得了未来。

一、智能语音助手大盘点

目前,语音助手的硬件载体已经开始从智能手机向音箱、汽车、机器人等蔓延。预计这一趋势会愈演愈烈,语音助手将会连接更多的设备,从而成为智能生活的核心控制中心之一。

尽管当下市场上有许多语音助手,但由于语音技术的研发周期长,投入大,行业进入壁垒较高,全球范围内应用成熟的语音助手并不多。知名度较高的有国外谷歌的Google Home、亚马逊的Alexa、苹果的Siri、微软的Cortana小娜,以及尚未谋面的三星Bixby。国内知名度较高的有百度的度秘和科大讯飞的灵犀语音助手。

BAT三巨头在语音助手领域再相遇

就在近日腾讯也推出其语音助手“腾讯叮当”,腾讯表示,其最新人工智能助手腾讯叮当在功能上与亚马逊Alexa相似。而到此,加上百度的度秘和阿里的云知声,BAT三巨头都进入了智能语音助手领域,可见他们对于语音交互这一大“入口”的认同。

度秘是李彦宏在2015年百度世界大会上推出的机器人助理。依托百度的搜索和智能交互技术,度秘可以通过对话,进而在索引现实的服务和信息的基础上,为用户提供服务。度秘主要的能力集中在美食推荐、电影推荐和生活服务推荐。度秘服务更多的集中在消费上,它连接的是广泛的现实行业,涵盖吃、住、行、玩等方面,这更多的是依托百度搜索能力、百度地图、百度糯米等O2O类的服务。

但目前的度秘需要下载手机百度客户端才能使用,也没有语音服务和日常生活提醒等功能。度秘的交互性和趣味性并不强,打开方式也略显麻烦。

阿里的云知声是为YunOS定制的语音助手,可实现语音操控、语音搜索、淘宝购物等功能。依托YunOS系统,加上阿里在新闻、饮食、地图、娱乐等领域的布局,云知声可获得强大的数据资源、数据处理能力,以及多元的服务。而未来云知声将成为阿里商业的交互中心,链接人与商品和服务,提升购物交易的便捷化。

至于刚刚推出的腾讯叮当,根据腾讯科技报道,目前腾讯叮当涵盖的服务很广泛,已经覆盖新闻、体育赛事、票务、快递、音乐、股票、文学、基于LBS的附近资源等领域。如用户对着腾讯叮当说“查询天气”它就会提供当天和以后三天的预报。问及足球比赛结果时,它也会在1秒内给出针对性的答复。

可以看出三家的语音助手服务有重合,也有自己的特色。如度秘在搜索和生活消费上更有优势,阿里云知声在购物上更有优势,而腾讯将在泛娱乐上更有优势。

通过BAT三家的布局,可以看出,他们在打造一个人机交互的入口,无论是在家庭中,还是在个人的工作生活中。通过语音助手来链接其生态中的更多产品,来为消费者提供整合性的服务。而在技术相差不大的当下,谁的连接能力更强,谁的生态更广,无疑更有利于占领当下的市场。

三星Bixby与苹果Siri 将有一战?

早在2011年,苹果就在其iPhone4S上推出了智能语音助手——Siri,随后语音助手也逐渐进入大家视野。随着Siri的不断升级,俨然成为一个生活管家。Siri可以为你查阅信息,充当时间助手、邮件助手,进行歌曲识别,还是算数高手,还可以为你提供生活消费娱乐等服务。此外,随着苹果Homekit智能家居平台的搭建,Siri作为语音助手将在智能家居中发挥更大作用。

然而,在今年3月29日的三星S8发布会上,三星推出了其AI语音助手Bixby。在三星S8发布会上,为了和Siri区别开,也为了体现Bixby人工智能特性,三星重点强调了Bixby的内容理解能力和学习能力。

内容理解能力体现在当你告诉Bixby把截图发送给朋友时,如果有多个友人重名,Bixby不会因为不知道发给谁而崩溃,而是会主动询问你到底要发给谁。而在学习能力上,Bixby主要通过积累用户的使用习惯来构建用户的日常使用模式。比如你每天定点用Uber打车,如果今天你忘了,那么Bixby很可能会通过长期观察你的日常而提前帮你在Uber上叫车。

此外,三星还可通过Bixby接入Sumsung Connect来控制三星系的智能家电,以期在智能家居中发挥更大的作用。然而,可惜的是Bixby因为种种原因并未上市,也不被装入三星S8中,而很可能载入三星今年下半年的Note8中。

有趣的是,为Bixby提供技术支持的是三星去年收购的Viv Labs实验室,没错就是苹果Siri缔造者Adam Cheyer、Dag Kittlaus 和 Chris Brigham离开苹果后联合成立的创业公司!作为智能手机市场的两个霸主,三星与苹果也在不断暗自较劲。三星迟迟不推出Bixby,是否为了憋大招?是否为了与苹果在语音助手领域展开一战?一切只能等待。

亚马逊Alexa与Google Assistant的相爱相杀

亚马逊的Echo和谷歌的Google Home是在智能家居中相对比较成熟的两款产品。目前两款产品都已具备超过5000项的技能。

亚马逊于2014年推出智能音箱Echo,搭载Alexa语音助手,随着不断升级,Echo已成为家庭的交互入口。除了日常生活化的服务外,Echo的主要功能集中在语音购物和对智能家居的控制上。而这也正是亚马逊的野心,建立下一代计算平台,并称为家庭交互的入口。

通过亚马逊Alexa与智能家居设备的连接,你就可以轻松的控制家庭环境,如开关灯、开关窗帘、开关电视等。其独特的麦克风,可以实现较远距离的声音接收。据知乎用户反馈,相比Siri需要掏出手机,按钮触发,并且距离较远就无法听到;Echo的麦克风设计的很赞,可以实现远距离的声音接收,且不需要按钮触发,它会是你的第二老婆!

而Google Home出现的较晚,它于2016年5月份才推出,之后便一直追赶亚马逊的Echo的步伐。此外,Google Home的功能和Echo相差不大,主要用于个人生活和智能家居的控制。Google Home的优势在于其搜索优势和功能更加齐全,而Echo的优势在于购物和更多的第三方接入,以及先发入场优势。

有趣的是,两款智能家居设备,两个语音助手,从出生时仿佛就是宿敌。亚马逊于2015年6月向第三方开放其Alexa语音技术,而不必通过智能音箱Echo;而谷歌在2016年12月才向第三方开放,为的是于亚马逊展开竞争。而在今年,双方在技术和连接上的竞争更加白热化。一方面,双方不断通过各自语音助手整合和连接更多的设备与服务,亚马逊甚至向第三方开放了Alexa核心的麦克风语音技术;另一方面,谷歌也在技术上有所突破,实现一台设备的多人使用,目前可支持6人。

而这背后正是家庭入口的争夺,谁抢占了这个入口,就可以掌控所有信息的输入,以及数据流和消费流,其市场规模和潜力难以想象。

二、智能语音助手的技术逻辑

1950年,计算机科学家阿兰·图灵就在其论文《计算机与智能》中提出了著名的“图灵测试”,这是最早探讨机器智能与人机交互的代表。

在1952年,贝尔实验室研制出首个利用分离技术的实用语音识别设备,能识别出10个英语数字发音。

从1950年开始至今,语音识别技术经历了由小词汇、孤立词汇的识别,到大词汇量、特定声音识别的飞跃发展。然而,语音识别技术只是智能语音助手实现工作的第一步。

总的来说,语音助手实现其工作大体要经过三步:其一是前端的语音识别,即将声音转换成文字;其二是自然语言的理解,将文字解读成行为;其三是通过开放API接口等技术来实现行为等操作。

因此,语音助手能否提供强大的服务,主要取决于其技术和连接整合能力。在技术上,主要使用云计算、语音识别、语音合成等AI技术。即在前端面向用户时,主要需要语音识别、语音合成技术。在语音识别时,系统需要把语音转化成文字,这就需要强大的语音库作为支撑,就需要云计算技术。而语音合成则是将反馈的文字结果转化成语音输出。

在后端则是人工智能技术的使用。面对用户的众多请求,语音助手需要通过机器学习(深度神经网络)来不断自我学习,了解用户的说话方式和爱好需求,进而输出个性化的服务。

而其连接整合能力就是指,语音助手将越来越多的设备和服务接入,从而构建自身生态的能力。尤其是在智能家庭中,用户最终获得的是体验和服务,单一设备单一APP控制不是智能家居的追求,智能家居需要的是形成一个生态,形成一个闭环,从而通过一个入口来更便捷的控制所有设备。而这需要语音助手平台一方面开放其语音助手,另一方面也要加强商务合作,来聚合服务。

三、智能语音市场将达百亿

据工业和信息化部电子科技信息情报研究所数据显示,2012年以来,全球智能语音产业规模持续快速增长。2013年,全球智能语音产业规模整体达33.7亿美元,同比增长38.1%;2014年较2013年同比增长41.0%,产业规模大幅提升。预计到2017年,全球智能语音规模将达112.4亿美元,复合增长率达35.1%。

据了解,语音技术以其广阔的产业应用席卷人们的日常生活和工作,其产业规模大幅提升主要得益于三方面。第一是大数据、云计算等技术的发展使得智能语音技术的应用不断成熟;第二是各国政府、相关行业及资本的持续关注推动语音技术的研发和产业化;第三是随着移动互联网技术的发展,智能语音技术正在快速成为人们日常生活的组成部分,并显著改变消费者的交互方式。

但智能语音市场在带来高价值的同时,也将导致行业的垄断。据MBA报告,智能语音产业是技术先导型的新兴产业,存在核心技术壁垒、行业应用壁垒和语音资源壁垒,具有显著的“马太效应”。从全球范围来看,仅有少数厂商在语音市场具有竞争力,一类是传统语音技术厂商,拥有长期技术和用户积累,如美国的Nuance公司,但近年逐渐衰落,而让位给互联网巨头。另一类是以IBM、微软、谷歌、苹果等为代表的IT巨头,凭借在互联网端的优势迅速抢占语音信息流入口。

资料显示,早在2009年,Nuance公司占有全球语音识别市场约69%的市场份额。在2012年,Nuance的市场份额下降到62%,Nuance、谷歌、微软、苹果、IBM、科大讯飞五家企业占据市场份额超95%。2013年,Nuance市场份额下降到51%,而谷歌依靠其在互联网和移动互联网领域的优势,市场份额由16.9%上升至28%;苹果、微软、科大讯飞以4.7%、4.4%、4.3%的市场份额分列第三、第四、第五位。可见智能语音行业的寡头垄断特征十分明显。

此外,随着智能家居已从概念向商业化阶段发展,语音控制和交互将是智能家庭的一大趋势。根据市场研究公司Juniper发布的数据,2018年全球智能家居市场规模将达710亿美元。以苹果、三星、海尔为代表的消费电子厂商和以谷歌、小米、乐视等为代表的互联网企业开始纷纷推出智能家电产品,为智能家居市场打前站。而智能家居的发展也将带动智能语音服务的快速增长。

由于智能语音助手将会是家庭的中心入口,占据了这个入口,就占据了家庭服务的大部分,接入其中的服务将会获得更多的市场份额。另一方面,语音助手也将获得海量的家庭数据信息,这些海量、动态的数据可以用来优化算法的迭代,也可以用于其他云服务,产生更高的价值。

结语:助力智能化生活

在人类文明的技术史中,由于通信的需要,我们创造了文字,它是我们在历史长河中由于自身局限不得不做的选择。而今天我们由于技术的进步,将摆脱文字的束缚,再次选择口语作为我们的通讯方式,让我们的生活更加便捷、高效化。或许这也是苹果、亚马逊当初选择语音这种最原始的方式作为交互入口的原因。

试想一下,在不远将来的一个早晨,你从睡梦中醒来,轻轻唤醒你的语音助手。它为你打开窗帘,为你播报今天的天气,建议你穿什么样的衣服。同时唤醒厨房,预热你事先准备好的早餐。在你吃早餐时,你的语音助手为你播报昨晚和今日的要闻。当你感觉室内的光线略暗时,它为你调节室内灯光。它会根据空气质量来决定是否开窗以及启动空气净化器。并在你出门时,为你安排好上班的行程以及交通方式。而这只在不远的未来。

随着人工智能的发展,智能语音助手将会更加智能,融入我们的家庭和我们的生活。尽管也会面临种种隐私、数据泄露和营销行为,但它们将便捷和高效化我们的生活。我们将获得更多控制,解放双手,从而将时间精力用到更有意义、更有价值的事情上。


延伸阅读

点击下方图片直接阅读

每日一头条

趋势·深度·犀利·干货,最专业的行业解读

深喉爆料、投稿:guoren@zhidx.com

智东西诚聘记者/编辑/实习生

职位详情回复“招聘”查看

简历至HR@zhidx.com

相关文章推荐