20190415100030816
全国免费服务热线
134-8017-5458 
描述

变局中的AI语音:造芯火热、场景突围、转向C端……

浏览:10775 时间:2021-10-11
距离喧嚣已经过去三年,与泡沫共舞的AI语音又有哪些新的变化?这些变化究竟是泡沫的助推力还是行业趋于冷静的表现?

2007年,剑桥大学商学院的高始兴与工程系的俞凯一见如故,2008年,两人归国创立了思必驰,主攻口语教育。

那时正是互联网和移动互联网的天下,因此对于思必驰来说,前几年的探索更像是蒙眼打仗,找不准方向,发展缓慢。此后,思必驰真正快速发展是在这三四年:2016年,获得来自阿里的近2亿元投资;2018年6月,再次获得D轮5亿元人民币融资。

这是一个AI语音独角兽典型的养成故事:强技术背景的创始团队,成立时间较早,直到AI风口引来资本的追捧,估值在短时间内快速攀升。

AI语音作为人机交互的新希望,造成了行业的激荡,并带动了新的竞合关系,有早早卡位如科大讯飞、思必驰、云知声者,有随风口起舞者,也能看到不少巨头的身影。

中国报告网显示,2017年国内视觉、语音、自然语言处理成为AI融资前三甲,语音占比为24.8%,排名第二。

有业内人士甚至向CV智识形容,2016、2017年左右如果你的项目融资计划书中没有NLP、CNN这些AI元素都不好意思跟投资人打招呼。

但这种热闹在很多业内人士眼里就意味着泡沫,“回想一下,2016年很多人工智能公司在做什么?刷榜。刷榜本身是个开卷考试,但开卷考试考得好就代表你真正有这个能力吗?不见得。2017年大家更多是在描绘一些愿景,就是讲故事,2016、2017年的人工智能论坛大妈都来听,在我个人看来这都是泡沫的体现。”云知声创始人黄伟表示。

距离喧嚣已经过去三年,与泡沫共舞的AI语音又有哪些新的变化?这些变化究竟是泡沫的助推力还是行业趋于冷静的表现?CV智识带着好奇与行业内多位从业者聊了聊。

造芯运动,虚火还是实热?

“对云知声来说,不做芯片就意味着死的很快吗?”

“是的”,云知声创始人黄伟斩钉截铁地回答。

从2018年开始,AI语音公司不约而同地开始了一波新造芯运动。云知声发布了面向AIoT市场的UniOne芯片,出门问问发布了AI语音芯片模组“问芯”Mobvoi A1,Rokid发布了AI语音芯片KAMINO18。

2019年1月2日,云知声再次发布正在研发中的三款定位不同场景的AI芯片。两天后,思必驰也推出了AI语音芯片深聪TAIHANG芯片。

这些擅长做软件算法部分的语音公司们为何会纷纷打破“术业有专攻”的边界,涌入造芯阵营呢?

Rokid联合创始人王舜德曾提到,成本居高不下、非常耗电、集成度低让产品做起来十分痛苦,也正是基于这些痛点,才想要研发AI芯片。

云知声创始人兼CEO黄伟表示,现有的芯片架构并非为AI专门设计,不能满足物联网AI算力需求。

但缺少半导体硬件基因的语音公司们如何做到“从软到硬”的呢?

从目前头部几家公司来看,做AI语音芯片的思路还是选择和有经验的芯片公司深度合作。比如思必驰选择中芯国际,共同注资成立上海深聪半导体有限责任公司;Rokid宣布自己的芯片是基于杭州国芯科技的芯片深度定制;猎豹移动旗下猎户星空选择和瑞芯微电子合作。

从开发周期和成本的角度来看,比较成熟的芯片公司已经有积累,很多东西不需要重新去设计,因此联合研发能够缩短开发周期。

AI芯片的确为语音公司带来了新一波的热度,但真实的市场如何呢?

一般来说,语音公司做AI芯片的思路无外乎两种:一种是和自己的解决方案搭配出售,另外一种则是直接对外卖硬件。

观察目前几家语音公司的芯片产品进展,思必驰今年7月8日量产版芯片刚刚点亮,其它的AI语音芯片大多是采用第一种方式,云知声的芯片目前已经通过自己的解决方案落地到终端产品上,截止到3月份,云知声有5-6家客户围绕雨燕芯片落地方案。Rokid发布的KAMINO18也已经搭载到今年3月360刚推出的智能音箱上。

但在深圳鲲云信息科技有限公司创始人兼CEO牛昕宇看来,第一种方式虽然不需要承担外界竞争压力,压力较小,只要保证芯片够自己用就可以了,但对于算法公司来说,动辄几亿美金投入的芯片成本如何去和自己的业务收入平衡?

芯片的运作至少需要3年,2年时间做出芯片,1年时间合作方做出产品,之后才能推向市场。

除了时间成本之外,AI芯片研发还需要巨额的资金成本,黄伟表示第二代芯片的投入要以亿为单位,而云知声的营收也不过是去年才刚刚官宣达到9位数而已。

自研AI芯片的成本既然如此之大,有些语音公司为了更高效也更市场化,就会选择模组的形式,比如出门问问就与杭州国芯科技的芯片合作,发布了模组产品“问芯”。

据业内人士透露,普通单个模组的价格大概在1-2美元,而AI芯片的价格虽然随着产业链的成熟有所下降,但价格差距依旧很大,据了解,搭载了云知声自研AI芯片的语音模组目前的价格在50元人民币以内,即使搭载了更加轻巧的“蜂鸟”芯片的语音模组也在20-30元人民币之间。

即便如此,模组的销量也并不好,去年底李志飞曾向新浪科技这样说道,装有这一模组的产品至少要一年时间才能到用户手上。如此长的周期,远没有想象中那么容易快速起量。

虽然AI语音芯片也被认为是AI语音技术落地的一种方式,一定程度上缓解了落地焦虑,但对于AI语音公司们来说,AI芯片所考验的不仅仅是技术能力,还有商业化落地能力以及风险承担能力。

正如黄伟所说,造芯不是目的,只是起点。

外包模式变了吗?

除了上述的芯片,对于AI公司的商业化落地,无论是语音交互,还是图像识别,众多AI公司一直被诟病的便是:商业模式本质是“外包”。

最直接的体现就是AI领域几乎没有公司能将技术以规模化、产品化的方式输出,不同的领域不同的项目都需要定制化方案,这就导致了如果想接更多的项目就必须招更多的人,技术密集型变成人力密集型,直接导致摊子越铺越大,客单利润却越来越低的后果。

云知声创始人黄伟表示,除了营收压力使得有些公司会不得不选择先把天花板打高之外,这个行业现阶段的现状就是需要比较多定制化,尤其是一些大公司项目。

但三年过去,困于外包的集体难题是否解决了呢?在对多位行业从业者采访的过程中,不少人表示,有所改善,其中纵横双线并进是从困境中突围的最主要方法。

横线做平台,开发通用型产品,目前多家AI语音公司开放API接口给第三方,走To B路线。

纵线则是选择特定的垂直行业深扎,通过不同行业的经验积累,拉开竞争差距。即使是科大讯飞这样体量的语音头部公司,也在向垂直行业和产品延伸,来挖掘新的利润增长点。

思必驰CMO龙梦竹介绍,思必驰2018年的营收在8000万到1亿之间,预计今年会翻三倍左右,倍数增长的背后是业务线的扩展。

智能音箱、儿童玩具、车载后装是思必驰经营多年的领域,除此之外,龙梦竹表示,白电、车载前装、企业服务是思必驰目前增速最快的三大领域,今年又新增了政府政务、酒店地产、金融、医疗四大业务领域,但目前还未开始大规模推广。

在向垂直领域拓展的过程中,语音公司们之间不免会出现重合的领域。比如云知声的业务布局就分为AI+生活和AI+服务,其中AI+生活主要做家庭和汽车,家庭部分包括机器人、智能家电行业,汽车则是从后装向前装布局;AI+服务主要是医疗、教育。这与前面提到的思必驰的业务领域重合率相当高。

去年6月份,云知声还和思必驰隔空互怼,黄伟在朋友圈发文直言要竞争对手“回归商业本质”,虽然并未提具体名字,但龙梦竹发了一则朋友圈并附上了黄伟朋友圈截图。其中龙梦竹写到一句“您的客户的确选择了我们——这点各凭本事,没得骂”,足以可见语音公司的竞争激烈。

面对同行竞争,龙梦竹也坦言,现在各个行业都在+AI,在这么大的市场盘子下,语音的公司不可能是一家独大,而且大家对各个行业的渗透都是在最近四五年才开始的,这里面各家要比的有三点:技术的持续创新能力、技术产品化能力以及服务对接能力。

纵向路线发展过程中,除了与同行竞争之外,语音公司们还必须面对AI语音与传统行业存在间隔的集体难题。

多数传统企业对于AI的了解,仅仅局限于其能够让业务变得“更智能”,但具体怎么做,哪家AI公司能胜任这些工作,答案都十分模糊,这就尤其考验AI语音公司们如何快速进行跨界融合和沟通。

To C是门好生意吗?

科大讯飞轮值总裁胡郁曾解释科大讯飞决定发力C端的真正原因,首先,C端有足够大的利润空间,其次就是将技术从软件到硬件、完整地呈现给用户。

从这两点来看,To C的确是一门好生意,财报数据显示,C端的确为科大讯飞贡献了稳定的现金流:2018年科大讯飞的To C业务实现全年实现营业收入25.17亿,同比增长96.54%;实现毛利12.96亿,同比增长70.77%。

5月21日,科大讯飞召开了一场面向C端消费者的新品发布会。与过去发布技术不同,这是科大讯飞第一场以产品为主的发布会。

当天,科大讯飞密集发布了讯飞翻译机3.0、讯飞转写机、讯飞智能录音笔、讯飞智能办公本、讯飞学习机、iFLYOS ,六款新品中有五款都是面向C端的消费品。

但问题是,对于AI语音公司们来说,这门好生意真的好做吗?

出门问问是AI语音领域较早发力C端的公司,从2014年发布全球首款中文智能手表操作系统Ticwear开始,5年时间内研发出了16款产品,包括智能手表、智能车载后视镜、智能音箱、智能耳机等。

其中智能音箱是AI领域最为火热的C端产品,奥维云网(AVC)全渠道推总数据显示,2019年上半年,中国智能音箱市场在售机型数达到86个,销量为1556万台,同比增长233%;销额30.1亿元,同比增长149%。

2019年上半年中国智能音箱市场规模

出门问问方面也曾经透露,公司主要营收以To C为主,在2018年To C营收占比是80%以上,To B业务只占据了10%以上。

但就在今年5月,CV智识独家获悉,出门问问拿到了大众汽车1亿美元的融资,而谷歌则没有再次跟进本轮次的融资。在文章《独家|大众一亿美元风火驰援,出门问问何时东山再起?》中CV智识也援引多位行业人士分析,出门问问陷入困境的最主要原因就是没有找到一个刚需的C端应用场景。

出门问问发布的C端产品品类基本与市面上的主流智能设备类似,从产品本身来说,出门问问并未创建起一个足够坚固的壁垒,从竞争来说,面对阿里和百度、小米等公司不惜大打“价格战”抢夺市场的时候,又明显没有补贴的底气。

以智能音箱为例,我们看到这几年的价格一路从几百元到199元、129元、99元、79元……去年京东、阿里、百度的mini款音箱都已经到了百元以下,但据一位在智能硬件工作多年的业内人士透露,当时一台mini款智能音箱的成本还在100元左右。

巨头们抢占入口的决心不可谓不大,博弈过程中,巨头们纷纷亮出杀手锏:我有钱。奥维云网(AVC)全渠道推总数据还显示,2018年下半年开始,智能音箱市场进入天猫、百度、小米三足鼎立的时代。

这种情况下,即使初创公司产品技术好或者音质好也难做到差异化竞争,更何况许多初创公司本身在技术、产品层面的竞争力并非无可比拟,这些都让To C成了一个并不是那么好做的生意,至少在主赛道产品上事实的确如此。

因此我们看到现在大部分AI语音公司还是以To B业务为主,这背后既有技术与To B业务的天然连接,也有B端客户的技术敏感性以及付费能力等多重因素。

相比之前的用户交互方式,语音交互更自然、更便利、更高效,也将会从根本上改变人和机器的关系。

根据Juniper的数据,在美国和英国,语音电商的规模将从2018年的20亿美元增长至2022年的400亿美元。Canalys预计,全球范围内智能音箱的装机量到2023年将增长至5亿台。

除此之外,虚拟医生、虚拟偶像.....这些背后都是对AI语音商业价值的认可。

只是如何让技术发挥出产业应用的价值,并获得商业回报,这是AI语音公司需要集体思考的课题,参与的各方注定要在曾经的喧嚣和退潮的冷静中动荡前进。