从2019年第一个工作日开始,云知声、思必驰、猎户星空三家语音识别公司先后推出各自AI芯片或者宣布未来AI芯片战略布局。是芯片技术的集体爆发?还是抢占先机的市场角力?有一点可以肯定:2019年智能语音技术将在更多应用场景下落地生根。
全球语音识别行业,目光聚焦产品落地
当前世界顶尖科技公司非常重视语音识别技术。在AI时代已经来临的今天,语音识别技术在各类应用场景下如何真实落地。
任何时候提到语音识别,都不能绕过Nuance这家公司。这家公司曾经在语音领域一统江湖。世界上有超过80%的语音识别都用过Nuance识别引擎技术。其语音产品可以支持超过50种语言,在全球拥有超过20亿用户,几乎垄断了金融和电信行业。由于没有在消费端推出更好用户体验的消费产品,Nuance叫好不叫座,风光大不如前。
苹果的Siri算是世界语音识别的执牛耳者。但Siri并不是苹果自己研发的技术,而是2010年苹果收购Siri Inc.公司的产品。目前苹果正在将语音处理和机器学习技术整合到可穿戴设备、家庭联网设备当中。近几年苹果在智能家居、无人驾驶领域动作频频,语音识别技术必然会在这些场景里同步落地。
谷歌在语音识别技术领域动作稍微迟缓,但进步神速。截止2017年5月,基于谷歌机器学习系统的语音识别准确率(英语)已经达到了95%。这一准确率正好与人类的准确率相当。去年是谷歌成立二十周年,谷歌的人工智能语音助手Google Assistant已嵌入了全球数十亿部智能手机中。此次加入AI芯片大战的出门问问公司就有Google的投资。
亚马逊是最有可能把语音识别落地到消费市场的电商巨头。近日亚马逊宣布已经售出1亿台采用Alexa智能语音助手的设备。Alexa是预装在亚马逊Echo内的个人虚拟助手。在某种程度上,它效仿了谷歌的搜索模式,但更加简洁。凭借易用性和令人印象深刻的功能,Alexa已经赢得了不少消费者的青睐。
适应多场景需求,AI芯片急速革新
2017年国内一款智能音箱的语音助手在各大视频APP上爆红!语音交互技术迅速走向前台,落地到越来越多的智能终端设备中。芯片大战的种子在那一年悄悄落地生根。
2019年的第一周,两家AI公司举办发布会,发布各自AI芯片产品。
云知声公布了其多模态的AI芯片战略,并宣布2019年将会面向语音、视觉、车载等场景推出3款AI芯片,抢滩IoT场景。
随后,思必驰的语音AI芯片也与大家见面。它采用具备低功耗、高能效、高性价比等优势,同时支持多种接口、多麦克风阵列,可应用在电视、白电、车载、机器人、智能音箱等场景。
紧接着,猎豹移动也宣布,旗下AI公司猎户星空联合瑞芯微电子发布针对智能语音和物联网设备的AI芯片,可支持8麦克风阵列,专用指令集可以加速神经网络算法。
所有AI公司都清楚,一款用户体验较好的智能产品,很大程度上依靠数据和算法。而每家语音公司的语音识别算法不尽相同,需要对芯片硬件架构做优化,才能够产生更好的效果与效能。芯片研发看似成本巨大。一旦自主芯片可以提供足够的算力,实现芯片与算法更好的匹配,终端产品市场一旦打开,产品成本将迅速降低。
AI语音技术的未来应用场景
随着AI算法的成熟,物联网市场对AI芯片的需求不断提高,AI芯片竞争将持续升温。拥有强大芯片算力的AI语音技术将满足更多应用场景的苛刻需求,带领人类进入一个真正的智能世界。
1.未来智能家居场景
语音是人类最高效的交流方式。未来人类将尽可能多地使用语音交互方式与智能设备协同工作,并享受语音交互带来的生活便利。每一个家电、每一件可穿戴设备都能够听懂人类指令。不管设备制造商挑选哪种语音操控系统,语音操控将是未来智能家居生活中重要的人机交互方式。
2.未来智能安防场景
音频监控在城市安防系统中的应用越来越多。公检法机构、机场、铁路、银行等领域的安防工程需要清晰、逼真的影音同步监控系统,以弥补视频监控的不足。音频监控的加入就使得监控不再只是上演“无声电影”。工作人员通过音频监控设备“听懂”周围环境,对危险事件和意外事件进行安全防范。搭载语音识别技术的音频监控已经成为安防行业的新亮点。
3.未来智能车载场景
车载场景可能是智能语音技术应用的最佳场景。河姆渡长期战略合作伙伴科大讯飞,2018年10月首发“飞鱼OS”。该系统不再是简单的车载系统。我们似乎看到了一个真正智能的未来驾驶场景。除了可以完成空调控温、车窗开闭、地图导航等常规操作,飞鱼OS可以在人机对话时过滤掉干扰的其他人声,准确识别正在交互的对象是否为同一个人。车内音乐或其他人聊天的声音丝毫不影响用户与系统的语音交流。