你所在的位置: 首页 > 正文

3 项新技术发布,5 大语音方案竞技,9 大咖共话语音 AI 的下一站 - WARE 2019

2019-08-18 点击:596
?

%5C

不幸的是,错过了会议,你也可以补救这篇文章

- 深圳ware -

上周,深圳WARE 2019新硬件峰会第二季度如期在深圳举行。

作为中国最早专注于语音智能和智能扬声器的媒体,深圳湾从单一产品,平台和生态方面关注行业的每一个举措。每个行业会议都关注当前的热门话题。

在4月的“WARE 2019”新硬件峰会上,我们专注于“ON THE GO”主题,并在随附的AI场景中探索产品创新。

三个月后,在本次峰会上,我们将重点放在与智能语音相关的AI尖端技术和应用解决方案上,并以“ALWARYS ON”为主题。ALWAYS ON 意在「无处不在和无时不在的语音助手」,探索这一愿景下,AI 技术有了哪些新的进展,行业面临了哪些新的挑战和机遇,又有哪些有潜力的新应用场景。

为了找到这些问题的答案,我们邀请了来自互联网公司,AI和物联网技术平台提供商和解决方案提供商,组件和芯片解决方案公司以及技术创业公司的9位嘉宾逐一回答。

%5C

1

三大趋势

在2021年,每4个家庭消费电子设备都有一个集成的语音助手

所谓的春江水暖鸭先知,在普通消费者看到产品之前,解决方案提供商和技术制造商已经闻到了商机和方向。

关于整个行业市场预测,LinkPlay共享了一组数据:

2018 年,家庭消费电子(CE)设备市场总量达到了 20 亿台,其中 12% 集成了语音助手(VA),相当于 2.49 亿台设备具有语音交互的能力,这里不包括「work with」的设备。

在这些VA设备中,远场设备占2%,约为4,000万至5,000万台。据估计,到2021年,每四个家用CE设备中将有一个集成的VA。

家电,汽车和酒店等细分市场催生了新的技术热点;远场全双工,多模式交互已成为智能设备的标准设备

在产品登陆现场方面,Spirit认为,经过智能音箱和手机,智能小家电,可穿戴设备等设备将成为AI新一轮的目标。在所有事物+ AI的趋势下,创建了一个新的技术热点,包括全双工、分布式麦克风阵列、多设备联动的唤醒机制等,都将成为智能设备的标配

在移动旅游服务领域,Horizon认为车载智能的竞争性升级和提供终极互动体验的能力将是成功的关键,集成了手势、指纹、体征、眼球、语音等感知方案的多模态交互,是下一代人机交互的趋势。

在行业市场上,酒店已经成为AI制造商的新一轮竞争。 Rhino Intelligent Technology指出,2018年,全球智能语音扬声器市场(8000万台)已超越平板电脑,互联网公司的语音门户网站争夺战提升了用户意识和产业链支持。并且随着消费者对于智能语音、智能客控的接受程度在成长,酒店内的高频人流,将成为下一代 NLP 训练与落地的垂直细分场景。

呼叫降噪成为TWS新一轮产品竞争力的体现

随着AirPods引爆真正的无线蓝牙耳机(TWS)耳机市场,市场对更好的TWS产品,低功耗,小尺寸和良好体验的需求增加,这已成为新一轮产品竞争的焦点。 Elephant Sounds认为,呼叫降噪体验将成为TWS产品竞争力的体现。

%5C

2

三大新发布

Lou推出了一款微型声学电子控制阀,可消除噪音和噪音。

Lou's Electronics公司70多年来一直致力于为助听器和其他电子设备开发微声学元件。近年来,它一直在推动动铁,硅麦,智能麦克风等产品在消费类硬件领域的应用。

降噪和隔音,以及听外面的声音,往往不能兼得。为此,Lou基于自身在MEMS研发领域的积累,推出了世界上第一款用于耳机的微型声学电子控制阀门。

根据娄氏电子公司习近苗,采用楼氏微型声学电控阀门的耳机具备环境感知能力,能够自动控制阀门的打开与闭合,具有功耗小、没有延迟和失真等特点,方便用户在无需取下耳机的情况照常听取外界音和交谈。

习金淼透露,Lou的微声电子控制阀正在大规模生产之前进行最后准备,与海外合作伙伴共同构建集成阀功能的Demo将于今年第三季度亮相,预计将于明年初量产。

%5C

△楼的电子习金苗(点击图片查看完整的演讲评论)

大象音响部门推出新技术,AI呼唤降噪+骨传导,现场演示耳机通话降噪新领域

深度学习广泛应用于语音识别和语音合成,但在语音前端信号处理中,深度学习的应用才刚刚开始。

Elephant Acoustics成立于2017年,是世界上第一个大规模商用深度学习单声道语音增强解决方案。 2018年底,它还在高通骁龙全球技术峰会上展出,受到业界的关注和认可。目前,国内许多智能手机都采用了Elephant Sound Vocplus Telecom降噪解决方案,成功实现了AI呼叫降噪功能,为数千名用户带来了更清晰的语音通话体验。

Apple AirPods引爆了TWS耳机市场,在蓝牙连接的稳定性得到解决后,呼叫降噪成为首要任务。 Elephant Acoustics还将其作为今年的重点之一。

在这方面,大象声科打造了 AI+bone sensor 通话降噪方案,将 AI 通话降噪和骨传导传感器高效融合,覆盖低信噪比全场景,无论是在地铁,商场,KTV还是风噪场景,都可以大大提高通话清晰度,而仅需要一个麦克风,可以提高工程效率,节省硬件成本。

在会上,苗建章首次公开示范了该计划。

%5C

△Elephant Acoustics创始人兼首席执行官苗建章(点击图片查看完整评论)

Rhino Intelligent Technology推出“Rheoli和Easy Chat”,以展示现场非固定的教学自然对话体验

从Google智能助理退休的Vic Shen正式推出了他的企业项目Rhino Intelligent Technology。专注于酒店语音服务的垂直场景,Rhino推出了一个集成的硬件和软件解决方案,Xiaoxiu Butler,它实现了24x7智能语音交互,是第一个支持同时多语义识别,同时支持多轮对话和双语并发。

根据Vic的说法,基于语音智能利用类影像处理的机器学习来处理语义理解,创造自然对话,多意图分析,为酒店客房提供「非固定指令式的自然对话式体验」,基于语音和图像的搜索占据搜索入口的50%。

通过现场演示,我们可以看到Rhino Intelligent Technology的对话系统是“Rheom and Easy Chat”,可以是将多层选择过程简化为一个语音指令,通过卡片化的方式,呈现出房客多个需求并加以引导,再通过引入新的商业模式「全天候采购导引」来满足用户需求。

在这个阶段,人工智能技术引入单一酒店,智能化转型的技术障碍仍然很大,因此需要一个能够帮助酒店优化成本流程管理,整合在线内容和服务以产生新的服务收入。

%5C

△沉曙伟,Rhino Intelligent Technology的创始人兼首席执行官(点击图片查看沉树伟的采访)

3

语音方案竞技

LinkPlay推出了Voice Assistant 2.0,它更智能,无处不在,并且拥有蓬勃发展的内容和服务生态系统。

作为智能语音的先驱,亚马逊Alexa认证合作伙伴和许多语音产品背后的技术力量,LinkPlay自五年前成立以来已经积累了200多个硬件设备的语音智能体验。

在会议上,LinkPlay首席执行官赵立峰介绍了近年来语音设备技术和产品的演变。他相信Voice Assistant 2.0将更加智能,无处不在,并拥有繁荣的内容和服务生态系统。

第一,产品定义;第二,VA的能力不足(在倾听和理解方面);第三,分散的VA生态系统,它构成了数据和产品运营的障碍;第四,安全和隐私。

为此,围绕从硬件到提供「硬件+服务」的转化,LinkPlay 提供 Voice Built-in Solution (VBS) 的方案以及 LinkPlay 云服务,涵盖完整的软硬件系统、高可靠性/低延时的设备控制云、VBS API/SDK、控制 App(Android,iOS,未来加入 。目的是简化产品开发的难度,提供新产品参考设计,协助客户快速上市,并确保后续产品更新和维护。

三年前,亚马逊Alexa在2017年第一季度WARE峰会上首次在中国公开发布第三方媒体平台。随着Alexa Voice Assistant设备响起,以及中国的“100 Box War”,包括BAT和AI制造商在内的国内平台制造商也推出了自己的语音助手。 (VA)。作为VA背后的制造商,LinkPlay以深刻的情感体验了整个过程。

当深圳湾询问LinkPlay对国内VA市场的看法时,赵立峰指出,百度,阿里和腾讯等国内平台厂商为VA的普及做出了贡献,但随着自有品牌语音硬件设备的培育。重心移位,LinkPlay也将合作方向转向致力于推动第三方设备语音智能化的平台合作伙伴

%5C

△LinkPlay CEO赵立峰

Sound Technology推出SoundAI Azero,这是一种快速着陆的一站式解决方案

Suntech成立3年,是一家将声学和人工智能技术相结合的平台服务提供商。目前,盛智科技已成为全球最大的智能扬声器技术供应商之一。它服务于BAT,小米,华为和360.它是巨头背后的服务提供商。其技术实力大大提高。由“头卡”智能扬声器证明。

从智能音箱时代开始,盛智科技的销售总监周志国透露了行业现状:中小企业进入市场面临困境。与传统硬件相比,智能语音产品技术链,声学调试困难,内容聚合困难,平台迁移困难,开发周期?受团队财务和技术能力的限制,语音AI的用户体验成熟度必须是产品级别和大规模生产,并且挑战并不小。

为此,该公司发布了全链式远场智能互动系统“SoundAI Azero”。系统以远场语音交互和远场双工通话为技术内核,兼容主流芯片架构、硬件设计和声学结构,具有一站式 Turnkey 解决方案、全面的语音交互能力、高整合内容资源、协议兼容性强、两周实现快速开发等特点,可广泛应用于多种场景的硬件设备

在AI + IoT + 5G的背景下,该行业需要一个可以快速降落的一站式解决方案。通过Azero系统,Sonar Technology希望将声音扩展到各行各业,使用系统解决所有问题,减少中小客户在该领域的投资,并希望能够微调和微调详细帮助设备制造商一次又一次。良好的产品开发和批量生产。

%5C

△盛智科技销售总监周志国(点击图片查看完整的演讲评论)

Spirit针对小家电和小型设备的智能解决方案具有“分散化”和“小而快”的优势

随着物联网时代的到来,一切都可以在云端,一切都可以计算,从耳机到空调和洗衣机,几乎所有设备都有+ AI要求。对于AI制造商而言,在智能扬声器之后,智能小家电是一个正在发展壮大的蓝海市场。

与智能扬声器和移动电话不同,智能小家电具有主频低,对语音交互功能的单一需求的特点。对于智能白色,智能小家电和智能可穿戴设备,思博伦今年推出了一项低功耗算法,以帮助小型设备快速实现人工智能。

结合产品应用场景,基于硬件结构审查和声学评估结果,思必驰低功耗算法方案提供相应的单项/组合项算法方案,主要可分为一级低功耗唤醒,二级唤醒验证,三级声纹验证。

目前,对于近场互动设备,手机,耳机,儿童故事机等终端,该公司已经形成了一种可以快速应用的低功耗解决方案。

面对5G和物联网,Spirit始终巩固其AI能力,并将自己定位为以市场需求为导向的技术公司,“技术厂商是规定不了客户需求的,我们所有的发展和方案输出都由客户决定。

%5C

△思毕智CMO龙梦珠(点击图片查看完整的演讲评论)

Horizon推出软件和硬件集成的全栈解决方案,为汽车驾驶舱提供自动驾驶技术和经验

谈到Horizon公司,每个人对它的第一印象通常都集中在自动驾驶业务上。事实上,Horizon还积极探索AIoT业务,并将自动驾驶的技术和经验应用于家庭,消费电子,人机交互和其他应用。

Horizon多模互动产品总经理张洪志表示,多模态互动是下一代人机交互的趋势,核心在于“活跃”。要做到这一点,机器首先需要能够感知,准确地识别人们的需求,其次是为场景和个性化服务提供服务。

以智能驾驶舱场景为例,地平线将芯片、语音、图像技术融合在一起,提供软硬件一体化全栈解决方案,从情绪、视线、表情、手势等方面,对人机交互进行判断,交互对象从驾驶员向车内所有人转变,交互方式向主动交互转变,提供有针对性的交互逻辑。

张洪志认为,自动驾驶是人工智能时代的关键。自动驾驶的实现是攀登珠穆朗玛峰的过程。当它实现时,人工智能技术成熟并变得流行。

%5C

△Horizon多模式互动产品总经理张洪志(点击图片查看会前面试报告)

犀牛酒店服务数字系统,一个小团队,创建一个酒店在线入口

在过去的一两年里,巨额补贴不仅使行业进入洗牌阶段,而且为市场做好了准备。聪明的企业家往往能够挖掘新的机会。

Aiello成立于2018年10月,从酒店的垂直场景开始,为酒店业提供“软件 - 硬件系统”集成解决方案和SaaS平台。

Rhino Intelligent Technology分享了酒店业的一组数据:在中国和东南亚的一些酒店,语音控制已成为房屋更新计划的标准,其中大部分都控制在200元,500元/间。据统计,中国约有1500万间酒店/公寓房(不包括airbnb和其他寄宿家庭)。在中国,智能酒店和服务式公寓是一个蓝海市场。

与家庭环境相比,酒店场景中的智能扬声器由于客人的大的移动性和高频率而经常具有更大的样本尺寸。 Aiello的解决方案为酒店搭建数字化平台,帮助酒店提高服务效率,从线上切入满足线下住户需求,包括住中反馈、语音用户画像趋势分析、零售、旅游推荐等。

目前,业界互联网普及,而Rhino Intelligent Technology认为做 2B 业务要尊重传统行业,从传统行业的需求出发提供可行性方案,打造差异化,这也是中小型创业公司的机会。

4

两大开源平台

Google TensorFlow Lite适用于低功耗,低成本的机上学习

在今年的Google I/O大会上,Google智能助理展示了新的肌肉:基于Google的神经网络和机器学习算法,Google智能助理的100GB语音识别模型在运行中占用的字节数不到0.5 GB,运行速度比上一代快。它的速度提高了10倍,实现了零延迟和本地化。

Google TensorFlow的高级软件工程师王铁珍认为,这显示了“ML的未来很小”的趋势,即深度学习的两大趋势:更小的学习、更强的芯片。

王铁珍透露,谷歌目前正在探索如何将深度学习部署到MCU。一旦被广泛使用,就意味着智能硬件可以通过更低的芯片,更低的功耗和更低的成本进行本地化。真的让声音“无处不在”。这项成就还将广泛应用于智能门锁,合奏唤醒,能量收集和其他场景,具有非常大的想象力。

%5C

△Google TensorFlow的高级软件工程师王腾珍

Ubuntu Core,护送安全性,设备升级管理和软件服务收入

Ubuntu是开发人员使用最广泛的Linux平台,用于将物联网设备连接到服务器和云。经过多年的发展,Ubuntu已经从一个运营平台发展成为一个从云到设备的完整生态系统。在云中,公司提供了Ubuntu服务器认证,自动部署和OpenStack等解决方案。在设备方面,Ubuntu Core专为物联网而设计。

Canonical高级工程师和物联网架构师彭瑞廷表示,物联网在与AI集成方面面临许多挑战,包括安全风险,设备升级管理困难以及软件服务难度。在这些方面,Ubuntu 从 Brand Store,Snapcraft,Snap 板块提供全方位的支持,方便企业管理和更新,确保设备的安全性。

%5C

△Canonical高级工程师和物联网架构师Peng Riding

最后,编辑还在文本末尾准备了会议报告的集合,以及之前WARE峰会的精彩内容。 ■

深圳湾编辑部

通博电子娱乐 版权所有© www.cheapuggboot-sale.com 技术支持:通博电子娱乐 | 网站地图