深度解读麦克风阵列技术语音交互应该选用怎样的方案?:威澳门尼斯人官网欢迎您
亚马逊Echo和谷歌Home争奇斗艳,除了云端服务,他们在硬件上究竟有哪些差异?我们再行将Echo和Home两款音箱拆下来看,区别仅次于的还是麦克风阵列技术。AmazonEcho使用的是环形6+1麦克风阵列,而GoogleHome(还包括SurfaceStudio)只使用了2麦克风阵列。这里想要略为了解谈谈麦克风阵列技术,以及智能语音交互设备究竟应当搭配怎样的方案。
什么是麦克风阵列技术? 学术上有个概念是“传声器阵列”,主要由一定数目的声学传感器构成,用来对声场的空间特性展开取样并处置的系统。而这篇文章谈到的麦克风阵列是其中一个狭义概念,特指应用于语音处置的按一定规则排序的多个麦克风系统,也可以非常简单解读为2个以上麦克风构成的录音系统。 麦克风阵列一般来说有线形、环形和球形之分,缜密的应当说成一字、十字、平面、螺旋、球形及无规则阵列等。
至于麦克风阵列的阵元数量,也就是麦克风数量,可以从2个到上千个平均。这样说来,麦克风阵列知道好简单,别担心,简单的麦克风阵列主要应用于工业和国防领域,消费领域考虑到成本不会修改很多。
为什么必须麦克风阵列? 消费级麦克风阵列的蓬勃发展归功于语音交互的市场火热,主要解决问题远距离语音辨识的问题,以确保现实场景下的语音识别率。这牵涉到了语音交互用户场景的变化,当用户从手机转换到类似于Echo智能音箱或者机器人的时候,实质上麦克风面对的环境就几乎逆了,这就如同两个人窃窃私语和大声嘶喊的区别。
前几年,语音交互应用于尤为广泛的就是以Siri为代表的智能手机,这个场景一般都是使用单麦克风系统。单麦克风系统可以在低噪声、无混响、距离声源很将近的情况下取得合乎语音辨识市场需求的声音信号。但是,若声源距离麦克风距离较近,并且现实环境不存在大量的噪声、多径光线和混响,造成掉落信号的质量上升,这不会严重影响语音识别率。
而且,单麦克风接管的信号,是由多个声源和环境噪声变换的,很难构建各个声源的分离出来。这样就无法构建声源定位和分离出来,这很最重要,因为还有一类声音的变换并非噪声,但是在语音辨识中也要诱导,就是人声的阻碍,语音辨识似乎无法同时辨识两个以上的声音。 似乎,当语音交互的场景过渡到以Echo、机器人或者汽车为主要场景的时候,单麦克风的局限就突显出来。
为了解决问题单麦克风的这些局限性,利用麦克风阵列展开语音处置的方法应时而生。麦克风阵列由一组按一定几何结构(常用线形、环形)放置的麦克风构成,对收集的有所不同空间方向的声音信号展开机时处置,构建噪声诱导、混响除去、人声阻碍诱导、声源测向、声源追踪、阵列增益等功能,进而提升语音信号处理质量,以提升现实环境下的语音识别率。
本文关键词:威澳门尼斯人官网欢迎您,深度,解读,麦克风,阵列,技术,语音,交互,应该
本文来源:威澳门尼斯人官网欢迎您-www.xjhuiding.com
同类文章排行
- 为什么互联网产品越来越难做了?
- 王健林又悄悄卖了几家万达广场!保险、信托接
- 国产顶级“二次元”IP:三国
- 在人工智能炒热机器人时,也被人把风带进了教
- 拒绝炒冷饭!《浪漫沙加3:重制版》将加入新剧情
- 珍爱智商,远离“区块链”
- 大众福特或很快敲定自动驾驶合作协议对ArgoAI估值40亿美元
- 刮着大风的人工智能,躺着赚钱的自动驾驶 | 虎
- Materialise发布2016年财报:收入超8亿
- 共享,正从风口到风险
最新资讯文章
- 论杭州画室排名前十位 他们各有什么优势?
- “湾区月嫂”颇受接待!云城区已培训523人 就近就业“档期”
- CF手游六一活动汇总 多图金卡多倍上分
- 和平精英3月30日停机维护公告
- 拒绝炒冷饭!《浪漫沙加3:重制版》将加入新剧情
- 《植物大战僵尸2》那些年我们追过的豌豆射手
- 热门小游戏《悬挂大金刚》更新:“每日之星”上线
- 史上最长航线诞生:卡塔尔多哈直飞奥克兰 连飞18小时
- 大众福特或很快敲定自动驾驶合作协议对ArgoAI估值40亿美元
- 拆解证实Pixel3XL的OLED屏来自三星:逆袭成历史最佳
- Materialise发布2016年财报:收入超8亿
- 珍爱智商,远离“区块链”
- 为什么互联网产品越来越难做了?
- AI在内容分发上的绊脚石
- 为什么大公司的高管们都爱练咏春?
- “去乐视化”之后,新易到的机会在哪儿?
- 智能音箱,正走在智能手表的老路上
- 国产顶级“二次元”IP:三国
- 刮着大风的人工智能,躺着赚钱的自动驾驶 | 虎
- 王健林又悄悄卖了几家万达广场!保险、信托接