右侧
黑客技术
当前位置:网站首页 > 网络黑客 > 正文

麦克风阵列180度定位_固定方向性麦克风

作者:hacker发布时间:2022-07-08分类:网络黑客浏览:143评论:3


导读:导航:1、如何检测麦克风阵列声源定位的性能好坏2、阵列麦克风有几个声道,有什么区别?3、笔记本电脑里有麦克风阵列和外部麦克风,这两个有什么区别?如何检测麦克风阵列...

导航:

如何检测麦克风阵列声源定位的性能好坏

一般来说,基于麦克风阵列的声源定位算法划分为三类:一是基于波束形成的方法;

二是基于高分辨率谱估计的方法;

三是基于声达时延差(TDOA)的方法。

基于最大输出功率的可控波束形成技术Beamforming,它的基本思想就是将各阵元采集来的信号进行加权求和形成波束,通过搜索声源的可能位置来引导该波束,修改权值使得传声器阵列的输出信号功率最大。

这种方法既能在时域中使用,也能在频域中使用。

它在时域中的时间平移等价于在频域中的相位延迟。

在频域处理中,首先使用一个包含自谱和互谱的矩阵,称之为互谱矩阵(Cross-Spectral Matrix,CSM)。

在每个感兴趣频率之处,阵列信号的处理给出了在每个给定的空间扫描网格点上或每个信号到达方向(Direction ofArrival,DOA)的能量水平。

因此,阵列表示了一种与声源分布相关联的响应求和后的数量。

这种方法适用于大型麦克风阵列,对测试环境适应性强。

GLFore的acam100就是这个原理。

阵列麦克风有几个声道,有什么区别?

麦克风阵列是什么?

麦克风阵列(Microphone Array),从字面上,指的是麦克风的排列。也就是说由一定数目的声学传感器(一般是麦克风)组成,用来对声场的空间特性进行采样并处理的系统。

早在20世纪70、80年代,麦克风阵列已经被应用于语音信号处理的研究中,进入90年代以来,基于麦克风阵列的语音信号处理算法逐渐成为一个新的研究热点。而到了“声控时代”,这项技术的重要性显得尤为突出。

麦克风阵列能干什么?

1.语音增强(Speech Enhancement)

语音增强是指当语音信号被各种各样的噪声(包括语音)干扰甚至淹没后,从含噪声的语音信号中提取出纯净语音的过程。所以DingDong在嘈杂环境下,也能准确识别语音指令。

通过麦克风阵列波束形成进行语音增强示意图

从20世纪60年代开始,Boll等研究者先后提出了针对使用一个麦克风的语音增强技术,称为单通道语音增强。因为它使用的麦克风个数最少,并且充分考虑到了语音谱和噪声谱的特性,使得这些方法在某些场景下也具有较好的噪声抑制效果,并因其方法简单、易于实现的特点广泛应用于现有语音通信系统与消费电子系统中。

但是,在复杂的声学环境下,噪声总是来自于四面八方,且其与语音信号在时间和频谱上常常是相互交叠的,再加上回波和混响的影响,利用单麦克风捕捉相对纯净的语音是非常困难的。而麦克风阵列融合了语音信号的空时信息,可以同时提取声源并抑制噪声。

目前基于线性阵列、平面阵列以及空间立体阵列的波束形成和降噪技术,效果均达到业界一流水平。

2013年科大讯飞车载降噪产品和国际竞争对手效果对比

2.声源定位(Source Localization)

现实中,声源的位置是不断变化的,这对于麦克风收音来说,是个障碍。麦克风阵列则可以进行声源定位,声源定位技术是指使用麦克风阵列来计算目标说话人的角度和距离,从而实现对目标说话人的跟踪以及后续的语音定向拾取,是人机交互、音视频会议等领域非常重要的前处理技术。所以麦克风阵列技术不限制说话人的运动,不需要移动位置以改变其接收方向,具有灵活的波束控制、较高的空间分辨率、高的信号增益与较强的抗干扰能力等特点,因而成为智能语音处理系统中捕捉说话人语音的重要手段。

混响产生原因示意图

3.去混响(Dereverberation)

一般我们听音乐时,希望有混响的效果,这是听觉上的一种享受。合适的混响会使得声音圆润动听、富有感染力。混响(Reverberation)现象指的是声波在室内传播时,要被墙壁、天花板、地板等障碍物形成反射声,并和直达声形成叠加,这种现象称为混响。

但是,混响现象对于识别就没有什么好处了。由于混响则会使得不同步的语音相互叠加,带来了音素的交叠掩蔽效应(Phoneme Overlap Effect),从而严重影响语音识别效果。

影响语音识别的部分一般是晚期混响部分,所以去混响的主要工作重点是放在如何去除晚期混响上面,多年来,去混响技术抑制是业界研究的热点和难点。利用麦克风阵列去混响的主要方法有以下几种:

(1)基于盲语音增强的方法(Blind signal enhancement approach),即将混响信号作为普通的加性噪声信号,在这个上面应用语音增强算法。

(2)基于波束形成的方法(Beamforming based approach),通过将多麦克风对收集的信号进行加权相加,在目标信号的方向形成一个拾音波束,同时衰减来自其他方向的反射声。

(3)基于逆滤波的方法(An inverse filtering approach),通过麦克风阵列估计房间的房间冲击响应(Room Impulse Response, RIR),设计重构滤波器来补偿来消除混响。

现在科大讯飞实现的基于麦克风阵列的去混响技术能很好的对房间的混响情况进行自适应的估计,从而很好的进行纯净信号的还原,显著的提升了语音听感和识别效果,在测试对比中,多种混响时间下识别效果接近手机近讲水平。

混响语音信号频谱

经过去混响后的语音信号频谱

4.声源信号提取(分离)

家里人说话太多,DingDong听谁的呢。这个时候就需要DingDong聪明的辨别出哪个声音才是指令。而麦克风阵列可以实现声源信号提取,声源信号的提取就是从多个声音信号中提取出目标信号,声源信号分离技术则是将需要将多个混合声音全部提取出来。

通过麦克风阵列波束形成做语音提取和分离

利用麦克风阵列做信号的提取和分离主要有以下几种方式:

(1)基于波束形成的方法,即通过向不同方向的声源分别形成拾音波束,并且抑制其他方向的声音,来进行语音提取或分离;

(2)基于传统的盲源信号分离(Blind Source Separation)的方法进行,主要包括主成分分析(Principal Component Analysis,PCA)和基于独立成分分析(Independent Component Analysis,ICA)的方法。

TGMZ天歌魅尊

笔记本电脑里有麦克风阵列和外部麦克风,这两个有什么区别?

1. 麦克风阵列是将两个麦克风的信号耦合为一个信号。

2. 亦即在两个麦克风的正前方形成一个接收区域,进而削减两个麦克风侧向的收音效果。在频率响应中也可以根据时域中波束形成与空间滤波器相仿的应用,分析出接收到语音信号音源的方向以及其变化。

3. 是麦克风的工作方式不同,而这些分析都可以由极坐标图以波束形式来显示语音信号的强度与角度。

笔记本啊,选一个外置的独立声卡啊,推荐客所思kx2-a。我用的就是这款声卡,在配个电容麦,监听耳机,。k歌娱乐完全没有问题了。你的话筒已经不错了,我说的这个声卡是免驱的,很容易上手,网上也有买,大约都在400元一下,。电脑商场也有,。希望能帮到你,。

标签:麦克风阵列180度定位


已有3位网友发表了看法:

  • 访客

    访客  评论于 2022-07-08 23:35:41  回复

    对目标说话人的跟踪以及后续的语音定向拾取,是人机交互、音视频会议等领域非常重要的前处理技术。所以麦克风阵列技术不限制说话人的运动,不需要移动位置以改变其接收方向,具有灵活的波束控制、较高的空间分辨率、高的信号增益与较强的抗干扰能力等特点,因而成为智能语音处理系

  • 访客

    访客  评论于 2022-07-08 23:50:29  回复

    2.声源定位(Source Localization)现实中,声源的位置是不断变化的,这对于麦克风收音来说,是个障碍。麦克风阵列则可以进行声源定位,声源定位技术是指使用麦克风阵列来计算目标说话人的角度和距离,从而实现对目标说话人的跟踪以及后续的语音定向拾取,是人机交互、音视频会议等领域非常重要的前

  • 访客

    访客  评论于 2022-07-09 05:31:16  回复

    角度和距离,从而实现对目标说话人的跟踪以及后续的语音定向拾取,是人机交互、音视频会议等领域非常重要的前处理技术。所以麦克风阵列技术不限制说话人的运动,不需要移动位置以改变其接收方向,具有灵活的波束控制、较高的空间分辨率、高的信号增益与较强的抗干扰能力等特点,

欢迎 发表评论:

网络黑客排行
最近发表
标签列表