51La

亚星游戏官网-www.yaxin868.com



  • 山东亚星游戏官网机床有限公司铣床官方网站今天是:2025-04-30切换城市[全国]-网站地图
    推荐产品 :
    推荐新闻
    技术文章当前位置:技术文章>

    一种声源定位方法及装置的制作方法

    时间:2025-04-23    作者: 管理员

    专利名称:一种声源定位方法及装置的制作方法
    技术领域:
    本发明属于声音处理技术领域,尤其涉及一种声源定位方法及装置。
    背景技术
    在视频会议、安防或是在ー些エ业应用领域中常常需要对声源进行定位,但是在一些场合中,由于外部声源环境的不确定性,语音信号受到外界噪声干扰,使得信噪比发生变化,现有声源定位技术中,通过麦克风阵列得到ー组声音数据,再经过预处理后用相位变换广义交互相关方法(PHAT-GCC)进行时延估计,根据时延结果和麦克风阵列中麦克风的排列分布,通过几何模型即可确定声源的位置。由于现有的PHAT-GCC方法中,由于声源信号的信噪比可能会随环境发生变化,在信号能量较小的吋,进行频域加权的加权函数的分母
    会趋于零,使得加权函数的取值变得非常大,这样获取的时延结果误差也较大,最后定位出的声源位置也会存在很大误差。

    发明内容
    鉴于上述问题,本发明的目的在于提供一种声源定位方法,g在解决现有声源定位技术中由于声源信号的信噪比发生变化时,加权函数的值可能变得非常大,使得声源定位结果误差很大的技术问题。本发明是这样实现的,一种声源定位方法,包括下述步骤麦克风阵列采集声源信号,并对其中任意两个麦克风采集的声源信号进行预处理;确定经过所述预处理后的两路声源信号的互功率谱密度函数;确定随当前信噪比变化而调整的加权函数;根据所述互功率谱密度函数和加权函数确定所述两路声源信号的互相关函数的值序列,井根据所述互相关函数的最大值确定声源信号到达所述两个麦克风的时延;根据麦克风阵列的排列分布和所述声源信号到达其中所述两个麦克风的时延,定位声源位置。本发明的再一目的在于提供一种声源定位装置,包括麦克风阵列采集预处理单元,用于麦克风阵列采集声源信号,并对其中任意两个麦克风采集的声源信号进行预处理;互功率谱密度确定单元,用于确定经过所述预处理后的两路声源信号的互功率谱密度函数;加权函数确定单元,用于确定随当前信噪比变化而调整的加权函数;时延确定单元,用于根据所述互功率谱密度函数和加权函数确定所述两路声源信号的互相关函数的值序列,井根据所述互相关函数的最大值确定声源信号到达所述两个麦克风的时延;声源定位単元,用于根据麦克风阵列的排列分布和所述声源信号到达其中所述两个麦克风的时延,定位声源位置。本发明的有益效果是由于本发明提供的声源定位方法和装置所采用加权函数能够随当前信噪比的变化做出相应调整,使得由于背景噪声、混响等因素的影响,在声源信噪比改变的环境下,通过相应调整加权函数,亦可准确获取声音信号的时延,提高了声源定位精度。


    图I是本发明第一实施例提供的 声源定位方法的流程图;图2是本发明第二实施例提供的声源定位方法的流程图;图3是本发明第三实施例提供的声源定位装置的结构方框图;图4是本发明第四实施例提供的声源定位装置的结构方框图。
    具体实施例方式为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进ー步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。实施例一:图I示出了本发明第一实施例提供的声源定位方法的流程,为了便于说明仅示出了与本发明实施例相关的部分。本发明实施例提供的声源定位方法包括步骤S101、麦克风阵列采集声源信号,并对其中任意两个麦克风采集的声源信号进行预处理。麦克风阵列是多个麦克风按照一定方式排列的麦克风集合,在声源定位技术中常用于声源信号采集,可以得到一组声源信号,在本步骤中,任取其中的两个麦克风采集到的声源信号进行预处理,包括滤波和分帧等。步骤S102、确定经过所述预处理后的两路声源信号的互功率谱密度函数;步骤S103、确定随当前信噪比变化而调整的加权函数;步骤S104、根据所述互功率谱密度函数和加权函数确定所述两路声源信号的互相关函数的值序列,井根据所述互相关函数的最大值确定声源信号到达所述两个麦克风的时延(时间差)。 步骤S102-S104提供了确定声源信号到达两个麦克风的时延的过程,确定时延的精确度决定了声源定位的精确度,一般的时延确定方法是首先确定两路声源信号的互功率谱密度函数、以及加权函数,再根据所述互功率谱密度函数和加权函数的乘积进行傅立叶逆变换得到两路信号的互相关函数的值序列,根据所述互相关函数的最大值确定所述时延。但是现有的加权函数无法跟随当前信噪比的变化而变化,这种加权函数无法抵御较大的背景噪声和混响,并且当语音信号能力较小时,所述加权函数的取值非常大,后续确定时延会产生很大误差。而在本发明实施例中,步骤S103所确定的加权函数随当前信噪比变化而做出相应调整,使得加权函数的函数值不会因为语言信号能量较小时而变得非常大,迸而保证的确定时延的精确度。步骤S105、根据麦克风阵列的排列分布和所述声源信号到达其中所述两个麦克风的时延,定位声源位置。声源定位技术的原理是通过确定声源信号到达两个麦克风的时延,井根据所述麦克风的具体位置,通过几何模型确定声源具体位置,本实施例在确定了较高精确度的时延后,可以通过几何分析方法精确定位声源位置,具体的定位方法与现有声源定位技术相同,此处不再赘述。本发明实施例与现有声源定位技术的主要区别在于,本实施例提供的加权函数随当前信噪比变化而相应调整,使得加权函数的函数值不会因为当前信噪比改变而发生剧烈改变,这样最后确定的时延值的精确度得到了保证,进而提高了声源定位精确度。实施例ニ :图2示出了本发明第二实施例提供的声源定位方法的流程,为了便于说明仅示出了与本发明实施例相关的部分。本发明实施例提供的声源定位方法包括步骤S201、麦克风阵列采集声源信号;步骤S202、对所述麦克风阵列中任意两个麦克风采集的声源信号进行带通滤波,得到两路带通滤波后的声源信号;步骤S203、对所述两路带通滤波后的声源信号进行加窗分帧处理,得到两路短时
    平稳信号。上述步骤S201-S03作为实施例一中步骤SlOl的ー种具体优选的实施方式。在步骤S201中,假设所述两个麦克风采集到的声源信号分别为X1 (t) = B1S1 (t) +Ii1 (t) (I)x2 (t) = B2S1 (t+D) +n2 (t) (2)其中,ai、a2为声音衰减因子,由于是声源为近场信号,可以认为ai、a2为1,D为声源信号到达所述两个麦克风的时延,ηια)、η2α)为所述两个麦克风接收到的噪声信号。在步骤S202中,对麦克风采集到的声源信号进行带通滤波,将低频段和高频段的噪声滤除,为后续处理提供两路带通滤波后的声源信号。在步骤S203中,作为ー种实现方式,使用汉明窗函数对所述两路带通滤波后的声源信号进行分�。玫搅铰范淌逼轿刃藕牛哟胺种∫话悴捎弥∮胫≈氐姆椒�。两路短时平稳信号为S1 ( λ , n) = X1 (n+d( λ -I)N) w(η) (3)s2 ( λ , η) = X2 (n+d( λ-I)N) w(η) (4)其中w(n)为汉明窗函数,N为窗函数w(n)的长度,d为相邻帧之间的移位參数,λ为帧数。步骤S204、通过端点检测判断所述的两路短时平稳信号是否为语音信号;是执行步骤205 ;否执行步骤207。步骤S205、确定当前信噪比,当前信噪比为SNR(A) = aSNR( λ-l) + (l-a) SNR_0,其中SNR(A-I)为上ー帧声源信号信噪比,SNR_0为使用当前语音信号帧与前ー非语音信号帧的能量比值求得的先验信噪比,a为平滑因子;
    步骤S206、对所述两路短时平稳信号进行快速傅里叶变换,再确定所述两路短时平稳信号的互功率谱密度函数;步骤S207、舍弃所述两路短时平稳信号,更新信噪比SNR(A ) = SNR (λ -I),其中SNR(A-I)为上ー帧声源信号信噪比,本流程结束,进入下一帧处理;上述步骤S204-S207是实施例一中步骤S102 —种具体优选的实施方式。步骤S204中通过端点检测来判断两路短时平稳信号是否为语音信号,本实施例中,麦克风采集到的声源信号包括声源的语音信号和背景 噪声信号,若所述声源不发声时,所述麦克风采集到的声源信号仅仅为背景噪声信号,具体的,当检测所述两路短时平稳信号的短时能量(音频信号一个短时间段的能量)和短时过零率(単位时间内信号波形穿过横轴(零电平)的次数)均大于相应的阈值时,即可判定当前声源信号为语音信号。在确定分巾贞后的声音信号第λ巾贞为非语音信号时,则当前信噪比SNR(X)=SNR(X-I) (8)在确定分帧后的声音信号第λ帧为语音信号时,则当前信噪比SNR(A) = aSNR(A-l) + (l-a)SNR_0 (9)其中,SNR(λ -I)为上ー帧的信噪比,SNR_0为当前语音信号帧与前ー非语音信号帧的能量比值,a为平滑因子。当确定当前声源信号为语音信号时,对所述两路短时平稳信号进行快速傅里叶变
    换,再确定所述两路短时平稳信号的互功率谱密度函数。具体的,对式(3)和式(4)中的两
    路声音信号进行快速傅里叶变换,有
    n-ιr\S] \λΛ) = y ,.S- [Λ,n)exp -j —-nk(5 )
    n=0
    n-ι( 2π \
    4(ん灸)= 2^2(ん,OexP -J^rrnk(6)
    H=O\ W )因此,可以求得所述两路声音信号的互功率谱密度函数为
    Ru(A^k) = Sl(AJi)Sl(AJ)(7)其中,8ι(λ, η)和S2U,η)为长度为N的有限长序列,经过傅里叶变换后得到
    S1(λ,k)和 S2(λ,k),S2 (/I,ん)为 S2 (λ,k)的共轭函数。当确定当前两路短时平稳信号为非语音信号时,舍弃所述两路短时平稳信号。当检测到所述两路短时平稳为非语音信号时,此时没有必要再进行后续的运算,因此步骤S207中舍弃所述两路短时平稳,这样在一定程度上就減少了计算量。步骤S208、根据所述当前信噪比确定加权函数^KW)=I , , \、Ρ 7ΓΤ或者MW= , /、,,,其中小12( )为声源信号的互功率谱密度函数,P为与当前信噪比
    Φ'ιい个,)SNR(A)成正比关系的调节因子
    权利要求
    1.一种声源定位方法,其特征在于,所述方法包括 麦克风阵列采集声源信号,并对其中任意两个麦克风采集的声源信号进行预处理; 确定经过所述预处理后的两路声源信号的互功率谱密度函数; 确定随当前信噪比变化而调整的加权函数; 根据所述互功率谱密度函数和加权函数确定所述两路声源信号的互相关函数的值序列,并根据所述互相关函数的最大值确定声源信号到达所述两个麦克风的时延; 根据麦克风阵列的排列分布和所述声源信号到达其中所述两个麦克风的时延,定位声源位置。
    2.如权利要求I所述方法,其特征在于,所述麦克风阵列采集声源信号,并对其中任意两个麦克风采集的声源信号进行预处理步骤,具体包括 麦克风阵列采集声源信号; 对所述麦克风阵列中任意两个麦克风采集的声源信号进行带通滤波,得到两路带通滤波后的声源信号; 对所述两路经过带通滤波的声源信号进行加窗分帧处理,得到两路短时平稳信号。
    3.如权利要求2所述方法,其特征在于,所述确定经过所述预处理后的两路声源信号的互功率谱密度函数步骤,具体包括 通过端点检测判断所述两路短时平稳信号是否为语音信号; 当判断是时,确定当前信噪比,所述当前信噪比为SNRU) = aSNR(A-l) + (l-a)SNR_0,其中SNRU-1)为上一帧声源信号信噪比,SNR_0为使用当前语音信号帧与前一非语音信号帧的能量比值求得的先验信噪比,a为平滑因子; 对所述两路短时平稳信号进行快速傅里叶变换,再确定所述两路短时平稳信号的互功率谱密度函数; 当判断否时,舍弃所述两路短时平稳信号,并更新信噪比SNR( λ ) = SNR( λ -I),其中SNR ( λ -I)为上一巾贞声源信号信噪比。
    4.如权利要求3所述方法,其特征在于,当所述声源信号的短时能量和短时过零率均大于相应的阈值时,即可判定当前声源信号为语音信号。
    5.如权利要求4所述方法,其特征在于,所述确定随当前信噪比变化而调整的加权函数步骤,具体包括 根据所述当前信噪比确定加权函数炉 或者 其中Φ12( )为声源信号的互功率谱密度函数,P为与当前信噪比SNR( λ)成正比关系的调节因子, 为相干函数,其中Φι(¥)和φ 为所述两路声源信号的自相关函数。
    6.如权利要求5所述方法,其特征在于,所述根据所述互功率谱密度函数和加权函数确定所述两路声源信号的互相关函数的值序列,并根据所述互相关函数的最大值确定声源信号到达所述两个麦克风的时延步骤,具体包括 将所述互功率谱密度函数与加权函数的乘积经过傅里叶逆变换得到所述两路声源信号的互相关函数的值序列; 对所述互相关函数的值序列进行峰值检测,得到最大值点对应的抽样点,并根据抽样点间隔时间确定所述声源信号到达所述两个麦克风的时延。
    7.一种声源定位装置,其特征在于,所述装置包括 麦克风阵列采集预处理单元,用于麦克风阵列采集声源信号,并对其中任意两个麦克风采集的声源信号进行预处理; 互功率谱密度确定单元,用于确定经过所述预处理后的两路声源信号的互功率谱密度函数; 加权函数确定单元,用于确定随当前信噪比变化而调整的加权函数; 时延确定单元,用于根据所述互功率谱密度函数和加权函数确定所述两路声源信号的互相关函数的值序列,并根据所述互相关函数的最大值确定声源信号到达所述两个麦克风的时延; 声源定位单元,用于根据麦克风阵列的排列分布和所述声源信号到达其中所述两个麦克风的时延,定位声源位置。
    8.如权利要求7所述装置,其特征在于,所述麦克风阵列采集预处理单元包括 麦克风阵列采集�?椋糜诼罂朔缯罅胁杉葱藕牛� 带通滤波�?椋糜诙运雎罂朔缯罅兄腥我饬礁雎罂朔绮杉纳葱藕沤写瞬ǎ搅铰反瞬ê蟮纳葱藕牛� 分帧处理�?椋糜诙运隽铰肪瞬ǖ纳葱藕沤屑哟胺种〈恚玫搅铰范淌逼轿刃藕�。
    9.如权利要求8所述装置,其特征在于,所述互功率谱密度确定单元包括 语音判断模块,用于通过端点检测判断所述预处理后的当前帧声源信号是否为语音信号; 当前信噪比确定�?椋糜诘迸卸鲜鞘保范ǖ鼻靶旁氡龋龅鼻靶旁氡任猄NRU)=aSNRU-l) + (l-a)SNR_0,其中SNR(A-I)为上一帧声源信号信噪比,SNR_0为使用当前语音信号帧与前一非语音信号帧的能量比值求得的先验信噪比,a为平滑因子; 互功率谱密度确定�?椋运隽铰范淌逼轿刃藕沤锌焖俑道镆侗浠唬偃范ㄋ隽铰范淌逼轿刃藕诺幕スβ势酌芏群� 信号舍弃�?椋糜诘迸卸戏袷保崞隽铰范淌逼轿刃藕牛⒏滦旁氡萐NRU)=SNRU-1),其中SNRU-I)为上一帧声源信号信噪比。
    10.如权利要求9所述装置,其特征在于,所述加权函数确定单元包括 加权函数确定�?椋糜诟菟龅鼻靶旁氡热范ḿ尤ê�
    11.如权利要求10所述装置,其特征在于,所述时延确定单元包括 互相关函数获取�?椋糜诮龌スβ势酌芏群爰尤ê某嘶道镆赌姹浠坏玫剿隽铰飞葱藕诺幕ハ喙睾闹敌蛄校� 时延确定�?椋糜诙运龌ハ喙睾蟹逯导觳猓玫阶畲笾档愣杂Φ某檠悖⒏莩檠慵涓羰奔淙范ㄋ錾葱藕诺酱锼隽礁雎罂朔绲氖毖�。
    全文摘要
    本发明适用于声音处理技术领域,提供一种声源定位方法及装置,所述方法包括麦克风阵列采集声源信号,并对其中任意两个麦克风采集的声源信号进行预处理;确定经过所述两路声源信号的互功率谱密度函数;确定随当前信噪比变化而调整的加权函数;根据所述互功率谱密度函数和加权函数确定所述两路声源信号的互相关函数的值序列,并根据所述互相关函数的最大值确定声源信号到达所述两个麦克风的时延;根据麦克风阵列的排列分布和所述声源信号到达其中任意两个麦克风的时延,定位声源位置。本发明采用的加权函数能够随当前信噪比的变化做出相应调整,使得在声源信噪比改变的环境下,通过相应调整加权函数,亦可准确获取声源信号的时延,提高了声源定位精度。
    文档编号G01S5/22GK102854494SQ201210281019
    公开日2013年1月2日 申请日期2012年8月8日 优先权日2012年8月8日
    发明者彭迎标, 邵诗强 申请人:Tcl集团股份有限公司

    • 专利名称:3d四轮定位仪及其测量方法技术领域:本发明属于汽车生产、维修、服务领域,具体地说,涉及一种3D四轮定位仪及其测量方法。背景技术:按照汽车技术理论,轮胎安装到车身上必须符合一定的角度要求,其中最主要的角度有前束角、外倾角、主销内倾角
    • 专利名称:多功能电流互感器带电取油样连接器的制作方法技术领域:本实用新型涉及一种绝缘油液体取样装置,属于变电设备中检修试验装置领域,尤其是一种多功能电流互感器带电取油样连接器。背景技术:为了方便对大型变压器或电流互感器内的液体绝缘油进行化验
    • 专利名称:一种x射线透射式绿色通道车辆检测仪的制作方法技术领域:本实用新型涉及一种利用X射线透射检测绿色通道车辆的检测仪,属于交通和运输管理系统的无损检测专用检测设备。背景技术:近年来,随着国家建立高速公路鲜活农副产品绿色通道政策的施行,各
    • 专利名称:制备型气相色谱系统及其分离惰性气体样品的方法技术领域:本发明涉及一种气相色谱分离系统及气相色谱分离系统用于分离惰性气体样品的方法,特别涉及一种制备型气相色谱系统及其制备惰性气体样品的方法。背景技术:气相色谱是一种常规的分析手段,从
    • 专利名称:密封舱气密性检测及干燥处理系统的制作方法技术领域:本发明密封容器气密性检测领域,具体涉及一种集成密封舱气密性自动检测、干燥处理,并实时在线记录和储存密封舱内气体压力、温度、湿度物理性能变化的密封舱气密性检测及干燥处理系统。2.背景
    • 专利名称:具有多种分层能力的阵列微电阻率测井仪的制作方法技术领域:本发明涉及一种测井仪,特别是一种具有多种分层能力的阵列微电阻率测井仪。上述极板设有一个屏蔽电极和一个主电极,因此在测量时只能取得代表一种分层能力和一种探测深度的微电阻率曲线。
    山东亚星游戏官网机床有限公司
    全国服务热线:13062023238
    电话:13062023238
    地址:滕州市龙泉工业园68号
    关键词:铣床数控铣床龙门铣床
    公司二维码
    Copyright 2010-2024 版权所有 All rights reserved 鲁ICP备19044495号-12
    【网站地图】【sitemap】