GB/T 45348-2025 信息技术 实时定位 声源定位成像系统技术规范 , 该文件为pdf格式 ,请用户放心下载!
尊敬的用户你们好,你们的支持是我们前进的动力,网站收集的文件并免费分享都是不容易,如果你觉得本站不错的话,可以收藏并分享给你周围的朋友。
如果你觉得网站不错,找不到本网站,可以百度、360搜搜,搜狗, 神马搜索关键词“文档天下”,就可以找到本网站。也可以保存到浏览器书签里。
收费文件即表明收集不易,也是你们支持,信任本网站的理由!真心非常感谢大家一直以来的理解和支持!
CCS L66
中华人民共和国国家标准
GB/T45348—2025
信息技术 实时定位
声源定位成像系统技术规范
Informationtechnology—Realtimelocating—Technicalspecificationfor
soundsourcelocatingandimagingsystem
2025-02-28发布2025-09-01实施
国家市场监督管理总局
国家标准化管理委员会发布
目 次
前言………………………………………………………………………………………………………… Ⅲ
1 范围……………………………………………………………………………………………………… 1
2 规范性引用文件………………………………………………………………………………………… 1
3 术语和定义……………………………………………………………………………………………… 1
4 系统参考架构…………………………………………………………………………………………… 2
4.1 总体描述…………………………………………………………………………………………… 2
4.2 数据采集层………………………………………………………………………………………… 3
4.3 数据处理层………………………………………………………………………………………… 3
4.4 交互层……………………………………………………………………………………………… 4
5 技术要求………………………………………………………………………………………………… 4
5.1 功能要求…………………………………………………………………………………………… 4
5.2 性能要求…………………………………………………………………………………………… 5
6 测试方法………………………………………………………………………………………………… 6
6.1 测试条件…………………………………………………………………………………………… 6
6.2 功能测试…………………………………………………………………………………………… 6
6.3 性能测试…………………………………………………………………………………………… 7
附录A (资料性) 声源定位成像原理…………………………………………………………………… 10
附录B(资料性) 麦克风阵列坐标系设置示例………………………………………………………… 11
附录C(资料性) 系统流程图…………………………………………………………………………… 12
参考文献…………………………………………………………………………………………………… 13
Ⅰ
GB/T45348—2025
前 言
本文件按照GB/T1.1—2020《标准化工作导则 第1部分:标准化文件的结构和起草规则》的规定
起草。
请 注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。
本文件起草单位:科大讯飞股份有限公司、中国电子技术标准化研究院、国网安徽省电力有限公司
电力科学研究院、中国科学院计算技术研究所、合肥智能语音创新发展有限公司、杭州微影软件有限公
司、中国电力科学研究院有限公司、浙江潮汐力科技有限公司、杭州品铂科技有限公司、国能数智科技开
发(北京)有限公司、北京科技大学、合肥四相至新科技有限公司、北京麦钉艾特科技有限公司、苏州寻息
科技股份有限公司、羚羊工业互联网股份有限公司、北京交通大学、安徽听见科技有限公司、重庆邮电大
学、清研讯科(北京)科技有限公司、武汉大学、浙江讯飞智能科技有限公司、中国科学院自动化研究所、
北京市燃气集团研究院、北京华控智加科技有限公司、深圳市燃气集团股份有限公司、中国电子科技集
团公司第五十四研究所、深圳市博思高科技有限公司、广东中创智家科学研究有限公司、南方电网数字
电网科技(广东)有限公司、龙源电力集团股份有限公司、中国联合网络通信有限公司智能城市研究院、
深圳云里物里科技股份有限公司、郑州联睿电子科技有限公司、杭州兆华电子股份有限公司、北京电信
规划设计院有限公司、电子科技大学长三角研究院(衢州)、北京新锐科创科技有限公司、深圳市铨顺宏
科技有限公司、上海热像科技股份有限公司、北京声智科技有限公司、西安联丰迅声信息科技有限责任
公司、北京谛声科技有限责任公司、长沙中联重科环境产业有限公司、温州市研创物联网科技有限公司、
宜宾市天珑通讯有限公司、深圳市爱特姆科技有限公司、合肥君信电子科技有限公司、咸亨电气技术(杭
州)有限公司、深圳市视联卓创科技有限公司、深圳时空数字科技有限公司、上海格鲁布科技有限公司、
杭州爱华仪器有限公司、环鸿电子(昆山)有限公司、上海赛铭特科技有限公司、江苏赛西科技发展有限
公司。
本 文件主要起草人:胡国平、张璋、宋继伟、王文峰、蔡明琦、张晖、杨海涛、刘颖、杨杰、胡啸宇、
罗海勇、吴江照、宋若淼、耿力、梁启晨、赵方、韩帅、李俊、黄佳佳、王晓燕、王曲、徐明璐、李素敏、刘晓伟、
周维、高睿鹏、王玮、聂文迪、裘有斌、邓跃进、宫韬、高伟、车明、刘加、张浩、李爽、李启家、黄伟彬、
曾乔迪、张国珍、刘琪、张敏、肖岩、柴宇佳、曹祖杨、郭丙峰、陈祝明、王正生、石春磊、许毅、陈孝良、
李晓强、黄毅伟、虞小跃、林凌鹏、周波、孙振培、李朋辉、李文国、席旭刚、张涛、孙文化、沈道义、毛志德、
刘上、陈明、赵峻莉。
Ⅲ
GB/T45348—2025
信息技术 实时定位
声源定位成像系统技术规范
1 范围
本文件确立了声源定位成像系统的系统参考架构,规定了技术要求,描述了相应的测试方法。
本文件适用于声源定位成像系统的设计、开发和测试。
2 规范性引用文件
本文件没有规范性引用文件。
3 术语和定义
下列术语和定义适用于本文件。
3.1
声源定位成像系统 soundsourcelocatingandimagingsystem
用来确定声源位置并展现声场空间分布的软硬件系统。
注:声源定位成像原理见附录A。
3.2
声压级 soundpressurelevel
被测声压与基准声压的比值。
注:声压级Lp 计算公式见公式(1)。
Lp =20lgp
p0 ……………………(1)
式中:
p ———被测声压,单位为微帕(μPa);
p0 ———取值声压,取值为20μPa;
Lp ———声压级,单位为分贝(dB)。
3.3
麦克风阵列 microphonearray
由具有确定空间拓扑结构的多个麦克风组成的,对声学信号的空间特性进行采样的装置。
[来源:GB/T36464.1—2020,3.23,有修改]
3.4
麦克风阵列坐标系 microphonearraycoordinatesystem
以麦克风阵列(3.3)的中心为原点,在麦克风阵列(3.3)接收平面及其法向方向所建立的空间三维
直角坐标系。
注:附录B给出了麦克风阵列坐标系的一种建立方式。
3.5
方位角 azimuthangle
被观测点相对于麦克风阵列坐标系(3.4)x 轴正方向的水平旋转角度。
1
GB/T45348—2025
3.6
俯仰角 pitchangle
被观测点相对于麦克风阵列坐标系(3.4)xoz 平面上下旋转的角度。
3.7
声场分布热力图 heatmapofsoundfielddistribution
通过数据可视化技术来显示空间中声场分布情况的示意图。
3.8
时频图 time-frequencyfigure
描述信号的频率随时间的变化关系的图像。
3.9
声源定位 soundsourcepositioning
通过空间中的声场分布热力图(3.7),确定声源位置信息。
注:附录A给出了一种基于延时求和算法进行声源定位的介绍。
3.10
声源成像 soundsourceimaging
将空间中的声场分布热力图(3.7)与对应视场的视频图像叠加,以可视化的形式展现声源的空间
分布。
3.11
定位准确度 positioningaccuracy
声源定位成像系统对被观测点的定位结果与参考结果间的一致程度。
3.12
定位精确度 positioningprecision
在规定条件下,声源定位成像系统对被观测点多次定位结果间的一致程度。
4 系统参考架构
4.1 总体描述
声源定位成像系统(以下简称“系统”)通过空间中的声场分布热力图来确定声源的位置信息,再将
空间声场分布热力图与视频图像叠加,用可视化的形式展现声源的空间分布。
系统参考架构可分为数据采集层、数据处理层和交互层三个部分,系统参考架构见图1,系统流程
图见附录C。
2
GB/T45348—2025
注:虚框为可选内容。
图1 系统参考架构
4.2 数据采集层
数据采集层包括摄像装置、麦克风阵列、温湿度气压传感装置和测距传感装置。
a) 摄像装置用于获取俯仰角和方位角范围内的实时图像画面。
b) 麦克风阵列用于实时采集声音数据。
c) 温湿度气压传感装置用于获取表征环境湿度、温度、压力等参量的原始信号。
d) 测距传感装置用于获取表征观测点与系统之间距离的原始信号。其中,观测点可通过辅助瞄
准器确定。
4.3 数据处理层
数据处理层包括图像处理模块、声音处理模块、环境感知处理模块、距离测量处理模块、声源定位模
块、分析图谱生成模块和声视叠加模块:
a) 图像处理模块根据俯仰角和方位角范围进行实时画面裁剪;
b) 声音处理模块读取采集到的声音数据并将其进行格式转换;
c) 环境感知处理模块读取温湿度气压传感装置采集的数据并将其转化为实际的测量值,并基于
测量值计算当前环境参数下的实际声速值;
d) 距离测量处理模块读取测距传感装置采集的数据并将其转化为观测点与系统之间的实际距离
测量值;
e) 声源定位模块对采集的声音信号进行处理,计算在系统的视场范围内,不同方位角、俯仰角处
声压级的大小;
f) 分析图谱生成模块基于声源定位模块的分析数据,生成可用于分析的图谱,例如时频图等;
3
GB/T45348—2025
g) 声视叠加模块通过空间坐标转换,将视频图像和声音定位信息融合,形成带声源定位成像信息
的视频流。
4.4 交互层
交互层包括声源定位成像显示模块、分析图谱显示模块、声源参数配置模块和基础交互模块。
a) 声源定位成像显示模块是一种实时动态显示界面,将声视叠加模块输出视频流和声源定位渲
染的热力图实时进行可视化展示。
b) 分析图谱显示模块是一种实时展示声源图谱频率和能量分布的图表,可用于声源特征的辅助
分析。
c) 声源参数配置模块包括声源成像频率调整子模块和声源特性调整子模块:
1) 声源成像频率调整子模块用于提供不同定位频率的选择功能;
2) 声源特性调整子模块用于提供单声源/多声源显示模式选择和声源阈值选择等。
d) 基础交互模块包括声源成像拍照/录制子模块、历史记录与详情子模块:
1) 声源成像拍照/录制子模块具有声场分布热力图保存能力,提供拍照和录制选项;
2) 历史记录与详情子模块用于提供系统相关记录查询功能,如日期、地点、传感器状态等。
5 技术要求
5.1 功能要求
5.1.1 声源定位
通过声源定位功能,系统可得到声源的位置、方位角和俯仰角及距离等信息。声源定位的具体要求
如下:
a) 应在声场分布热力图上标注出声源中心所处的位置;
b) 宜根据空间中声场分布情况,获得声源的具体方位角和俯仰角信息;
c) 宜给出声源相对于系统选定观测点的距离。
5.1.2 声源成像
系统应具备将声场分布热力图进行成像显示的功能。
5.1.3 频率调整
系统应具备实时调整成像频率范围或预设多个成像频段的功能,满足声源成像对不同频率范围的
需求。
5.1.4 时频图显示
系统宜具备显示时频图的功能。
5.1.5 声源选择
通过声源选择功能,系统可实现单声源和多声源定位模式的选择,声源选择的具体要求如下:
a) 应具备单声源定位的功能;
b) 宜具备多声源定位的功能;
c) 若具备多声源定位的功能,则应具备单/多声源定位模式选择的功能。
4
GB/T45348—2025
5.1.6 拍照和录制
系统应具备声场分布热力图的拍照和录制功能。
5.1.7 记录和回放
通过记录和回放功能,系统可实现对声源定位成像结果的记录和调取回看,记录和回放的具体要求
如下:
a) 应能记录并输出声源定位成像结果;
b) 宜具备视频、音频的记录及输出功能,并可随时调取查看已记录的测试结果。
5.2 性能要求
5.2.1 实时性
自采集到声音信号至声源成像显示的时间间隔应在500ms以内。
5.2.2 成像声压级
在环境底噪不高于30dB时,应能对声压级在30dB~90dB之间的信号进行声源成像。
5.2.3 成像范围
声音信号采集及成像的角度范围应以麦克风阵列中轴为基准,俯仰角宜不小于35°,方位角宜不小
于48°。
5.2.4 成像距离
在满足5.2.2中的成像声压级要求下,应能对距离麦克风阵列坐标系原点40m 范围内的声音信号
进行声源成像。
5.2.5 定位准确度
在满足5.2.4中的成像距离要求下,对单声源定位准确度应在3°以内。
5.2.6 定位精确度
在满足5.2.4中的成像距离要求下,对固定目标的单声源定位结果,其在角度上分布的标准差应在
0.2°以内。
5.2.7 双声源分辨率
在满足5.2.2中的成像声压级以及5.2.4中的成像距离要求下,系统能分辨的两个声源与麦克风阵
列坐标系原点形成的夹角之间的最小角度应在10°以内。
5.2.8 录像帧率
在进行视频记录时,视频的传输帧率应不低于25f/s。
5
GB/T45348—2025
6 测试方法
6.1 测试条件
6.1.1 测试环境
除非另有规定,测试在下述环境条件下进行。
a) 环境温度:15℃~35℃。
b) 相对湿度:25%~75%。
c) 大气压:86kPa~106kPa。
d) 如在室内测试,应选择安静无扰的环境进行测试,如半消室或全消室;环境底噪不高于30dB。
e) 如在室外测试,应选择晴好天气在开阔场地进行测试,避免遮挡物,环境中无其他明显干扰信
号影响测试,且风速在5m/s以下。
6.1.2 测试声源
用于测试的声源宜为20kHz~60kHz频率范围内的单频正弦信号或宽频信号。
6.1.3 频段设置
系统的成像频段设置应覆盖测试声源的频率。
6.1.4 录像帧率
用于测试的摄像设备的录像帧率应不低于60f/s。
6.2 功能测试
6.2.1 声源定位
改变测试声源与麦克风阵列的相对角度,若观察亮斑能追随成像画面中声源的位置而变化,记录具
备声源定位功能,其他情况则记录不具备。
6.2.2 声源成像
打开(持续至少30s)和关闭测试声源信号发射系统,观察被测系统显示设备,目测显示中心在打开
信号发射系统时,是否出现单一、局域的亮斑,并且随着测试声源信号终止而消失,记录是否具备声源成
像功能。
6.2.3 频率调整
进入频率调整模块,调整频率范围观察声源成像变化,记录是否具备频率调整功能。
6.2.4 时频图显示
进入时频图显示模块,观察系统显示设备里时频图是否正常显示,记录是否具备时频图显示功能。
6.2.5 声源选择
进入声源切换功能,可选择单声源模式和多声源模式;放置两个或两个以上声源发出相同信号,观
察系统显示设备,在单声源模式下是否可对一个声源成像;在多声源模式下是否可对多个声源成像。
6
GB/T45348—2025
6.2.6 拍照和录像
分别选择拍照和录像模式,通过文件系统确认是否对声源成像进行对应的图片和视频保存。
6.2.7 记录和回放
使用系统的记录功能,查看是否能记录成像效果图,并可随时调取查看已记录的测试结果。
6.3 性能测试
6.3.1 实时性
实时性的测试方法如下。
a) 摄像设备置于被测系统与测试声源同一水平线上,使摄像设备能清晰捕捉被测系统的成像
画面。
b) 开启摄像设备、被测系统和测试声源,测试声源宜使用单频正弦信号,频率宜取20kHz~
60kHz范围内的某一频率;被测系统与测试声源参考点的距离设置为2m。
c) 分析摄像设备采集的音频和视频,被测系统的实时性计算见公式(2)。
t=t0 +t1 ……………………(2)
式中:
t0———摄像设备接收到测试声源和对应视频中声源位置处出现成像画面的时间差;
t1———摄像设备与被测系统之间的声音传播时间。
6.3.2 成像声压级
成像声压级的测试方法如下:
a) 测试声源宜使用单频正弦信号,频率宜取20kHz~60kHz范围内某一频率,被测系统与声源
参考点距离设置为2m;
b) 使用标准测量设备记录系统所在位置的声压级,连续调整声源强度,使该声压级从90dB逐渐
降至30dB以下,目测被测系统是否能在30dB以下稳定成像;
c) 调整声源发出信号强度,使被测系统坐标原点处声压级从30dB逐渐提升至90dB以上,目测
被测系统是否能在90dB以上稳定成像。
6.3.3 成像范围
成像范围的测试方法如下:
a) 测试声源宜使用单频正弦信号,频率宜取20kHz~60kHz范围内某一频率,被测系统与声源
参考点距离设置为2m;
b) 以被测系统麦克风阵列中轴为基准,将测试声源分别置于与中轴线垂直面的待测点P1、P2、
P3、P4 处,空间几何结构如图2所示;
c) 目测观察被测系统是否能清晰稳定成像。其中,夹角θ 为俯仰角的角度范围,夹角ϕ 为方位角
的角度范围,俯仰角与方位角应满足5.2.3的要求。
7
GB/T45348—2025
图2 声源成像范围检测点示意图
6.3.4 成像距离
极限成像距离的测试方法如下:
a) 固定测试声源的信号强度和频率范围,频率宜取20kHz~60kHz范围内的某一段频率,1m
距离声源信号强度宜为70dB;
b) 在声源正对且距离系统1m 可稳定成像时,按0.5m 步长远离声源进行移动,直至被测系统成
像效果消失,记录声源距离系统的距离;
c) 在测试结果或报告中记录测试声源信号的频率和幅值。
6.3.5 定位准确度
定位准确度的测试方法如下。
a) 被测系统正对声源2m,利用声源产生一组固定幅值的单频正弦信号,频率宜取20kHz~
60kHz范围内某一频率。
b) 使用被测系统录像功能,连续采集时间不少于30s,逐帧分析成像画面,每帧画面映射到目标
声源所处的成像映射面,如图3所示,夹角θ 即为定位准确度。计算公式见公式(3)。
θ=(B'C'/r)×180/π ……………………(3)
式中:
B'———声源成像映射中心;
C'———声源中心;
r ———被测系统A 到成像映射面的距离。
图3 定位准确度检测示意图
6.3.6 定位精确度
定位精确度的测试方法如下。
8
GB/T45348—2025
a) 被测系统正对声源2m,利用声源产生一组固定幅值的单频正弦信号,频率宜取20kHz~
60kHz范围内某一频率。
b) 使用被测系统录像功能,连续采集时间不少于30s,测量每一帧成像画面的定位角度,计算定
位角度的标准差值。标准差计算公式如式(4)。
σ= ΣN
i=1 (Xi -X )2/(N -1) ……………………(4)
式中:
σ ———测量样本数据标准差;
Xi ———第i 次测量的样本值;
?X ———样本数据的平均值;
N ———测量次数。
6.3.7 双声源分辨精度
双声源分辨精度的测试方法如下:
a) 被测系统正对声源2m,利用声源产生一组固定幅值的单频正弦信号,频率宜取20kHz~
60kHz范围内某一频率,且幅值差异应在5dB以内;
b) 按图4所示分别进行四组双声源测试,每组测试声源A 和B 分别置于(P1,P5)、(P2,P6)、
(P3,P7)、(P4,P8);
c) 记录系统显示设备能否同时显示声源A 和B 的成像。
注:双声源定位分辨率2θ0 =10°;被测系统与声源的距离为r0;P1:(r0,θ0);P2:(r0,2
2θ0);P3:(r0,0);P4:
(r0,- 2
2θ0);P5:(r0,-θ0);P6:(r0,- 2
2θ0);P7:(r0,0);P8:(r0,2
2θ0)。
图4 多声源分辨精度检测示意图
6.3.8 录像帧率
进入系统选择录像功能,对声源信号进行录像,导出录像分析录像帧率。
9
GB/T45348—2025
附 录 A
(资料性)
声源定位成像原理
声源定位成像技术基于传声器阵列测量理论,利用阵列充分捕获空间信息,借助阵列的空间选择特
性以实现非期望声源的信号抑制,获得采集区域的声场分布,并将声场分布图与视频图像进行叠加形成
声成像图,声成像图中可直观显示声源位置、强度等信息。
如图A.1、图A.2所示,以延时求和波束形成算法为例。假设在聚焦面B 上存在一个声源,传感装
置阵列位于测量面A 上。由于各个传感装置与声源之间存在距离上的差异,因此信号在到达每个阵元
上都会有一定的时间差,时间差与实际的声速大小直接相关,可基于环境的温湿度和大气压获得更为准
确的声速进行计算。通过对不同阵元接收的信号进行延时处理后进行叠加,实现对指定方向的波束ra
拾音。通过扫描空间指定区域内的方向,即可获得相应的声场分布云图。以对应的视频图像为背景,与
声场分布云图相互叠加融合,从而形成声源定位成像系统的输出结果。
图A.1 延时求和示意图
图A.2 波束形成扫描示意图
10
GB/T45348—2025
附 录 B
(资料性)
麦克风阵列坐标系设置示例
方位角和俯仰角分别衡量声源相对于麦克风阵列平面正对方向在水平面上的转角和竖直面上的转
角。麦克风阵列坐标系设置可参考图B.1。以麦克风阵列平面中心点O 为原点建立右手坐标系,A 为
麦克风阵列平面,以麦克风阵列向前法向方向为z 轴,P 为声源位置,P'为声源在xoz 平面上的投影。
方位角可以用OP'与x 轴正方向的夹角ϕ 表示,取值范围为±180°,其中P'落在z 轴正半区域为正;俯
仰角可用OP 与xoz 平面的夹角,即POP'的锐角夹角θ 来表示,取值范围为±90°,其中P 在y 轴正半
区域为正。
图B.1 麦克风阵列坐标系设置示意图
11
GB/T45348—2025
附 录 C
(资料性)
系统流程图
系统流程图见图C.1,具体流程如下。
a) 摄像装置将实时采集的图像数据输入给图像处理模块,由图像处理模块进行裁剪、增强等图像
处理后输入给声视叠加模块。
b) 麦克风阵列将实时采集的声音信号输入给声音处理模块,由声音处理模块进行格式转换,再输
入给声源定位模块。
c) 温湿度气压传感装置获取环境参量信息,由环境感知处理模块将其转化为实际测量值,再传送
给声源定位模块。
d) 测距传感装置获取声源与观测点的相对距离,由距离测量处理模块将其转化为实际测量值,再
传送给声源定位模块。
e) 声源参数配置模块是基于实际需求对声源频率和声源特性进行参数调整。
f) 声源定位模块将声场、环境、距离、声源参数等相关数据进行融合处理,得到声场的分布结
果,再交给声视叠加模块和分析图谱生成模块。
g) 声视叠加模块将从图像处理模块接收到的视频图像,与从声源定位模块接收到的声音定位信
息进行数据融合,形成带有声源定位成像信息的视频流,传送到系统应用的声源定位成像显示
模块进行图像显示。
h) 分析图谱生成模块基于声源定位模块的分析数据,生成可用于分析的图谱,传送到系统应用的
分析图谱显示模块进行图谱显示。
i) 基础交互模块用于保存声源定位成像的结果。
图C.1 系统流程图
12
GB/T45348—2025
参 考 文 献
[1] GB/T6379.1—2004 测量方法与结果的准确度(正确度与精密度) 第1部分:总则与定义
[2] GB/T12060.2—2011 声系统设备 第2部分:一般术语解释和计算方法
[3] GB/T36464.1—2020 信息技术 智能语音交互系统 第1部分:通用规范
13
GB/T45348—2025
评论