首页 分享 一种基于注意力残差和特征融合的鸟语识别方法和系统技术方案

一种基于注意力残差和特征融合的鸟语识别方法和系统技术方案

来源:萌宠菠菠乐园 时间:2025-07-10 09:06

本发明专利技术公开一种基于注意力残差和特征融合鸟声识别方法和系统,包括如下步骤:首先对鸟类声音训练集进行分帧、加窗的预处理操作;再通过两种特征提取方法对预处理后的鸟类声音训练集进行处理,并将得到的特征信息转换为能量频谱图像;训练阶段使用带有水平垂直注意力结构模块的残差网络和交叉熵损失函数计算出鸟类种类的概率,得到最终的分类预测层,实现对鸟类声音的分类预测;设计并实现一种鸟类声音识别系统,该系统能够使用本发明专利技术提出的方法进行鸟类声音识别分类。本发明专利技术提升了对声音混淆度高的鸟类声音识别准确率,能够通过测试结果证明本发明专利技术方法的有效性。结果证明本发明专利技术方法的有效性。结果证明本发明专利技术方法的有效性。

【技术实现步骤摘要】
一种基于注意力残差和特征融合的鸟语识别方法和系统

[0001]本专利技术涉及基于深度学习的鸟类声纹识别
,特别涉及基于注意力残差和特征融合的鸟语识别方法和系统。

技术介绍

[0002]鸟类是评估生态系统健康良好的重要指标,作为生态系统的重要组成部分,鸟类的存在和迁徙模式往往是任何特定地区环境健康的警示信号。近几十年的时间里,对鸟类生物多样性的保护也越来越重视,鸟类声纹识别技术的意义也愈发重要。每种鸟类的发声结构以及器官上会存在一定的差异,也造成这些鸟类的生物特征不可复制,这些生物特征能够用于识别生物种类,鸟类声纹技术就是利用声纹识别技术对鸟类物种特有的生物特征进行种类识别。目前鸟类声纹识别技术根据模型种类可分为传统方法和基于深度学习方法;传统方法主要使用高斯混合模型和极大似然估计学习到分数最高的声音;基于深度学习的方法主要通过神经网络模型训练和识别检测。基于深度学习的方法比较传统方法和机器学习方法,在处理鸟类声识别任务上性能表现更加优秀。随着人工智能和深度学习的快速发展,鸟类声纹识别技术在保护环境领域具有广泛的应用前景...

【技术保护点】

【技术特征摘要】
1.一种基于注意力残差和特征融合的鸟语识别方法和系统,其特征在于,包括以下步骤:S1、收集自然环境中多种不同鸟类鸣叫声音,构成声音训练集;对能够知道所属鸟类品种的声音进行标注,控制每段声音时间范围在2s到30s之间,且含单种鸟类叫声;S2、对步骤S1中的声音训练集使用相同采样频率进行采样,然后通过分帧、加窗的预处理操作,统一声音训练集的音频时长;S3、通过两种特征提取方法得到特征信息,最后将特征信息转换为能量频谱图;S4、构建鸟语识别分类卷积神经网络;将S3得到的能量频谱图输入到构建的鸟语识别分类卷积神经网络中进行训练;损失函数使用分类交叉熵损失函数,设置优化策略和超参数用于构建鸟语识别分类网络,通过对网络进行循环迭代训练使损失函数不断减小,直到完成设定的迭代次数并将训练权重参数保存;S5、利用步骤S3构建的鸟语识别分类卷积神经网络和获得的网络训练权重参数构建基于注意力残差和特征融合的鸟语识别系统,并使用该检测系统对鸟类声音进行识别分类,同时使用鸟语识别系统将所有输入的鸟类声音进行数量标记和分类。2.根据权利要求1所述的一种基于注意力残差和特征融合的鸟语识别方法,其特征在于,所述步骤S3包括如下步骤:S31、依次使用梅尔三角滤波算法和倒谱均值方差归一化方法对预处理后的声音训练集进行处理,得到向量分数F;依次使用加入噪声抑制处理的伽马通滤波算法和倒谱均值方差归一化对预处理后的声音训练集进行处理,得到向量分数G;将两种向量分数进行融合得到特征信息f:f=ωF+(1

ω)G其中ω表示混合权重系数。S32、将S31中得到的特征信息f转换为能量频谱图。S33、对得到的能量频谱图进行图像增强;其中图像增强操作包括图像色彩随机灰度变换、图像旋转。3.根据权利要求1所述的一种基于注意力残差和特征融合的鸟语识别方法,其特征在于,步骤S3中所述构建的鸟语识别分类卷积神经网络,具体为:网络结构依次设置3个卷积...

【专利技术属性】
技术研发人员:程吉祥,潘齐炜,李志丹,何虹斌,曾蕊,
申请(专利权)人:西南石油大学,
类型:发明
国别省市:

相关知识

一种基于注意力残差和特征融合的鸟语识别方法和系统
一种基于注意力残差和特征融合的鸟语识别方法和系统.pdf
一种基于深度残差网络的宠物图像情绪识别方法与流程
一种基于深度残差网络的宠物图像情绪识别方法
一种基于多线索融合的动物行为识别方法
鸟语分类模型训练方法及鸟语识别方法技术
基于面部图像的实时动物情绪识别方法、装置及相关组件
一种基于神经网络的宠物声音识别方法及系统技术方案
一种基于深度残差网络的宠物图像情绪识别方法.pdf
基于深度特征融合的鸟鸣识别方法及其可解释性分析

网址: 一种基于注意力残差和特征融合的鸟语识别方法和系统技术方案 https://www.mcbbbk.com/newsview1203163.html

所属分类:萌宠日常
上一篇: 语音识别和控制技术在宠物寄养管理
下一篇: 自动猫砂盆哪个好?鸟语花香和CE

推荐分享