首页 分享 基于机器学习的鸟声识别研究.pdf

基于机器学习的鸟声识别研究.pdf

来源:萌宠菠菠乐园 时间:2025-05-19 18:12

天津师范大学硕士学位论文 摘要 鸟声识别是将人工智能中的语音识别技术应用到鸟类音频上的研究工作。目前,不 同于发展成熟的图像识别领域,鸟声识别研究在国内还是处于初始发展阶段,其目的主 要是实现人类了解自然生态圈的一种方式。同人类声音一样,鸟鸣声中包含了丰富的语 义信息,通过对鸟声音频的研究有助于鸟类生态功能的发挥,为生态系统提供服务。鸟 类在生态系统中承担着一定的角色,自然环境中由于位置原因,对其形态的捕捉要难于 对声音的捕捉,而鸟声中所蕴含的种类信息使得我们的进一步研究成为可能。人工智能、 信号处理方面的研究工作为我们进行鸟鸣声分析提供了强大的技术支持,使得利用机器 学习、深度学习方法进行鸟声分类成为现实。 本文对鸟类音频特征处理和分类器方面进行了研究。分别采用了三种不同研究方法 进行实验分析:基于梅尔频率倒谱系数 (Mel-frequency cepstral coefficients,MFCC)和 计算机辅助语言学挑战 (Computational ParalinguisticsChallengE,ComparE)的人工特 征研究,基于序列到序列的高级表示特征研究以及基于深度神经网络的研究。在人工特 征研究和序列到序列的方法研究中,通过提取对应的特征,并利用这些特征训练支持向 量机 (SupportVector Machine,SVM)和多层感知器 (Multi Layer Perceptron,MLP) 来对鸟声进行分类。在基于深度神经网络的研究中,分别进行了双向长短期记忆 (Bi-directional Long Short-Term Memory ,BLSTM )和时序卷积网络 (Temporal convolutionalnetwork,TCN)的实验对比研究,并结合了自注意力机制 (Self-Attention) 进行深度神经网络的权重分配,构建了CBLSTM-Attention 和CTCNs-Attention 两种不同 的鸟声识别模型。为了判定所提出模型的识别性能,本文还将前人研究工作中的 GoogLeNet、Inception_resnet_v2、MobileNet、Resnet50和VGG16 五种经典神经网络模 型应用到鸟声识别上,进行对比研究工作。 经过多次实验发现,本研究所提出的基于人工特征 (ComparE+MLP)的鸟声识别 模型和基于深度神经网络的鸟声识别模型(CTCNs-Attention)的实验结果均优于前人研 究的五种经典神经网络模型。而在提出的基于深度神经网络的鸟声识别模型中, CTCNs-Attention 的识别效果要明显优于CBLSTM-Attention,通过这两种识别模型的对 比,突出反映出TCN 在识别效果上的优势。 关键词:鸟声研究,特征提取,机器学习,神经网络,序列到序列 I 天津师范大学硕士学位论文 目录 摘要I AbstractII 第一章 绪论1 1.1 选题背景与研究意义1 1.1.1 选题背景1 1.1.2 研究意义2 1.2 国内外研究现状3 1.3 研究内容与路线7 1.3.1 研究内容7 1.3.2 研究路线8 1.4 本文研究工作及组织结构9 第二章 基于人工特征的鸟声识别模型11 2.1 数据集11 2.2 音频预处理12 2.3 语音特征提取13 MFCCs 2.3.1 梅尔频率倒谱系数 ( ) 13 2.3.2 ComparE 特征集14 2.4 特征数据的标准化和归一化14

相关知识

基于机器学习鸟声识别算法研究进展
基于机器学习的居家老人活动识别与日常行为规律研究
基于机器学习的猪只行为识别与分类方法研究
基于深度学习的猪只行为识别
一种基于声音特征优化选择的鸟声识别方法
【计算机科学】【2019.03】基于深度学习的动物识别
深度学习项目:CBAM与DenseNet121融合进行鸟类声音识别
基于姿态估计的动物行为识别研究进展
基于深度学习的犬类面部识别,检测和生成的算法研究
最新最全论文合集——基于机器学习/深度学习的情绪识别

网址: 基于机器学习的鸟声识别研究.pdf https://www.mcbbbk.com/newsview1167716.html

所属分类:萌宠日常
上一篇: 鸟是靠什么认得主人的
下一篇: 鸟类声音识别方法、模型训练方法、

推荐分享