详细信息
声音识别模型的训练方法、装置、电子设备及存储介质
文献类型:专利
中文题名:声音识别模型的训练方法、装置、电子设备及存储介质
作者:郭颖[1] 高家军[1] 张旭[1] 陈艳[1] 欧阳萱[1] 于新文[1] 郭安琪[1]
第一作者:郭颖
机构:[1]中国林业科学研究院资源信息研究所;
专利类型:发明专利
申请号:CN202310348692.8
申请日:20230404
申请人地址:100091 北京市海淀区东小府2号
公开日:20230516
代理人:王震
代理机构:北京超凡宏宇专利代理事务所(特殊普通合伙)
语种:中文
中文关键词:声音识别模型;特征数据;音频样本;声音识别结果;动物声音;声音识别技术;存储介质;电子设备;模型更新;声音识别;连接层;准确率;残差;池化;卷积;轻量;标签;申请
年份:2023
摘要:本发明涉及声音识别技术领域,尤其涉及声音识别模型的训练方法、装置、电子设备及存储介质,该方法包括:将音频样本特征数据输入到当前的声音识别模型的卷积层中,得到第一音频样本特征数据;将第一音频样本特征数据依次输入到当前的声音识别模型的至少一个轻量倒残差结构中,得到第二音频样本特征数据;将第二音频样本特征数据依次输入到当前的声音识别模型的平均池化层和全连接层,得到音频样本特征数据的声音识别结果;根据音频样本特征数据的声音识别标签和声音识别结果,对当前的声音识别模型进行模型更新。本申请能够对声音识别模型进行训练,通过该声音识别模型识别动物声音,提高了识别动物声音的准确率。
参考文献:
正在载入数据...