详细信息
基于自注意力机制的航空林火图像识别方法
文献类型:专利
中文题名:基于自注意力机制的航空林火图像识别方法
作者:符利勇[1] 唐守正[1] 业巧林[1] 许中旗[1] 陈巧[1] 谭靖[1] 王秋华[1] 张志东[1] 凌成星[1] 刘强[1] 谢栋博[1] 冯林艳[1] 王文文[1]
第一作者:符利勇
机构:[1]中国林业科学研究院资源信息研究所;
专利类型:发明专利
申请号:CN202410821515.1
申请日:20240624
申请人地址:100091 北京市海淀区东小府2号
公开日:20241001
代理人:霍艳慧
代理机构:河南宏程知识产权代理事务所(普通合伙)
语种:中文
中文关键词:注意力机制;图像识别;准确率;构建;预处理方法筛选;机器学习技术;区域选择模块;特征提取阶段;多层感知器;图像数据集;小目标特征;对比特征;方式图像;模型训练;嵌入位置;数据增强;损失函数;特征学习;图像类别;学习策略;有效放大;主干网络;鲁棒性;数据源;序列化;滑动;航空;窗格;交叠;申请;嵌入;视频;标签;多头;多样性;图像
分类号:TP3
年份:2024
摘要:本申请提供基于自注意力机制的航空林火图像识别方法,包括以下步骤:获取林火视频为数据源;通过预处理方法筛选出图像,构建林火图像数据集,同时运用数据增强技术,丰富数据多样性,提高模型泛化能力;在特征提取阶段选用10层ViT作为主干网络,采用交叠滑动窗格方式图像序列化,嵌入位置信息后作为第1层ViT的输入,将前9层ViT提取的区域选择模块通过多头自注意力机制和多层感知器机制批量嵌入第10层ViT,有效放大子图间的微差异以获取小目标特征;采用对比特征学习策略,构建目标损失函数进行模型训练,获得图像类别标签,有效提高模型的特征学习能力和识别准确率。本申请利用机器学习技术提高航空林火图像识别的准确率和鲁棒性。
参考文献:
正在载入数据...
