许可优化
许可优化
产品
产品
解决方案
解决方案
服务支持
服务支持
关于
关于
软件库
当前位置:服务支持 >  软件文章 >  6种常见的地标识别算法整理与总结(图像/视觉)

6种常见的地标识别算法整理与总结(图像/视觉)

阅读数 8
点赞 0
article_banner

本文分享自华为云社区《地标识别算法》,原文作者:阿杜 。

地标识别,基于 深度学习 及大规模图像训练,支持上千种物体识别及场景识别,广泛应用于拍照识图、幼教科普、图片分类等场景。本文将为大家带来6种关于地标识的算法。

一、《1st Place Solution to Google Landmark Retrieval 2020》

算法思路:

Step1:使用清洗过的GLDv2数据集训练初始embedding模型。

   Step2:使用全量GLDv2数据基于Step1得到的模型进行迁移学习。
Step3:逐步扩大训练图片的尺度(512*512,640*640,736*736),模型性能得到进一步提升。

   Step4:增加清洗后的数据的训练loss权重,进一步训练模型。

   Step5:模型融合。

Notes:

1、Backbone模型为Efficientnet+ global   average pooling,训练使用了cosine softmax loss。

   2、为了处理类别不均衡问题,使用了weighted cross entropy。

经验总结:

1、清洗后的数据有利于模型快速收敛。

   2、全量大数据集有利于模型学习到更好的特征表示。

   3、增加训练分辨率能提升模型性能。

二、《3rd Place Solution to “Google Landmark Retrieval 2020》

算法思路:

Step1:使用CGLDv2训练基础模型用于提取GLDv2全量图片特征,使用DBSCAN聚类方法更新图像类别,进行数据清洗。

   Step2:使用了Corner-Cutmix的图像增广方法,进行模型训练。
Notes:

   1、backbone为ResNest200和ResNet152,GAP池化,1*1卷积降维到512维,损失函数为cross entropy loss。

三、《Two-stage Discriminative Re-ranking for Large-scale Landmark Retrieval》

算法思路:

Step1:使用 CNN 特征进行KNN搜索,获取相似图片。

   Step2:插入Step1遗漏的图片进行重新排序。

Notes:

1、Backbone模型为ResNet-101+Generalized Mean (GeM)-pooling,训练loss为ArcFace loss。

   2、使用全局特征+局部特征对GLd-v2数据集进行清洗,用于后续模型训练。

四、《2nd Place and 2nd Place Solution to Kaggle Landmark Recognition and Retrieval Competition 2019》

算法思路:

1、使用GLD-v2全量数据分别训练Resnet152、ResNet200等模型,训练loss为ArcFace loss、Npairs loss,拼接各个backbone的特征,使用PCA降到512维,作为图像的全局特征。

   2、使用全局特征进行KNN搜索,对搜索结果使用SURF、Hassian-Affine 和root sift局部特征进行再排序,并且使用了DBA和AQE。

五、《Detect-to-Retrieve: Efficient Regional Aggregation for Image   Search》

算法思路:

Step1:使用GLD的带bbox数据集,训练Faster-RCNN或SSD检测模型,用于地标框的提取。

   Step2:提出了D2R-R-ASMK方法,用于检测框内的局部特征提取与特征聚合。

Step3:使用聚合后特征在database中进行搜索。

Notes:

1、D2R-R-ASMK基于DELF局部特征抽取和ASMK特征聚合方法实现。

2、每张图片提取4.05个region的时候效果最好,search的内存占用会有相应增加。

六、《Unifying Deep Local and Global Features for Image Search》

算法思路:

Step1:统一在同一个网络中提取全局和局部特征

   Step2:使用全局特征搜索top100的相似图片

Step3:使用局部特征对搜索结果进行重排序

Notes:

1、全局特征使用GeM池化和ArcFace loss。

2、局部特征匹配使用Ransac方法。

免责声明:本文系网络转载或改编,未找到原创作者,版权归原作者所有。如涉及版权,请联系删

相关文章
技术文档
QR Code
微信扫一扫,欢迎咨询~
customer

online

联系我们
武汉格发信息技术有限公司
湖北省武汉市经开区科技园西路6号103孵化器
电话:155-2731-8020 座机:027-59821821
邮件:tanzw@gofarlic.com
Copyright © 2023 Gofarsoft Co.,Ltd. 保留所有权利
遇到许可问题?该如何解决!?
评估许可证实际采购量? 
不清楚软件许可证使用数据? 
收到软件厂商律师函!?  
想要少购买点许可证,节省费用? 
收到软件厂商侵权通告!?  
有正版license,但许可证不够用,需要新购? 
联系方式 board-phone 155-2731-8020
close1
预留信息,一起解决您的问题
* 姓名:
* 手机:

* 公司名称:

姓名不为空

姓名不为空

姓名不为空
手机不正确

手机不正确

手机不正确
公司不为空

公司不为空

公司不为空