图像匹配挑战赛#
Image Matching Challenge 2024 - Hexathlon
该项比赛旨在利用计算机视觉技术,匹配不同视角下的同一个场景,从而恢复每张图像拍摄时的相机内外参矩阵。今年的比赛中主要对象有室外场景和透明弱纹理物体,这里主要关注室外场景的匹配策略,来总结一下前几名的思路。
第一名:High Image Resolution ALIKED/LightGlue + Transparent Trick#
总的来说,先通过一次稀疏的匹配,将部分旋转过的图像摆正,再将图像使用 ALIKED 和 LightGlue 进行匹配,并使用 DBSCAN 获取密集的匹配区域,并再一次进行密集匹配,将匹配点输入 COLMAP 进行位姿计算。第一名完全没有使用 Dense-base 的方法,他们认为这种方法获得的匹配点通常只在两张图之间,不具备传递性,会导致模型计算错误。
亮点:#
- 根据图像稀疏匹配确定待匹配对
- 微调过的 ALIKED 和 LightGlue
- 一些运行效率上的优化,如缓存、分布式训练
- 多尺度下的特征点匹配,在 1280 分辨率下匹配一次后,通过 DBSCAN 聚类获取匹配密集区域,剪裁图像后,在 2048 分辨率下再进行一次匹配,以获取更精细的匹配
第二名:MST-Aided SfM & Transparent Scene Solution#
- 对图像进行了旋转检测和透明度检测,为了后面分别处理透明图像和非透明图像(大部分方法都将这两种图像分开处理);
- 对所有图像进行了全局特征提取,以生成更可靠的图像匹配对;
- 根据图像匹配对,使用了 **(Dedodev2+Dual SoftMax)、(DISK+LightGlue)、 (SIFT+NN)** 三种方法获取匹配点;
- 使用了一种基于最小生成树的策略获取各图像全局最优的相邻图,用于第一个粗略的 SFM;
- 同时使用全局最优的相邻图和全连接图进行 SFM,获得两个 SFM 结果,用粗略的 SFM 结果来过滤精细 SFM 结果中错误的部分,再使用 PixSFM 和 HLoc 中重定位模块来处理缺失的相机。
- 透明图像处理不做赘述。
亮点:#
- 主要在使用 MST 获取全局最优图以及使用粗略的 SFM 结果来过滤精细 SFM 结果中错误的部分