CVPR 2023｜Limap：基于3D line的重建算法

3D视觉工坊

发布于 2023-04-30 11:13:14

5550

发布于 2023-04-30 11:13:14

文章被收录于专栏：3D视觉从入门到精通3D视觉从入门到精通

文章：3D Line Mapping Revisited

论文作者：Shaohui Liu, Yifan Yu, Rémi Pautrat, Marc Pollefeys, Viktor Larsson

机构：ETH cvg组 CVPR2023

主要内容：

提出了一种基于线的重建算法，Limap，可以从多视图图像中构建3D线地图，通过线三角化、精心设计的评分和track构建以及利用线的重合，平行性和正交性等结构先验来实现的，可以与现有的基于点的SFM算法集成，并且可以利用其3D点来进一步改善线重建的结果。

构建的3D线地图也开辟了新的研究方向，即基于线的视觉定位和BA，其中将线与点结合在一起会产生最佳结果。

代码开源在https://github.com/cvg/limap.

点云地图与线地图：

目前通过SFM估计场景几何结构和构建稀疏地图主要是基于点的方法，即提取匹配图像中的关键点，然后三角化，BA。

但是基于特征点构建点云地图在没有足够稳定的关键点去检测匹配的时候，比如室内场景，往往效果不好。但是这些场景基本都包含丰富的线条，例如在墙壁、窗户、门或天花板，而且线往往表现出更高的定位精度，因为其像素的不确定性较小。线常常以高度结构化的模式出现，通常满足场景范围的几何约束，例如共面性，重合 (线相交)，平行和正交性。但是线也会遇到不同的问题，例如线端点定位不良和部分遮挡。然而，最近的线检测器和匹配正在弥合点和线之间的性能差距，目前线图构建的困难在于：

（1）线端点不一致：由于部分遮挡，线通常在图像之间具有不一致的端点。

（2）线割裂：在每个图像中，可能有多个线段属于3D中的同一条线。与构建3D点track相比，创建线的track关联的过程更加复杂。

（3）没有两视图几何验证：点匹配可以通过极几何在两个视图中验证，但线至少需要三个视图来过滤

（4）退化：在实践中，线三角化更倾向于不稳定的配置 (参见图8)，例如每当线与相机运动平行时，线三角化会退化。

（5）较弱的基于描述子的匹配：线段的最新描述子远远落后于基于点的描述子，因此在重建过程中更加强调几何验证和过滤。

为此，本篇文章旨在减少基于点的建图解决方案和基于线的建图解决方案之间的差距

Contributions：

（1）构建了一个新的线建图系统，该系统可以从多视图RGB图像中可靠地重建3D线段。与以前的方法相比，构建的线图更完整、更准确

（2）通过自动识别和利用结构先验 (例如线重合和平行) 来实现这一目标。技术贡献涵盖了线图的所有阶段，包括线三角化，评分，track构建和联合优化。

（3）该框架是灵活的，因此研究人员可以轻松地更改组件 (例如检测器，匹配器，消失点估计器等) 或集成其他传感器数据 (例如深度图或其他3D信息)

（4）通过对合成和真实数据集进行定量评估来对性能进行基准测试，每个场景都有数百张图像，其中LIMAP始终显著优于现有方法

（5）通过在诸如视觉定位和SFM中的BA之类的任务中比纯基于点的方法有所改进，来证明强大的线图的有用性。

Pipeline：

输入：图像，还可以额外添加点云模型。假设每个图像的相机姿势是可用的 (例如，来自SfM/SLAM)。

算法包括三个主要步骤:

（1）假设生成: 对于每个2D线段，生成一组3D线假设。

（2）假设评分和track关联: 考虑到多视图一致性对每个假设进行评分，为每个2D线选择最佳候选，并将它们关联到一组3D线track中。

（3）联合优化: 与3D点和VP（消失点）方向一起在3D线track上共同执行非线性细化，将附加的结构先验集成为软约束。

论文技术点：

生成三维线假设：

为每个2D线段生成一组3D线假设，给定图像中的一个线段，使用任何现有的线匹配算法来检索n个最接近的图像中的前K个线匹配。

λ1和 λ2是投影矩阵，让所有假设的三维线的端点位于2D端点对应的相机光线上。

对于每个匹配的2D线段，通过代数线三角化生成一个假设。设 (Rm，tm) 为匹配视图的相机姿态。然后线性求解端点射线深度 λ ：

因为上面讲了线三角化会出现退化，为了在退化的情况下获得有意义的假设，利用来自点或相关消失点 (VPs) 的其他几何信息，即2D-3D点对应关系，这可以来自基于点的SfM模型，也可以从匹配的端点进行三角化。对于每个2D线段，将一个像素阈值内的所有2D点关联起来，从而与它们对应的3D点关联起来。

借助相关的2D-3D点对应和消失点，为每个2D线段生成第二组假设

假设评分和轨迹关联：

现在图像I中的每个2D线段与每个相邻图像J的一组3D线假设相关联。这部分要对这些假设进行评分并进行track关联。

利用不同的评分方法来量化两个3D线段 (L1，L2) 之间的距离。这个距离可以在三维或者二维进行度量。

距离度量：

有角距离（L1和L2之间的角度），

垂直距离（L1的端点到L2跨越最大正交距离）

透视距离: 假设L1和L2的端点在相同的光线上，该距离被定义为端点距离，如下图所示。

利用2D和3D中的角距离，以及2D中的垂直距离，和透视距离。为了将它们聚合在一起，将尺度因子 τ 关联到每个距离r，得到归一化分数

用S表示所有相应的归一化分数的集合，L1和L2之间的分数为：

现在有了每个线对的唯一分数，然后考虑来自相邻图像j和假设k的所有相邻3D线候选。一致性分数是通过对每个图像的最佳分数求和来定义的:

此时已为每个2D线段分配了唯一的3D线 (其最佳3D线候选)。然后目标是将这些2D线段集成到3D线track中。为此形成一个图，其中2D线段是节点，所有初始线匹配都是边，目标是修剪图中的边缘，以使连接的2D线段共享相似的3D线段。为此提出了两种新的线评分措施，可以应对不同的端点配置和跨图像的可变的尺度：

重叠分数：将L1正交投影到L2上，将投影的端点剪切到L2的端点 (如果它们落在L2之外) 以获得线段