大卫•克兰德尔,安德鲁·欧文斯,诺亚Snavely,丹Huttenlocher
亚军最佳论文CVPR 2011 !
最近的工作在结构与运动(SfM)已成功建立3 d模型从大型非结构化集合的从互联网上下载的图片。大多数方法使用增量算法,解决束调整问题越来越多。这些增量技术规模差随着图像数量的增长,而且可以漂移或陷入局部最小值。我们提出一个替代配方基于找到一个粗的SfM使用混合离散连续优化初始解,然后改善解决方案使用束调整。最初的优化步骤使用离散马尔可夫随机场(MRF)配方,加上连续Levenberg-Marquardt提纯。制定自然包含了各种信息来源相机和点,包括嘈杂的地理标签和消失点估计。我们测试方法在一些大规模的图片集,其中包括与测量相机位置,并显示它可以产生模型类似于或优于生产增量包调整,但更强劲,在很短的时间。
更多细节,请参阅我们的CVPR 2011和幻灯片从我们CVPR说话。
样本重建视频
![]() 罗马市中心 (多视点立体之后) |
![]() 康奈尔大学艺术四 |
![]() 康奈尔大学艺术四 (多视点立体之后) |
下载
- 旋转/翻译MRF代码和数据:
(zip文件的代码和数据(更新7/20/2014,66 mb的zip文件)]
[readme文件(更新7/20/2014)]
这下载包括多核,单台电脑版本的旋转和翻译MRF推理使用信念传播。它还包括雅典卫城MRF参数数据集和相对姿态估计艺术四集。这些文件可能是有用的研究人员感兴趣的空间推理与大型多维mrf标签。(文件更新7/20/2014澄清文件格式)。 - 四真实数据集与相机位置:
(图片&(7/26/2014更新包括对地面真理。txt, 8 gb tarball)]
(结果和比较代码(250 mb zip)]
(打包机跟踪文件(350 mb tarball)]
(Matlab对文件的编码和地面真理,多亏了印度科学学院的计算机视觉实验室)
这个数据集包含6514的图像艺术四康奈尔大学。大约5000图像包括带有记录的消费者GPS接收器(iPhone 3 g),而348图像非常精确的GPS坐标测量使用survey-quality差分GPS(约10厘米)的精度,可用于地面真理。也可用重建结果调整我们的方法和增量包,代码比较两组相机位置(由一个未知的相似变换,可能不同),和跟踪文件所需的打包机执行最后一束调整。 - 旧金山数据集:
(对文件、地面实况数据打包机跟踪(新7/20/2014,280 mb tarball)]
这个数据集是基于17357年谷歌街景图片从旧金山(源自相同的数据集在陈等人,“城市规模具有里程碑意义的识别在移动设备上,”CVPR 2011)。数据集包括地面真理平移和旋转,计算从街景的元数据。
论文和演讲
助理条目:
@article {disco2013pami,
作者={大卫•克兰德尔和安德鲁·欧文斯和诺亚Snavely和丹尼尔Huttenlocher},
title = {{SfM mrf}:离散连续优化大规模结构运动},
杂志= {IEEE模式分析与机器智能(PAMI)},
年= {2013},
月= {12},
体积= {35},
数量= {12},
页面= {2841 - 2853}
}
@inproceedings {sfm2011cvpr,
作者={大卫•克兰德尔和安德鲁·欧文斯和诺亚Snavely和丹尼尔Huttenlocher},
title ={离散连续优化大规模结构运动},
booktitle = {IEEE计算机视觉与模式识别会议(CVPR)},
年= {2011}
}
勘误表
2011年CVPR纸,参考“V。Govindu。李代数平均为全球一致的运动估计。CVPR 2004”应该是“V。Govindu。结合两个视图约束运动估计。CVPR 2001”。
确认
我们要感谢康奈尔设施团队帮助我们收集地面真理艺术四集。我们也感激地承认以下的支持:
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
| 国家科学 基金会 |
麻省理工学院林肯实验室 | 谷歌 | 英特尔公司 | 礼来养老 | 国际单位数据洞察力中心 |








