预测Geo-informative属性使用卷积神经网络在大规模图像集合

斯特凡•李、张Haipeng和大卫•克兰德尔

地理位置是一个强大的财产组织大规模的图片集,但只有一小部分在线照片地理标记。大多数工作在自动从图像内容是基于估计行程比较对模型的建筑物或地标,或者匹配大参考标记图像的集合。这些方法适合经常拍摄主要城市和旅游目的地,但失败的照片很少拍照一些参考照片存在的地方。这里我们考虑如何识别一般geo-informative照片的属性,例如海拔梯度、人口密度、人口、等的拍摄,而不是试图估计一个准确的定位。我们学习这些属性模型使用一套大型(噪声)的地理图像从Flickr通过训练深卷积神经网络(cnn)。我们在十几个属性,评估显示,自动识别一些属性是非常困难的,别人可以自动估计有人类一样的准确性。

结果

wacv_results

论文和演讲

助理条目:

@inproceedings {geoinformative2015wacv,
title ={预测Geo-informative属性使用卷积神经网络在大规模图像集合},
作者={斯蒂芬·李和张Haipeng和大卫•克兰德尔},
booktitle = {IEEE的冬季会议上应用计算机视觉(WACV)},
年= {2015}
}

下载

代码和数据已经具备很快!

IU计算机视觉实验室的项目和活动资金,部分赠款和合同由美国空军科学研究办公室(AFOSR),国防威胁降低局(DTRA) Dzyne技术,EgoVid, Inc .)、电子通信、Facebook、Google、均富LLP IARPA,印第安纳创新研究所(IN3), IU数据洞察力中心,印第安那大学副教务长办公室通过一个新兴的研究领域为研究格兰特,印第安那大学的社会科学研究,礼来养老,NASA,美国国家科学基金会(iis - 1253549, cns - 1834899, cns - 1408730, bc - 1842817, cns - 1744748, iis - 1257141, iis - 1852294),英伟达,ObjectVideo,海军研究办公室(ONR), Pixm, Inc .)和美国海军。本文所包含的观点和结论是作者和不应被解释为一定代表官方政策或支持,表示或暗示,美国政府或任何赞助商。

Baidu
map