自其雄心勃勃的开始创建一个超链接信息系统,网络已经超过25年成为我们表达和交流的主要手段。不再局限于文本,网站的发展的视觉特性是更大的社会转变的重要信号在人类的技术、美学、文化、和行业。正如绘画可以分析研究一个时代的社会规范和文化,技术系统地分析大规模网络的档案可以帮助打开网站的视觉外观和全球变化的现代社会本身。在本文中,我们提出自动化的技术特征的视觉“风格”网站和使用此分析发现和想象随时间变化和整个网站域名。特别是,我们使用深卷积神经网络分类网站26日主题领域(如技术、新闻媒体网站)和4设计时代。这个过程产生的特性使我们能够定量描述任何特定网站的外观。我们将演示如何跟踪这些特性随时间的变化,引入技术使用隐马尔科夫模型(摘要)突然发现,在这些表象显著变化。最后,我们想象我们的网络学习的特性来帮助揭示独特的视觉元素所发现的网络。
概述和结果
数据集
网页设计时代检测
我们用设计时代检测任务互联网档案馆获得35的快照网站从1996年到2014年。
类型检测
频网站类型的数据集
类型检测任务我们使用CrowdFlower合作的URL分类数据集,由超过31000个网址域名分类在26个流派。
分类和可视化
第一步我们训练两个独立的网络检测类别和设计一个网站的时代。但我们的重点不是刚刚上最好的结果分类;更重要的问题是网络学习的可视化功能。
我们使用了类激活映射(CAM)可视化技术中最重要的部分页面的网页设计为每个类(网站类别或网页设计时代)
热量地图网站的哪些部分支持三个不同的类假设,根据分类器。
90年代是窄,例如网站网络使用这一事实(白色边缘右侧和底部的网站)检测90年代网站。
1997年Adobe.com(左)和网络的关注边缘(右)
1999年Apple.com(左)和网络的关注边缘(右)
随着互联网的速度增加,网页中的图片的大小变得更大,这一事实分类使用的网络网站从2009年至2013年的时代。
2013年Xerox.com(左)和网络的关注在大对象(右)
2009年Apple.com(左)和网络的关注在大对象(右)
但对于类型检测网络的注意力似乎在网页设计中使用的对象的类。例如,汽车和汽车类,网络是训练有素的车年代的网站。
Bmw.com.tr从汽车和汽车类(左)和网络的关注中使用的汽车设计(右)
Browneyedbaker.com从食品和饮料类(左)和网络的注意力集中在食品中使用的设计(右)
网页设计在时代
了解网页设计已经改变随着时间的推移和主要的设计先锋如何影响其他网站,我们训练一个网络从不同类别与五大网站(apple.com, msn.com, cnn.com, slac.stanford.edu和whithouse.gov)和其他网站用于测试模型。随着时间的推移我们绘制网络信心。
使情节的突然变化更可见我们使用隐马尔可夫模型(HMM)来生成一个图的平滑阴谋暴露的突然移动。
在下面的图中我们可以看到,indiana.edu是一个教育网站,发现是非常类似于slac.stanford.edu,另一个教育网站。


每个规范网站indiana.edu的相似性
还在下面的情节中我们看到,yahoo.com是非常类似于msn.com发现很长一段时间,但近年来发现它非常类似于apple.com。


每个规范网站yahoo.com的相似性


每个规范网站amazon.com的相似性
最后,我们合并所有的网站和绘制网络的信心,看看网页设计作为一个整体随时间发生了变化。


当我们看到这个图,这些网站被发现是非常类似于msn.com,直到2006年,当他们发现越来越多的类似于apple.com。嗯中我们还可以看到生成的图,其他三个网站似乎没有这些年来变化很大。
图像生成
除了识别特征我们想展示网页设计一般为特定类型或时代。我们使用网络的训练特征产生新的网页设计,没有我们的数据集的一部分。我们使用深卷积生成对抗网络(DCGAN)培训超过17万当代网站。每一块下面的照片与一个随机产生的初始化。
网站由我们的生殖敌对的网络
助理
@inproceedings{作者Doosti: 2017: DSH: 3091478.3091503 = {Doosti巴蒂亚和克兰德尔,戴维·j·苏,诺曼Makoto}, title ={深研究的历史网页设计},booktitle = {} 2017 ACM网络科学研讨会论文集,系列= {WebSci ' 17} = {2017}, isbn ={978-1-4503-4896-6},位置={美国纽约特洛伊},页面= {329 - 338},numpages = {10}, url = {http://doi.acm.org/10.1145/3091478.3091503}, doi = {10.1145/3091478.3091503}, acmid ={3091503},出版商= {ACM},地址={美国纽约},关键词={卷积神经网络、文化分析、深度学习网页设计},}
资源
咖啡模型
我们提供培训咖啡web类别模型检测和检测网页设计时代。这两个模型是AlexNet加强与全球平均池层激活映射的类。
你必须使用微调这个模型权重在培训和通过caffemodel文件中。更多信息
互联网档案馆履带
你可以下载我们的互联网档案馆履带在这里。它使用PhantomJS所以下载预编译文件并把它在我们的代码。如果你使用我们的代码或模型请引用我们的论文。
确认
我们感谢温家宝为早期发展我们的陈和徐Mingze嗯时间平滑。这项工作是由美国国家科学基金会支持部分通过职业格兰特iis - 1253549和英伟达,和使用的计算设施FutureSystems罗密欧集群由印第安纳大学和NSF RaPyDLI格兰特支持1439007。雷竞技官方网站下载
![]() |
|||||
| 国家科学 基金会 |
英伟达 |
