感兴趣的人工智能、机器学习、机器人、计算机视觉、自然语言处理、和/或广泛的相关领域?欢迎您的光临!大多数谈判2018年春季将于星期一下午二时三十分举行,下午0117 Luddy大厅。订阅我们的邮件列表发送一个空白的邮件给list@list.indiana.edu主题:“订阅iis-seminar-l”。大卫•克兰德尔联系djcran@indiana.edu,问题或建议的人。
2018年春季
先一古脑地复制很多计算机建模角色类似真实的人有时会引起感冒,怪异的感觉。这种效应称为“恐怖谷”,归因于不确定性是否人类生活或真正的角色。不确定性,然而,也解释了为什么拟人化角色躺在“恐怖谷”和怪诞特征。我们认为现实不一致导致拟人化角色显得陌生,尽管他们的身体相似,真实的人,由于知觉缩小。我们进一步提出,他们不熟悉的、虚假的外表抒发冷,怪异的感觉,激励避免威胁。在我们的实验中,365名参与者的分类和评价对象,动物,和人类的现实主义是沿着consistency-reduced操纵和控制转换。这些数据被用来量化分类知觉的贝叶斯模型。在假设检验中,我们发现减少现实一致性不使物体显得不太熟悉,但只有动物和人类,从而引发感冒,怪异的感觉。接下来,结构方程模型阐明现实主义之间的关系不一致(客观地衡量在一个二维Morlet小波域受初级视觉皮层),现实主义,熟悉,阴森恐怖,但温暖。减少现实一致性只有引起感冒,怪异的情谊拟人化角色,只有当这个减少熟悉,表明知觉缩小在“恐怖谷”的作用。
MacDorman卡尔·f·是印第安纳大学信息学院的副教授和计算,印第安纳波利斯,他也是一个项目总监和雷竞技官方网站下载副院长。他完成了一个在加州大学文学士学位1988年伯克利分校,1997年剑桥大学的博士学位,在计算机科学。MacDorman以前副教授(2003 - 2005)和(1997 - 2000)在大阪大学助理教授。他已经发表了100多篇论文在人机交互中,机器人,机器学习,认知科学,可以从macdorman.com。
机器学习的进步和深入学习的性能在挑战模式识别任务还鼓励使用人工智能模型在应用程序与有限的资源。因此,机器学习模型的效率,特别是在测试期间,正在变得越来越重要。这个演讲介绍了两个简化机器学习模型:位矩阵分解和心理声学的加权网络压缩成本函数。位矩阵分解转换词典矩阵分解问题的关键特征空间,以便计算后验概率在一位时尚。它显示了承诺在去噪应用程序性能。接下来,介绍了心理声学的加权成本函数导致深层神经网络更放松局部最小值。因为网络可以更关注感知声音更重要组件比听不清的,网络可以产生等效语音增强感知的结果不那么复杂的网络拓扑结构。
社交媒体,电子健康记录和移动应用程序数据使群体观察工具速度转化研究的潜力。我将讨论在我们集团在这方面正在进行的工作。首先,我将演示Instagram的管制药物的相互作用的重要性。我们的方法是基于社交媒体用户时间表的纵向分析在不同的时间尺度:每天、每周和每月。同现的加权图的构建从各种生物医学词典(药物,症状,天然产物、副作用和情绪)在不同的时间尺度。我们表明,光谱方法,最短路径,和距离闭包(2、3)揭示有关药物之间和drug-symptom对集群的条款和药物相关的复杂的病理与抑郁症有关[1]。
另一个我们复杂系统的方法对公共卫生的重要组成部分是纵向的词汇情感分析社交媒体内容,它提供了一个有用的工具,量化与集体社会行为相关的情绪状态。我们最近使用这些方法提供了强有力的证据表明人类的循环性和生殖行为主要是由文化。这样做是通过测量在全球范围的兴趣性,通过出生和谷歌趋势数据,以及独立的集体情绪在Twitter上的测量。我们表明,兴趣性与地理位置无关,而是与特定的情绪特征主要文化和宗教庆祝活动[4]。这项工作表明计算社会科学技术可用于测试新的公共卫生假说的相关性。在这种情况下,我们能够提供了强有力的证据表明卫冕生物假说——人类生殖周期是一个适应季节性,hemisphere-dependent太阳周期,与新行星可用的数据不兼容的在线行为。事实上,文化假设——人类的性周期是由集体情绪相关的文化和宗教庆典——更有可能。我将讨论这背后的方法论分析,通过引入一个新的情感分析技术基于奇异值分解的[5]。
最后,我将讨论即将到来的工作,我们整合社会媒体分析与其他生物医学数据,如电子健康记录使用时间多路网络分析和基因调节。我们例证的方法与18个月的研究药物相互作用发生在Blumenau, SC-a中等城市南部Brazil-using全市药品调剂数据同时从主服务器和备用——保健,通过城市的卫生信息系统(他)[6]。
[1]R.B.科雷亚是l . Li L.M.罗查[2016]。Pac,计算机协会。Biocomp 21:492 - 503。
[2]t .硅镁层和L.M.罗查[2015]。网络科学3 (2):227 - 268。
[3]G.L. Ciampaglia, p . Shiralkar L.M.罗查,j·博伦,f . Menczer a Flammini [2015]。《公共科学图书馆•综合》。10 (6):e0128193。
我[4]。B木材,P.L. Varela, j .博伦L.M.罗查,j . Goncalves-Sa [2017]。7.1科学报告:17973。
[5]m .墙,a . Rechtsteiner L.M.罗查。”“奇异值分解和主成分分析。”:一个实际的微阵列数据分析方法。施普林格,2003年。91 - 109。
[6]科雷亚是Araujo,马托斯野生&罗查[2018]。在准备。
推理对抽象关系结构是很难的。如此简单的一个任务计算算术表达式的值(例如,2×3 + 8)需要结合符号根据正式的语法规则生成更复杂的表征但具体如何,本体的约束代理等自己实例化正式语法计算?外部正式的符号可以发挥核心作用在这个实例化提供稳定的物理环境,很容易被强大但domain-limited知觉和运动过程,作为图的抽象结构。然而,这些符号为多个目标服务,是在非常不同的技术比我们目前面临的局限性。我将提供一个理论中符号的使用正式的推理方法,实验证明这些符号的影响,和创新的用户界面可能促进学习和教学的代数。象征性的物理结构环境重要性的认识,鼓励建设数学教育学,知觉-运动与动态符号互动的核心语法的理解。
探地雷达在飞机和卫星现在使它实际收集的三维观测极地冰盖的地下结构,提供关键的数据对于理解全球气候变化和跟踪。但这些嘈杂的数据转化为有用的观测通常由手工完成,这在大陆范围内是不切实际的。深度学习方法已经超过传统技术的性能在一个广泛的问题在计算机视觉,但几乎所有的工作研究了消费者的照片,正是正确的输出通常不是关键的地方。目前还不太清楚这些技术如何应用在结构预测问题,细粒度输出精度高是必需的,如在科学成像领域。这里我们考虑问题的分段超声波回声图从极地冰盖雷达数据收集,这是具有挑战性的,因为分割边界通常很弱,而且有一个高度的噪音。我们提出一个多任务时空的神经网络相结合3 d回旋网(C3D)和递归神经网络(RNNs)估计冰面边界的层析成象雷达图像序列。
所谓的“再现性危机”问题的可靠性数据模式的报告。贝叶斯推理更多的关注比数据模型和模型选择。我们已经开发了一个扩展的贝叶斯推理形式,侧重于数据(模型比较是一个特例),并将这个框架的第一部分讨论。然后利用这一框架来解决问题的再现性。然而,有效性不再现性科学的真正目标是:有无数的情况下复制和繁殖的无效结果由一组调查人员或不同的调查人员想确认原来的报告。因此,我们采取一种不同的方法。我们假设一些统计的兴趣是有效性的基础上,从数据中提取(通常一维等的价值的意思是,互动,或对比)。我们使用我们的推理系统产生一个贝叶斯后验估计的大小统计基于三个组件:报告的数据,可能大小的先验知识的统计,对可能扭曲和信仰(实验者诱导或其他),影响统计报告。我们将提供一个示例基于发表的报告声称ESP。
我们提出第一个大规模并行(MPC)算法和硬度近似结果计算单连锁集群n输入d维向量美元美元的汉明下,美元\ ell_1 \ \ ell_ \ infty美元美元ell_2距离。我们所有的算法运行在O (\ log n)轮美元货币政策委员会对任何固定d,实现美元(1 + \ε)光纤美元对所有距离(除了汉明我们给一个精确的算法)。我们也显示常数因子inapproximability结果o (\ log n)美元圆算法在标准MPC硬度假设(足够大尺寸取决于所使用的距离)。效率实现的算法在Apache火花是通过实验证实了最大可用矢量数据集来自UCI机器学习库展示几个数量级的加速效果。
请查看在这里对于LaTeX-formatted抽象
新的努力使用头固定相机和追踪婴儿穿的捕捉日常视觉环境从婴儿的角度学习者。从这个角度来看,统计学习的训练集开发随着婴儿的感觉运动能力的发展,产生一系列的命令数据集视觉学习不同的内容和结构之间的时间点,但在每个计算高度选择性。这些不断变化的视觉环境中可能构成有序发展的课程,优化学习在许多领域。未来的进步计算机视觉(也许更一般的机器学习)可能受益于理解计算机制可以利用不断变化的规律。
这个演讲提出了(1)机器学会如何看待行动视频以及(2)是否能学会从视频执行自己的行动。我们首先提出优化计算模型学习表示认识到人类活动的视频。我们介绍视频卷积神经网络(cnn)捕获活动的潜在sub-events super-events,讨论他们如何可以用于理解视频注释等行动运动(例如,MLB)视频。接下来,我们设计和比较多个CNN架构学习机器人的行动策略。具体来说,机器人学会选择/执行动作给定的帧输入目标。我们描述这些过程的模仿学习制定机器人学习行为从人类专家的视频的例子,并讨论我们的初步结果。
*的谈话将迈克尔Ryoo教授和他的实验室成员,AJ Piergiovanni和艾伦·吴。
信息理论使我们能够量化编码和信息流动在生物适应性行为的计算模型。在这次演讲中,我将讨论三个方面在我们应用信息理论计算模型brain-body-environment系统更好地理解适应性行为。首先,我们概括的信息瓶颈原理揭示了独特的动态perception-action任务之间的信息流动模式和静态分级任务。第二,我们证明神经网络优化的执行行为对未来刺激他们获取预测信息。这样的收购预测编码是按照自由能原理。最后,从单一到多个任务,我们表明,动态神经网络,优化执行多个任务导致出现的一个独特的信息通过网络路径为每个任务。这些路径代表了“有效网络”与每个任务联系在一起,这有可能产生见解重用神经资源跨任务。这些研究也将目前使用的方法论的效益计算模型来研究复杂的生物系统。
2017年秋季
根据分类知觉的现象,我们倾向于认为我们的世界的类别,我们已经形成了。我们的看法是扭曲的,属于不同类别的对象之间的差异突出,和对象之间的差异,最后落入同一类别。我们描述一个神经网络模型,提供一些实证研究结果与分类知觉有关。模型是基于假定知觉分类涉及到一组低水平探测器调谐,不同程度的特异性,各种组合的刺激功能。调优是建模为圆形或椭圆形刺激参数空间重要的地区,与输入区域内下降引起探测器响应。这些探测器提供更高层次分类过程的输入,产生互惠的降序对探测器的影响,加强那些对分类最有用。
特定的人类动脉血液流动模拟已成为一个强大的研究工具完成量化的4 d(空间+时间)速度和压力字段和壁面切应力(WSS)内壁上分布。吸引人的优点包括:(1)低成本的设备,人员和物资;(2)完全保护人类受试者的工作;(3)服从的义务执行参数分析,和人类主体(4)的直接结果。放射扫描和动物模型实验无法与这些竞争优势来达到类似的结果具有相同的投资。我们最近开发了一种独特的计算平台,名叫InVascular,为患者和非侵入性诊断血管畸形的严重程度和评估血管治疗的必要性。InVascular集成了先进的CFD建模技术基于病人的临床CT / MRI成像信息与新兴GPU(图形处理器)并行计算技术,使快速量化速度和压力的字段和大规模数值分析来评估血管畸形的严重程度。InVascular使用统一的中尺度建模,即晶格玻尔兹曼方法加快,对图像分割和流体动力学。加快解决水平集方程提取的三维几何形态和边界的方向从临床影像数据。获得的形态信息然后无缝美联储下一步求解非定常脉动的流。 From CT/MARI images to 4-D in vivo flow, there are no data transformation and software involved thus the computation can be efficiently accelerated by GPU technology. It has been estimated that a typical cardiac simulation of blood flow in a human artery can be completed within 30 minutes. This talk will focus on two ongoing clinical projects to demonstrate how engineering analysis can contribute to precise medicine including (1) noninvasive assessment of the severity of renal stenosis (hypertension) and (2) Design of alternatives to left ventricle assist device (LVAD) for minimal invasion (Heart transplant).
本世纪大科学挑战之一是了解行为是建立在生物体之间的相互作用的大脑,身体,和环境。虽然很多注意力和资源集中在理解人类的大脑,我认为简单的生物体的研究是一个理想的地方开始应对这一挑战。我将介绍线虫Caernohabditis线虫,只有302个神经元,唯一fully-reconstructed连接体在细胞水平上,和一个丰富的行为中,我们还发现。我将描述计算的方法来解决这些大的挑战。我将制定一些表达我们的理解的优点在方程和计算模型,而不是单词。我将描述我们独特的方法探索未知的生物参数模型通过使用进化算法。我们训练神经网络在他们应该做什么,很少或根本没有说明怎么做。然后努力来分析和理解进化的解决方案来生成小说,常常出人意料,假设。作为一个例子,我将专注于节奏模式是如何沿着身体在运动中产生和传播。如果我们有时间结束时,我将讨论并行的努力我们的方法转移到培训仿生人工神经网络经典的机器学习问题。
最近的可穿戴的相机技术的进步导致许多认知心理学家研究人类视觉系统的发展通过记录婴幼儿的视野。与此同时,在计算机视觉深度学习的巨大成功是驾驶人员在这两个学科的目标是受益于彼此的理解。朝着这个目标,我开始探索深度学习模型可以用来获得发展从这样的第一人称数据相关的见解。在这个演讲,我将专注于自我中心的数据集,由幼儿和家长共同收集的视频和免费玩的玩具。我将三个不同的方法训练卷积神经网络(CNN)模型识别玩具根据head-camera数据对象。在每种情况下,我的目标是用深度学习数据分析工具,为什么投光,当出现数据对象的蹒跚学步的观点促进视觉对象的学习。
自动分析和理解的一个关键问题的科学论文从分文本论文中提取语义信息的组件(比如数据,图,表,等。这些工作需要预处理的第一步:分解成单个subfigures复合多部分数据。以前的工作在图分离化合物一直是基于手工设计特性和分离规则,经常失败的不太常见的图类型和布局。此外,一些实现复合图分解是公开的。提出了一种数据驱动的方法分离化合物的数据使用现代深卷积神经网络(cnn)训练分离器在一个端到端的方式。cnn消除手动设计特性和分离规则的需要,但需要大量的注释的训练数据。我们克服这一挑战使用转移学习以及自动合成训练范例。我们评估技术在ImageCLEF医疗数据集,实现85.9%的准确率和优于先前的技术。我们发布的实现作为一个易于使用的Python库,旨在促进进一步的研究在科学图挖掘。
我们现在的道路分割的方法,只需要在培训时间映像级别注释。我们利用遥远的监督,这可以让我们火车模型使用不同的图像目标域。使用大型公开可用的图像数据库主管一样遥远,我们开发一个简单的方法来自动生成弱pixel-wise路面具。这些是用于迭代训练完全卷积神经网络,产生最终分割模型。我们城市的数据集评估我们的方法,我们比较它与一个完全监督的方法。此外,我们讨论了注释的成本和性能之间的权衡。总的来说,我们远离地监督方法达到93.8%的性能完全监督的方法,在使用数量级少注释工作。
随着机器人变得越来越普遍在我们的世界里,研究人员和投资者都预计,人类和机器人将能够“共生共存”和合作。然而,很少研究检查是否以及如何之间的差异我们通常看到个人和团体之间的相互作用在人类中会影响人机交互。我将讨论我的研究,说明了群体效应发生在人类的机器人互动,而且还取决于类型的机器人,机器人如何相互影响,相互作用的背景下。这些研究提出道德问题学者应如何设计机器人与人类互动和人类如何可能负面影响在何种情况下人们支持机器人在人类。
生活个体的大脑网络地图的能力是基本的努力表大脑和行为在健康和疾病之间的关系。我们提出一个框架编码大脑连接体和diffusion-weighted磁共振数据多维数组。框架超越当前的方法通过整合之间的关系连接体节点,边缘,白质神经束和扩散数据。我们将演示框架的效用体内白质映射和解剖计算通过评估超过3000连接体在十三tractography方法和四个数据集在正常和临床人群。
我们表明,该框架允许映射连接矩阵,边解剖和显微结构的属性的白质组织在每个连接体边缘。框架是基于统计学评价原则介绍了线性分册评估方法和虚拟病变(生活;Pestilli et al ., 2014)。简而言之,而不是构建网络终端的唯一依靠神经束的皮层,我们利用完整的测量信号供提取每个连接体边缘的正向预测的生物组织特性优势。我们验证了框架通过比较结果与标准的连接体(纤维支数和密度)的措施。为此,我们生成十重复测量在大脑每个连接体在不同的数据集,使用不同的跟踪方法。对于每个连接体在一个单独的估计,我们计算均值网络聚类系数在重复的措施。我们将演示可靠性高的聚类系数。我们也证明深刻的差异在大脑的连接体,超出了可以捕获(纤维密度)使用标准的措施。
皮质表面功能性磁共振成像(cs-fMRI)最近经历了一个相对传统的三维体积fMRI流行起来的。Cs-fMRI提供降维,删除无关的组织类型,改进的学科之间对齐的皮质和更好的空间平滑。此外,cs-fMRI更兼容常见的假设空间贝叶斯模型,与体积fMRI数据,展示复杂的空间相关性结构由于皮质折叠和多种组织类型的存在。然而,由于空间贝叶斯模型尚未发达cs-fMRI数据,大多数分析继续采用经典的一般线性模型(GLM),一个线性回归模型分别适用在每个位置在大脑中有关预期的功能磁共振成像观察时间序列神经反应的一组任务或刺激。在每个位置,然后进行假设检验模型系数来确定该位置是否“激活”。这是一个巨大的多个比较问题,仍然是今天的辩论和争议的主题。古典GLM方法还未能正确地考虑空间相关性的激活邻近像素点的振幅。漠视在这篇文章中,我们提出一个贝叶斯方法估计任务激活使用cs-fMRI数据,有一类复杂灵活的模型空间过程激活潜伏的任务。执行贝叶斯算法中,我们使用集成嵌套的拉普拉斯算子近似(”),一个高度精确和马尔可夫链蒙特卡罗计算有效的替代品。识别区域的激活,我们提出一种新颖的联合后验概率图(PPM)的方法,消除了问题的多重比较。 Finally, we extend the existing spatial model from the single-subject to the multi-subject case, thus facilitating group-level inference. The method is validated and compared to the classical GLM through simulation studies and a motor task fMRI study from the Human Connectome Project.
我们提出一个新的指标集,向量,和功能,可以用于数据挖掘的不同阶段,包括探索性数据分析、学习、和结果解释。这些新的距离函数统一和推广了一些流行的指标,如Jaccard和袋集的距离,曼哈顿距离向量空间,Marczewski-Steinhaus距离上可积的函数。我们表明,新的指标完成可积函数和概率分布与f-divergences证明有用的关系。进一步扩展我们的方法等结构化对象层次结构和本体概念,介绍信息理论指标有向无环图绘制根据一个固定的概率分布。我们进行实证调查,以演示的直观解释新指标及其对实值的有效性、高维、结构化数据。广泛的比较评价表明,新的指标优于多个相似和不同函数通常用于数据挖掘,包括闵可夫斯基家族,分数Lp家庭,几个f-divergences,余弦距离,和两个相关系数。最后,我们认为新类指标尤其适合快速处理高维和结构化数据的基于距离的学习。
成对的距离信息的对象通常是表示两种方式中的一种。大的相似性表明两个对象很相似;大不同表示相反的。不同概括距离的数学概念,它可以用来构造不同数据的直观表示。这是不太明显的如何表示相似的数据。内积的数学概念通常用于模型相似,但这种结构更直观和相应的转换从相似性不同常常被误解。例如,余弦相似性是广泛应用于文本挖掘和其他学科,但完全有可能叙事总是用来激励余弦相似性指定一个很自然的程度的不同,在实践中几乎从未使用过。这个演讲试图消除一些流行的误解转换从相似度不同。
在不同的行业,如矿业、农业、医疗、和自动驾驶,许多实际应用在机器人技术涉及到与智能代理交互导航动态环境。虽然令人印象深刻的结果已经证明了在这些领域,仍有基本类型的交互导航问题的健壮的和通用的解决方案仍然难以捉摸。高效的导航就是这样一个问题类型的非合作和non-adversarial代理。行人面临这样的问题当在拥挤的人行道或司机的脸当导航拥挤的道路。两个主要困难解决这一问题的原因是这个问题模型往往表现出高昂的计算复杂性和配方的问题往往difficult-to-satisfy要求输入和表征问题。这个演讲将最近的工作提供更有效的问题模型这一问题,以及新的应用问题配方,寻求极大地简化问题输入和代表性需求。
2017年春季
移动传感技术的发展研究打开新的可能性的人类活动。出于体现和分布式认知,新兴的“计算行为科学”领域旨在描述丰富的互动活动和多通道和动态轨迹“野生的”。演讲大纲对这种方法的理论基础以及细节我过去的,持续的,和未来的项目应用这些独特的婴儿发展基本问题研究的方法,从感觉运动贡献的出现共同关注婴儿兴奋和注意力之间的动态关系。我目前的工作发展中移动传感器模式来检查婴儿的日常经验的贡献遇险事件为母亲和她们的婴儿心理健康风险。这个项目将结合高密度定量标记的母亲和婴儿bio-behavioral活动与日常调查孕产妇情绪,社会支持,和育儿信心为了解开的机制,有助于幼儿社会性发展的个体差异和新兴风险的心理健康。这项工作的最终目标是开发技术强化型干预支持婴儿和母亲抑郁和焦虑的风险。
卡亚·德·巴巴罗博士的背景是在认知科学中,一个跨学科的领域缩小心理学、神经系统科学和计算机科学。她的研究都集中在发展科学、跨域的婴儿社会、认知、感觉运动和生理发展。在这些领域,她时时刻刻的多通道动态特征的婴儿bio-behavioral活动他们看,触摸,和表达模式的唤醒和影响——自由流畅的交互中使用视频和专门的传感器。
我们RelSifter,一种监督式学习的方法问题的相关性分数分配给三元组表达类型关系等“专业”和“国籍。对个人和关系的提供额外的上下文信息我们提供补充数据的一部分WSDM 2017三分大赛Wikidata DBpedia,两个大规模知识图表(公斤)。我们的假设是任何类型的关系。,一个特定的职业就像‘演员’或‘科学家’可以被描述为典型的“活动”人们已知类型的关系。例如,电影演员,明星,科学家们知道他们的学术关系。公斤,这个信息是被发现的一个适当定义的子集二级类型的邻居关系。可以使用这种形式的本地信息的学习算法来预测相关性分数为新的,看不见的三元组。当得分“职业”和“国籍”三元组基于这种方法导致我们的实验精度等于73%和78%,分别。这些性能指标大致相当或略低于之前的比赛。这表明,我们的方法可以有效评价事实,尽管偏态的事实从公斤每个开采。
AJ Piergiovanni IU信息学和计算
1月30日星期一,下午三点到三点半
130信息
在这篇文章中,我们新推出的时间注意过滤器的概念,并描述他们如何可以用于人类活动识别的视频。许多高层活动通常是由多个时间部分(例如,sub-events)与不同持续时间/速度,和我们的目标是使模型显式地学习这样的时间结构使用多个过滤器和受益于他们的关注。我们时间过滤器被设计成完全可微的,允许end-of-end训练的时间过滤器一起底层框架或基于航段卷积神经网络架构。介绍一种方法学习一组最优静态时间注意过滤器在不同的共享视频,和这种方法扩展到动态调整注意过滤器/测试视频使用周期性长短期记忆网络(LSTMs)。这使得我们的学习时间注意过滤器潜伏sub-events特定于每个活动。我们实验证实,该时间注意过滤器福利活动识别的概念,和我们想象潜伏sub-events学习。
最基本的方法之一,对理解复杂的数据聚类;例如,在网络科学、社区捕获中心链接结构和至关重要的组织原则的理解操作网络的动态过程。在集群的许多问题,如评价聚类方法,聚类识别共识,和跟踪集群的发展随着时间的推移,最基本的任务是定量比较聚类。大多数现有的方法关注集群相比,通过测量统计独立,匹配相似的集群,或计算公司对集群元素。然而,所有常见的措施没有关键偏差和测量提供重叠和层次聚类。在协作与伊恩木&陈文贤安,我演示标准聚类相似措施不符合常识的期望和提出一个新的框架,不仅地址这样的偏见,还结合比较重叠和分层结构的集群。此外,我们表明,框架可以提供详细的见解如何聚类不同。我们应用神经科学方法、笔迹和社交网络数据集的优势来说明我们的框架和揭示这些数据集的新见解。集群跨学科的普遍性建议的深远影响我们的框架在所有的科学领域。
亚历山大·盖茨目前博士生印第安纳大学追求信息学联合学位(复杂系统跟踪)和认知科学。雷竞技官方网站下载他的学术研究融合数学和计算方法来研究复杂系统生物学、神经科学和社会学。他的一些最近的贡献包括基因调控网络系统的量化控制,动力autopoiesis原始细胞模型和小说的框架比较重叠和分层集群在人类连接体。在国际单位学习之前,亚历克斯收到康奈尔大学数学学士学位和一个硕士从伦敦国王学院复杂系统建模。2017年6月,亚历克斯将加入东北大学复杂网络中心作为博士后学者。
哈雷麦克劳德,单位学校信息和计算的
周一2月13日,2点半-下午三点
130信息
现在计算系统能够自动生成标题描述对象,人,和风景图片。虽然这些系统精度不同,他们不够突出,我们正开始看到他们融入社会媒体平台(如Facebook)。一组站受益于这些进步是盲人和视障人(BVIP),他表示不满日益视觉社交媒体上的内容。自动字幕工具有可能赋予BVIPs知道更多关于这些图片,而无需依靠human-authored alt文本(通常是失踪)或问一个视力正常的人(可以耗费时间或繁重的)。这些解决方案通常使用标准化的评估指标测量机的输出之间的相似性和视力正常的人类。这些指标有助于比较不同算法时常见的数据集上运行。研究人员还经常进行用户研究,要求健全者率说明对于一个给定的图像的质量,或者要求他们选择最好的一系列的标题来评估质量区别human-authored标题和机器生成的字幕。这是有道理的,因为大多数工作自动化的字幕不是专注于为BVIPs生成alt文本,而是出于场景提供改善图片搜索元数据。标题质量评估标准和成本效益权衡对于不同类型的错误是不同的比他们如果设计可访问性作为主要场景。事实是,这样的系统现在正在重新设定可访问性目的需要复审的基本假设,如让一个好标题或什么精度的相对风险/召回权衡。
在本文中,我们探讨盲人和视障人在社交媒体经验自动生成标题。使用上下文查询方法,我们发现BVIPs大量的信任在这些标题,经常填写细节解决差异tweet的文本和一个不一致的说明(图片标题似乎并不匹配的内容或上下文推)。我们基于这些研究结果进行在线实验探索这种现象在更大的规模和调查标题措辞的角色在鼓励信任或怀疑。我们的研究表明,标题措辞的方式强调错误的概率,而不是正确性,鼓励BVIPs属性不一致错误的标题而不是遗漏的细节。
教授Chung-chieh山,单位学校信息和计算的
周一2月13日,下午三点到三点半
130信息
贝叶斯推理后的知识,从先验知识和观测证据,通常是由贝叶斯规则,说后乘以一个观察=联合概率的概率。但是连续的观测量通常有概率为零,在这种情况下,贝叶斯法则说,只有未知的时光零等于零。从零概率观察,推断出后验分布的统计概念_disintegration_告诉我们指定观察作为一个表达式而不是一个谓词,但并没有告诉我们如何计算后。我们提出的第一个方法计算概率的解体计划和观测量的表达,即使观察的概率为零。因为该方法产生一个精确的后期限和保存一个一元的语义表示措施方面,它与其他推理方法组成以模块化的方式在不牺牲精度和性能。
闪亮的R包是用于构建web应用程序的数据分析和可视化。使用R您创建一个用户界面和一个服务器,而闪亮的编译和执行R的后端代码。例如,您可以使一个web应用程序,运行交互式统计,数据挖掘和机器学习的方法。在这个实践课程中,你将学习到基本的R +闪亮的结构以及如何创建和部署您的第一个应用程序。
对车间资源:
我们考虑的问题形成的边际概率估计观测数据使用密度算法的输出由哈密顿动力学。的估计是基于方法Chib & Jeliazkov (JASA 2001)。我们将审查的背景边际计算使用密度吸引以及哈密顿蒙特卡罗算法。由于哈密顿动力学微分方程隐含往往没有明确解决,HMC利用产生的离散辛集成商需要解决隐式方程。而L一步积分器导致L - 1非耦合隐式方程画,我们表明,它产生了2 L耦合隐式方程估计边际。因此,尽管HMC获取吸引是很有前景的,其使用可能会限制模型的比较。
Shujon眼镜蛇,IU信息学和计算机学院
星期一3月6日,2点半-下午三点
130信息
在这次演讲中,我们将讨论的不同方面zero-shot学习和看到三个挑战视觉识别问题的解决方案:1)未知对象识别从视频和图片2)小说行动识别3)看不见的对象分割。在所有这三个问题,我们有两个不同的类,“已知的类”,用于培训的“未知类”阶段,没有训练实例。我建议的方法利用了可用的已知和未知的对象类之间的语义关系和使用它们外观模型从已知对象类转移到未知的对象类识别未知的对象。小说我还讨论一个方法来识别行为从视频通过学习联合模型链接视频和文本。最后,我将提供一个基于排名的方法为zero-shot对象分割。我们代表每一个未知的对象类的语义排名所有已知的类并使用这种语义关系已知类的分割模型扩展到部分未知的类对象。
凯瑟琳•麦特卡尔夫IU信息学和计算机学院
星期一3月6日,下午三点到三点半
130信息
分段观察从输入蒸汽是一个重要的人类认知的能力。证据表明,人类完善这种能力通过与世界的经历。然而,很少有模型解决事件的无监督发展细分在人工代理。本文致力于开发一个智能代理的计算模型可以独立学会识别有意义的事件在连续观测。在这个模型中,代理的分割机制从一个简单的状态和雅致。受托人与环境的交互不受监督和由其期望失败。学习任务是减少模型的预测误差识别当一个事件转换到另一个。强化学习驱动机制,确定事件边界通过推理预测gated-recurrent神经网络模型的期望失败。我们的实验结果支持,强化学习可以使检测事件边界在连续观察基于gated-recurrent神经网络预测误差。
当前的音频通道从电脑到人类是局限于单一合成声音,可能加上各种交际音频信号,如earcons和audiocons。这是一个总利用不足的惊人能力的平均人类大脑分辨和识别复杂的音频环境细节。我们提出一个新颖的音频ReSAC用户界面,一个响应空间音频云桥这种不匹配,大大提高了丰富的通信通过音频从机器到人类。
转换从简单到复杂的图形用户界面的文本终端发生通过持续的研究和市场数十年来进化。我们相信我们的最早阶段类似的转换音频用户界面。在这次演讲我们描述ReSAC ReSAC提供身临其境的音频接口的应用视觉障碍人士,以及与gui的研究方向比较开放。
这是正在进行的工作,副研究员Joshi SOIC, IUB, Sujeath Pareddy和Abhay Agarwal MSR印度。
短暂的生物:
马诺Swaminathan是印度微软研究院高级研究员,他是技术对新兴市场集团的一部分。马诺是一种academic-turned技术企业家转向研究员驾驶激情部署技术的积极的社会影响。布朗大学计算机科学博士学位,曾通过排名成为印度科学研究所的教授,共同管理,建议,angel-funded几个技术创业公司在印度。
随着机器人变得越来越普遍在我们的世界里,研究人员和投资者都预计,人类和机器人将能够“共生共存”和合作。然而,很少研究检查是否以及如何之间的差异我们通常看到个人和团体之间的相互作用在人类中会影响人机交互。我将讨论我的研究,说明了群体效应发生在人类的机器人互动,而且还取决于类型的机器人,机器人如何相互影响,相互作用的背景下。这些研究提出道德问题学者应如何设计机器人与人类互动和人类如何可能负面影响在何种情况下人们支持机器人在人类。
隐私保护的视频录音是一个重要的社会挑战。例如,我们渴望一个计算机视觉系统(例如,机器人),可以识别人类活动和帮助我们的日常生活,但确保它不是记录视频可能会侵犯我们的隐私。在这次演讲中,我们讨论计算机视觉方法保护隐私承认人类活动从极端低分辨率(例如,16×12)匿名视频。这些方法都是为了避免privacy-intruding处理数据(即。、高分辨率视频人脸)当执行识别,从而减少黑客的风险记录/窃取敏感视频从你的设备。我们专注于多个不同的低分辨率图像可以来自一个单一的高分辨率图像,为可靠的识别和利用这些属性从匿名活动视频。
Andreas Bueckle和凯蒂·伯尔纳说博士,单位学校信息和计算的
周一4月10日下午二时
130信息
随着建筑环境变得越来越复杂,结合新技术,包括新兴的物联网(物联网)——迫切需要了解嵌入式技术如何影响个人的经验,居住在这些空间和如何最适当地使用这些技术来改善使用者经验,舒适,和幸福。此外,物联网提供了一个机会以及挑战时帮助用户了解这些智能系统收集和处理信息,如传感器数据和内部反馈回路。
通过可视化数据流从居住建筑项目,我们的目标是帮助系统架构师,设计师,和普通观众理解紧密耦合传感器——致动器的内部运作系统连接机器和人类智慧。我们的项目旨在使许多掌握基本概念相关的操作和设计复杂的动力系统和物联网。具体来说,我们使用架构蓝图的生活建筑设施与实时数据流生成增强现实操作的可视化的生活建筑设施改善数据可视化识字的游客的架构。
短暂的生物:
Andreas Bueckle博士生在印第安纳大学信息科学以及电视录像制作人和摄影师。雷竞技官方网站下载他的学术利益围绕信息可视化,更具体地说互动和增强现实可视化。作为一个专业的摄像师和摄影师,他一直从事视频和照片项目在四大洲,与关注纪录片以及自然,尤其是社会问题和自然摄影。检查样品在http://andreas-bueckle.com上工作。
凯蒂·伯尔纳说的是维克多·h·Yngve信息学和计算机学院杰出教授、兼职教授的统计数据在印第安纳大学艺术与科学学院,她指导的计算机网络科学中心。雷竞技官方网站下载她的研究主要关注发展的数据分析,建模和可视化技术改进的信息访问,理解,和管理。
教授Ritch Savin-Williams,康奈尔大学
4月17日,星期一下午
130信息
科学家和非专业人员最近性取向有着极大的兴趣,尤其是如果这个人是一个家长,朋友或情人。尽管普遍认为评估性很简单,这是一个难以评估的构造。最传统的方法是自我报告。选择,全网方法最近进化到正确的并发症:性兴奋,隐含的观看时间,功能磁共振成像扫描,眼球追踪,瞳孔放大。发现这些简要回顾与共识。然而,他们未能区分性和浪漫的取向和评估性的全谱。因此,个人的真实生活是歪曲的。新的性别身份,主要是直,用来说明。
短暂的生物:
Ritch c Savin-Williams是人类发展和发展心理学教授康奈尔大学性与性别实验室的主任。他从芝加哥大学获得了博士学位。他对微分发展轨迹的研究试图取代通用,发展阶段模型的身份的角度探讨了相似的部分青年与青年和部分青少年不同的方式,从异性恋青年。他也是一个私人执业注册临床心理学家专门从事身份、关系,部分年轻成年人和家庭问题。他曾作为专家证人对同性婚姻,同性恋收养,和童子军法庭案件,在众多专业审查委员会,咨询了MTV, 20/20,奥普拉·温弗瑞秀,CNN,和他的作品在《新闻周刊》中也提到了时间,滚石,父母杂志,Utne读者,纽约杂志,财富,《纽约时报》、《洛杉矶时报》,《华盛顿邮报》、《今日美国》,芝加哥太阳时报。Savin-Williams收到博士2001年奖杰出的科学贡献,2005年优秀图书奖从美国心理协会的部门44 2006 APA科学理事会的发展心理学大师的讲座,2009 APA全体地址,从心理科学协会的地位。
一Cavar博士,IU语言学
4月24日星期一下午
130信息
免费的语言环境(通过)工程项目出现的需要一个自由和开放平台深NLP,使语法研究工程,以及建模的混合系统,利用基于规则的,概率模型和机器学习技术。当前的开放系统,例如斯坦福CoreNLP CoreIE, NLTK,或宽大的提供基本NLP-functionalities浅语言处理,缺乏必要的深度有限的相关性分析组件的精度和性能要求现实世界NLP或人工智能应用程序。
通过针对深语言处理语义表征,和务实或话语建模,可用于高性能和大数据处理环境。它是基于施乐语言环境的思想和概念(XLE)(麦克斯韦&卡普兰,1996)。它利用一个词法分析组件基于计算模型的两级使用有限状态传感器体系结构形态。语法和浅层语义组件实现一个使用Lexical-functional语法解析器(抽)框架(例如Bresnan 2001;Dalrymple 2001)双向NLP,即自然语言解析和生成。而释放提供了生成和分析语法手段,功能,和浅自然语言的语义属性,它只能被理解为深层语义分析的预处理阶段。
通过设计XLE-compatible。它扩展了XLE功能通过提供一个量化的可能性现有词汇的定性模型,形态学、语法、语言属性和功能使用解析器本身,或提取语料的语言规则和分布特性。词法特征描述,它提供了一个概率模型的语法结构,和功能和语义表征,使新型的内部和跨语言语言变异的研究,以及有效的广泛覆盖NLP为许多语言。
温陈,单位学校信息和计算的
周一5月1日,2点半-下午三点
130信息
在艺术和音乐,时间像“古典”和“印象派”学者和实践者的强大意味着共享美学或比较和对比构件雷竞技官方入口
哲学。尽管web设计经历改变了25年,我们缺乏理论来描述或解释这些变化。在本文中,我们采取第一步识别和理解网站的设计周期。从人性化的人机交互方法,主题专家的网页设计进行批判性的分析数据集一生跨越了十多年的知名网站。这些信息判断揭示的一组关键标记信号设计周期的变化。例如,显示技术的进步和改变公司的策略来解释设计时期划定特定布局模板和导航模型出现。我们建议设计师和营销人员可以汲取灵感从网站设计策划到设计阶段。
郝彭,单位学校信息和计算的
周一5月1日,下午三点到三点半
130信息
定量测量是科学进步的基石。在这里,我们提出一个框架,用于促进定量询问有关学科的情况。我们适应一个流行词嵌入技术学术引用的数据轨迹中5300万篇科学论文学习连续科技场馆的向量空间表示。我们获得一个高维学科学的嵌入的地图。我们的地图揭示了科学作为例证的纪律组织的方向和科学的频谱通过允许场地向量之间的算术运算。向量表示的科学场馆也便于下游应用,如推荐类似的场所和预测学科类别。
2016年秋季
这个演讲介绍了机器学习算法设计过程数据根据需要而花费尽可能少的资源,例如时间、能源、和记忆。这些应用程序的例子,但不限于,可以大规模的多媒体信息检索系统查询和数据库条目都是嘈杂的信号;合作从数以百计的用户创建的Youtube视频音频增强音乐会;事件检测系统运行在一个小装置,实时处理各种传感器信号;一个轻量级的定制芯片,语音增强手持设备;即时音乐分析引擎在智能手机上运行的应用程序。在所有这些应用程序,有效的机器学习算法不仅要实现良好的性能,但也是一个巨大的效能。以满足这些矛盾的需求同时,我开发了各种矩阵分解算法(或主题模型):一个主题模型,以稀疏地标表示作为输入,一个潜在的组件共享技术来分析一组众包录音,和hashing-based加速技术更快的稀疏编码主题建模。最后,描述一个极其优化深度学习部署系统,逐位神经网络(BNN)也将讨论。在bnn,所有输入、输出和操作与布尔代数的定义(例如在bnn之间浮点乘法是缩小到一个单一XNOR门两个二进制输入)。 Some preliminary results on the MNIST dataset and speech denoising demonstrate that a straightforward extension of backpropagation can successfully train BNNs whose performance is comparable while necessitating vastly fewer computational resources.
语言是人类交流的一个重要形式和语音处理各种现实世界的应用程序。助听器帮助有听力障碍的个人理解演讲,和语音命令用来与许多电子设备接口。在现实的环境中,从施工噪声背景声音,音乐,或语言存在竞争。语音处理算法的性能会显著降低在嘈杂的环境中,噪声可能重叠,淹没了语音信号在时间和频率。许多计算技术提出了解决语音分离在嘈杂的环境中,但它仍是难以产生理解和高质量的演讲估计,特别是在低信噪比。
传统的语音分离系统操作的幅度响应短时傅里叶变换,把相位响应不变。然而,最近的研究表明,相位响应对质量很重要。在这次演讲中,我将提出一个方法,共同提高的大小和相位噪声语音通过执行在复数域时频掩蔽。深层神经网络用于估计这个复杂的时频掩模。这项工作导致知觉明显改善语音质量。
预测算法的成功在很大程度上依赖于数据表示。表示学习减少了工程需要功能,使用神经网络与显著的成功应用程序和字典学习。在这次演讲中,我将讨论的新见解有效学习表示,特别是通过监督学习和监督autoencoders字典。特别是,我将讨论新的结果获得全局最优的解决方案,并提供简单的算法适合增量估计。进一步,我将强调技术词典学习如何通知选择autoencoders监管,并导致一个更有效的监督表示学习架构。
在这个演讲我将介绍一些最近的进步大数据分析的理论基础及其应用分布式数据存储、集群和计算机视觉。我将讨论新的主题在分布式算法和通信复杂度出于发展系统,如Apache Hadoop MapReduce /火花并通过云基础设施提供的服务。我将展示互动supersteps /轮的数量在确定整体性能起着至关重要的作用,因此也执行分布式计算的成本。
我将通过多个例子说明这个前提包括:
——所需的轮数之间的权衡和沟通检查两个大型分布式文件系统之间的一致性。
——Round-efficient集群和分布式算法的匹配问题多维特征向量。
纳撒尼尔·罗德里格斯IU信息学和计算机学院
12月5日,星期一下午
130信息
递归神经网络(RNN)已被用于广泛的机器学习任务包括信号生成、时序模式识别、自然语言处理、机器人控制问题,时间序列预测。在过去几十年里RNNs稳步改善可伸缩性、可训练性和性能的新的网络元素和建筑设计的选择。从根本上说,这些增加的目标定位系统动力机制更适合求解所需的任务。通过理解设计选择如何影响神经网络动力学和那些动态如何导致更大的计算能力,之前我们可以做出更明智的决定如何设计神经网络。我们调查的动态属性类RNNs,称为水库电脑,并专注于探索群落结构的影响,也称为模块化网络科学。群落结构获得了大量的注意力在大脑中科学和计算神经科学和被怀疑是一个至关重要的组件在活动内存处理和显示在网络控制信息扩散起着重要的作用。我们瞥见群落结构和神经元功能如何产生深远影响的计算能力水库在一系列记忆和信号处理任务。
2016年春季
Xiaozhong Liu教授IU信息学和计算机学院
1月13日周三下午1:00
130信息
干出版物,出于各种原因,通常不重视书写可读性,和年轻学者/学生难以理解的学术文献。不幸的是,很少有一直在努力帮助研究生和其他初级学者理解和使用这些科学数据的本质。这个演讲是基于假设和pilot-evidence综合开放数据资源的访问(ODR)学术刊物,包括演示视频、幻灯片,教程,算法源代码,或维基百科页面,在一个协作框架将显著提高学生理解论文本身的能力。为了实现这一目标,我提出一个新颖的学习/阅读环境,ODR-based协作PDF阅读器(OCPR),包含创新文本+异构图挖掘算法,可以:1)auto-characterize学生的新兴信息需要在他/她阅读一篇论文;2)个性化或communitize学生信息需求的基础上,计算用户配置文件,和3)使学生容易访问odr根据他们的需要和隐式或显式反馈的信息。
根据需要和各种各样的用户反馈的信息,该算法将产生并选择小说排名功能异构semi-supervised随机游走图以较低的成本和ODR的建议。实验表明,该系统可以有效地帮助研究生和学者更好地理解复杂的出版物在冷启动和背景丰富的环境中,和新颖的算法,例如,个性化的边缘类型有用性估计,可以推广到其他信息推荐/检索问题。
认知科学教授Eduardo Izquierdo IU
周三1月20日下午1:00
130信息
甚至相对简单的动物表现出非凡的组合的灵活性和鲁棒性的行为。本世纪大科学挑战之一是了解这种适应性行为源自生物的神经系统的动力相互作用,它的身体,它的环境。虽然详细的简化的分析个人的分子,细胞和有机体的生物系统的组件导致的财富数据和见解在生物学、互补的合成方法,重新集成这些组件到整体系统的理解一直缺乏。
我的研究旨在解决这一挑战通过构造和分析以实验为brain-body-environment系统的模型。在这次演讲中,我将介绍一种秀丽隐杆线虫作为一个方便的目标等综合brain-body-environment建模一个完整的动物。我将描述我的方法:使用人工进化来探索未知的空间所需的神经系统电生理参数生成等微生物的行为。我将重点发展和分析两个蠕虫的行为:空间方位和运动,他们的集成。我将展示这种方法使我们能够开始解决关键理论挑战,体现和动态的了解认知。
Jerome Busemeyer教授,心理学和脑科学
1月27日星期三,下午1:00
130信息
该项目旨在开发和实证测试一个新的测量模型基于量子概率理论,称为希尔伯特空间多维模型。模型提供了一个有前途的解决的问题所面临的复杂的数据违反联合分布的假设。引人注目的进步的现代数据采集方法,复杂和庞大的数据集生成从各种来源和背景在概念上连接(例如,大数据)。这承诺提供一个更好的理解复杂的社会和行为现象,但也提出了前所未有的挑战的集成和解释数据。当大型数据集来自不同的背景,他们常常可以通过应急总结表。假设有K表(Tk T1,…,…Tk),每个收集在一个不同的上下文K。还假设每个表Tk联合频率表是基于p变量的子集(Y1,…, Yp)。例如,这项研究可能涉及四个变量(Y1、Y2、Y3、Y4),但每个表可能包含四的只有两个,所以表T1可能是一个双向的频率表组成的两个变量(Y1, Y2),表T2可能是另一个双向表组成的两个变量(Y1, Y3),等等。一个关键的问题:如何集成和综合这些K表到一个压缩的,一致的,可判断的表现?
目前,一个常见的解决方案是,试图构建一个p-way联合概率分布繁殖频率数据中观察到K表。贝叶斯因果网络往往是用于减少估计参数的数量征收条件独立性假设。然而,不幸的是,在许多情况下,没有这种p-way联合分布存在可以再现观察表。这是因为数据表违反一致性约束要求的古典(柯尔莫哥洛夫)概率论,贝叶斯网络是建立在。研究由NSF资助之前积累了强有力的证据支持的违反通常认为古典联合概率思想复杂,更符合实际的数据。希尔伯特空间模型,我们这里提出,基于量子概率理论。它提供了一个有前途的解决方案违反联合分布假设的问题通过构造一个有限状态矢量位于低维希尔伯特空间,并形成一套non-commuting测量运营商代表p测量。这样,我们实现一个压缩,p变量的连贯,可判断的表示形式的复杂集合K表,即使在没有p-way联合分布
的存在。
教授内森•雅各布斯,肯塔基大学
2月10日星期三,下午1:00
130信息
每天数以亿计的照片被上传到互联网。他们一起提供了许多世界上的高分辨率图像,从自然景观全景详细视图的有人吃晚饭。这图片有潜力推动发现各种各样的学科,从环境监测到文化人类学。取得了重大研究进展自动从这些图像中提取信息。剩下的一个关键挑战是,我们常常不知道图像被捕,通常知之甚少其他相机的几何性质,如取向和焦距。换句话说,大多数不是geocalibrated图像。这个演讲概述我的工作使用新颖的线索,包括局部多云天,彩虹,和人类的面孔,geocalibrate互联网图像和视频
Praveen Narayanan IU信息学和计算
2月17日星期三,下午1:00
130信息
有一个机器学习领域的差距,之间的语言,用于描述和分享成功的想法,和用于执行它们的代码。虽然机器学习的语言让我们重用的一组概念,同样不能说的代码。例如,如果我们想要查询一个图像处理模型通过使用一种推理技术最初编写的一个语音识别模型,我们可能需要从头编写一个推理方法即使模型共享结构的相似之处。相反,我们希望小的观念转变导致比例小的代码更改,这是更到模块化编程的基础。
模块化是解耦的第一步
——代码描述模型
——描述推理方法的代码。
这种类型的模块化编程的直接结果是“生成的故事”的概率程序风格。第二步对模块化组成更大的模型与较小的(工作)模型,和类似的组合推理方法。
这个演讲将考虑在机器学习程序模块化测量生成的故事风格的编程和检查提供的工具模型和推理成分Hakaru,正在研制一种概率编程系统在印第安纳州。
教授一个、IU部门统计数据
2月24日星期三下午1:00
130信息
指数分布随机图模型(ergm)已经成为一个标准的统计建模社交网络的工具。特别是ergm提供极大的灵活性为协变量影响系形成和内源性网络形成过程(例如,互惠和传递性)。然而,由于依赖蒙特卡罗马尔可夫链,很难适应ergm在大型网络(例如,成百上千的节点和边组成的网络)。介绍了一系列的(存在和新)方法估算ergm大型网络和比较了它们的优缺点。通过分析学校友谊网络选择方法进行了说明,等等。
Rob Zinkov IU信息学和计算机学院
星期三3月2日下午1:00
130信息
概率推理过程通常编码煞费苦心地从头开始,对每个目标模型和推理算法。在这次演讲中,我将展示如何冒充推理过程程序转换的一个概率模型变换到另一个概率模型。这些转换允许我们表达精确和近似推理生成程序,并允许我们组成多个推理程序通过一个模型。由此产生的推理过程中运行
时间与一个手写的过程。
Erik Weitnauer和基督教Achgill
星期三3月9日下午1:00
130信息
正式的符号像代数符号思维的强大的工具可以大大扩展我们的认知能力。然而,许多学生没有得到太多的使用除了沮丧。而
我们的许多推理工具有了显著的变化与电脑和数码用户界面的可用性,我们仍然主要使用纸和笔写方程。
几年前,我们的团队开始着手设计和实现一个数字的数学符号,灵感来自现代用户界面设计和指导下认知研究人们如何使用他们的视觉运动系统与正式的符号。从那时起,我们已经建立了一个基于网络的动态代数符号系统我们称为能理解的数学。,用户可以解决代数问题的一个子集更快和更准确地比在纸上,同时还通过所有转换步骤。
在我们的谈话中,我们将简要讨论研究和建筑背后的动机能理解的数学,演示系统,对其体系结构和分享一些细节和我们的软件开发策略。然后我们将讨论我们未来的计划和未来的一些挑战。
(检查我们的系统http://graspablemath.com)
杰米默多克、科林·艾伦和西蒙•DeDeo IU信息学和计算机学院
3月23日星期三,下午1:00
130信息
搜索与不确定的环境资源分配涉及到过去的发现和进一步勘探开发之间的权衡。这延伸到信息觅食,深度阅读和学习之间的知识寻找者转变新域名。这个认知过程研究,我们检查阅读选择由现代最著名的科学家之一:查尔斯·达尔文。从书中列出他的时间顺序组织阅读期刊的全文,我们生成主题模型量化当地(text-to-text)和全球(text-to-past)阅读决定使用Kullback-Liebler分歧,cognitively-validated,信息理论测量相对惊喜。而不是surprise-minimization模式,对应于一个纯粹的开发策略,达尔文的行为从早期开发转移到后来勘探,寻找异常高水平的认知惊喜相对于以前的时代。这些变化,检测到一个无人监督的贝叶斯模型,与生涯的主要知识时代确定通过传统的定性和达尔文的self-commentary奖学金。除了量化达尔文的个体层面的觅食,我们的方法允许我们比较他的消费文本出版秩序。我们发现达尔文的消费比文化的生产勘探,这表明在渐进的社会变革是个人综合的探索和发现。我们定量方法促进认知的研究搜索一个测试框架之间的相互作用之间的个人和集体行为,短期和长期的消费选择。这部小说中的应用
主题建模描述个人阅读补充广泛研究集体科学行为。
圣扎迦利托西(IU认知科学)
3月30日星期三下午1:00
130信息
新兴技术揭示了许多特性的行为和大脑皮层微电路的结构。我们现在知道神经元活动率约为对数正态分布,突触连接是高度的非随机,包含在代表图案,中心,和重尾分布的突触效能和学位。最近自组织神经模型已经开始使用已知的稳态机制结合其他形式的神经可塑性来解释这些现象。然而,尽管这些模型考虑稳态几把大量的考虑如何达到体内平衡的设定值。They-therefore-largely忽略发育分化为大脑中的自组织的一个关键方面。下面的讨论提出了一种新颖的神经电路模型中单个设定值允许每个神经元的稳态机制自组织网络的兴奋性和抑制性突触生长。沿着同样的路线,网络没有预定义的突触连接,初始化必须成长,然后删除它的突触连接。从那里,网络自组织模块化/层次结构,峰会组织,和其他广泛的模拟生活品质的电路如他们的学位,多功能性突触效能,3-motif分布。网络也显示了一个最佳的能力符合结构的输入,得分高的措施模式分离或泛化这取决于任务的输入。结果表明,自组织的自我平衡的设置点在皮层模型可以复制大量的高度随机网络
特性已知存在于生活的神经回路。
亚当博士白色,IU信息学和计算机学院
4月6日星期三,下午1:00
130信息
了解一个人工代理可能代表、获取、更新和使用大量的知识一直是人工智能的重要研究的挑战。这个演讲探索知识的预测方法。预测知识没有人类干预的情况下能保持,因此收购可能规模可用数据和计算资源。不幸的是,技术挑战与数值不稳定,off-policy抽样下散度,计算复杂度的适用性和可伸缩性有限预测在实践中获取知识。
这个演讲描述了一种新的方法来代表和获取预测知识在一个机器人。价值函数的关键思想是,从强化学习,可以用来表示policy-contingent声明式和面向目标的预测知识。这个演讲探索的实用性和更新许多并行预测,同时代理与世界交互。我将演示我们的方法的适用性和可伸缩性的示范下的心理现象,制作和更新成千上万的预测从成千上万的多维数据样本,在实时和可伸缩性的robot-beyond相关预测方法。
Xiaoran燕,印第安纳雷竞技官方网站下载大学网络科学研究所
4月13日星期三下午1:00
130信息
在这次演讲中,我们强调动态过程之间的相互作用和网络的结构定义。我们开始通过检查不同的随机漫步的影响网络集群和节点的质量检测中心。我们介绍伞框架定义和描述动态过程为线性算子的合奏。我们表明,传统的拉普拉斯算子扩散框架和随机漫步这个框架是一个特例。进一步的推广将使我们能够流行在网络和信息扩散模型。
基于这一广义拉普拉斯算子的框架中,我们将演示如何线性变换的图可以表示不同的动态过程的流动网络。我们将展示如何应用这些转换的一些经验性的例子在现实问题的额外的数据是可用的网络结构的旁边。对于多个图表,导致更多的转换原则组成的多层网络。
与日益增长的担忧环境、经济、可持续发展,可再生能源和安全,越来越多的资源将被集成到未来的电网。然而,间歇性可再生能源如风能和太阳能的大规模集成创造明显的供需不平衡,因此危及电网的可靠性。战斗的可变性可再生发电、能源储存(如电池、抽水蓄能存储和压缩空气储能)和灵活的负载(例如,加热、通风和空调)建议在许多grid-wideservices应用。
在这个演讲,我将工作在智能控制的存储和灵活的加载renewable-integrated电网。首先,我将介绍一个aggregator-storage网格系统,提供服务的权力平衡。静态和动态存储(例如,存储在电动汽车)被认为是与广泛的存储特征被显式地建模。第二,为变电站维护阶段平衡,我建议智能控制的存储充放电平衡能量流动。第三,灵活的加载纳入能源管理,我建议联合优化供给,需求,存储在网格中对权力平衡。提高长期系统性能(如可靠性,福利,和成本效益),在每种情况下我提供高效集中算法具有较强的理论性能保证和分布式实现有限的信息交换要求。
帕特里克·施教授IU信息学和计算机学院
4月27日周三下午1:00
130信息
社交媒体的出现有显著影响人们如何沟通和交际。青少年使用社交媒体来创造和维持社会关系与朋友和建立自己的声誉。研究表明,青少年比成人更活跃和参与社交媒体。然而,大多数这样的观察,已经通过有限的人种学或横截面数据分析。本文显示检测信息时代的可能性在用户配置文件中使用文本和面部识别方法,提出了一种比较研究27 k Instagram的青少年和成人。我们检查了如何以及为什么用户Instagram的年龄差距的行为可能会发生在社会认知的镜头,发展心理学和人机交互。我们提出两个假设——青少年数字原生代和社会互动的必要性——作为理解的理论框架的因素有助于解释行为的差异。我们演示的应用新方法显示明显的年龄差异以及具体化之前趋势的见解在社交媒体。我们的计算分析确定了小说后发现:(1)青少年比成人更少的照片后;(2)青少年移除更多基于照片的数量喜欢收到的照片; and (3) teens have less diverse photo content. Our analysis was also able to confirm prior ethnographic accounts that teens are more engaged in Liking and commenting, and express their emotions and social interests more than adults. We discussed theoretical and practical interpretations and implications as well as future research directions from the results.
2015年秋季
能机器人基于视觉感知理解人类活动?我们怎样才能使他们这样做?这个演讲讨论计算机视觉算法需要提供的活动程度情况感知机器人。机器人的活动必须认识到不仅包括简单的动作由用户在它前面,但也包括交互直接涉及机器人,如“一个人攻击机器人”。目标是获得可靠地处理此类视频在人类/机器人活动(通常显示重大ego-motion)和关联语义注释。视频从一个机器人的角度被称为第一人称(或自我中心)视频和我们复习方法所必需的。的谈话也对正在进行的机器人工作概述学习表示“可操作的”活动。
刘,IU信息学和计算机学院的
9月23日星期三,下午1:00
107信息
情绪分析,也称为意见挖掘,提取意见的任务/情绪从用户生成的文本,包括博客、对话,评论,等等。在这个演讲,我们调查情绪分析的特征选择方法。特别是我们解决两个问题:1)特征选择作为一种机制来降低高维特征向量通过识别特征,通常为二进制分类定义;我们将调查什么是最好的方法扩展到多设置。2)一个问题无处不在,但通常忽略的情感分析研究不平衡数据;我们将调查是否选中的功能是代表少数类,以及我们是否能够减轻扭曲的效果,更普遍的特性。
玛丽莉娜Fraune IU认知科学
周三9月30日下午1:00
107信息
预计在不久的将来,每个房子有多个机器人:欢迎你回家,另一个洗你的碗,第三个折叠衣服。研究者和投资者都预计,人类和机器人将能够“共生共存”和协作;然而,研究人员还将研究是否以及如何我们通常看到的差异之间的个人和团体之间的相互作用在人类中会影响人机交互。
我将讨论我的研究,开始研究如何与团体互动的机器人在一个群际上下文可能不同于一对一的互动。我将完成通过讨论本研究未来的发展方向应该包含什么。总的来说,我们的目标是使人与机器人合作更有效,高效和愉快的。
菲利普·奥多姆,学校信息和计算的
10月7日星期三,下午1:00
107信息
构建human-in-the-loop智能系统,有效利用专家反馈学习强大的决策模型一直是人工智能的一个长期珍视的目标。然而,现代决策系统过于依赖理想的训练数据和
因此,任何不完美的数据将反映在最终的模型。至关重要,许多真实世界决定系统利用获得的大量专家知识等领域
机器人导航和个人医疗助理。
首先,在这个演讲,我将简略说明我们的算法,利用序贯决策系统的领域知识。虽然收购领域知识是很重要的,许多领域专家不是机器学习专家,不能定义大多数有用的反馈。理想的算法可以沟通专家,他们需要帮助。下半年的谈话中,我提出一个方法,通过积极征求专家反馈意见,交易系统的性能和工作之间所需的专家。我们展示经验更具表达性的贡献在传统学习方法的建议。
估计类比例是机器学习中最基本的任务之一然而,本研究的问题是令人惊讶的是在许多应用程序中打开。在这演讲我将讨论监督,semi-supervised和无监督方法这些估计问题,尤其关注semi-supervised技术只有积极和无标号数据是可用的。我们感兴趣的课之前估计的非参数技术。最近我们制定这个问题作为双组分混合物混合估计模型。然后显示估计的混合比例通常是不明确的,提出了规范形式获得任何分布模型可识别性,同时保持灵活性。从这个理论我们使用的见解,阐明优化类先验和表面提出了一个估计算法。的有效性的方法在单变量和多变量数据评估。最后,我希望展示一些有趣的结果估计问题在我们不知道的生物信息学真相。这是一个联合工作Shantanu Jain,玛莎白色,和迈克尔Trosset。
Shantanu Jain,学校信息和计算的
10月21日星期三,下午1:00
107信息
我们开发参数和非参数算法来估计两个组件的混合比例混合样本
混合物和一个样本的一个组件。这个问题发生在很多领域,在积极影响对二进制分类和无标号数据设置。参数设置中,组件是假定有一个斜正态分布。一般来说,问题是不明确的,在某种意义上,混合比例不识别。我们开发条件,导致可识别性。处理多维数据,我们对一维变换,降低了数据和保存混合比例。
主成分分析(PCA)是一种经典的降维方法,包括数据的投影到由领先的协方差矩阵的特征向量张成的子空间。可以使用此投影用于探索性或作为输入进行进一步的分析,例如回归。如果数据有数十亿的条目或多个,储蓄的计算和存储要求和操作设计矩阵的快速记忆是禁止的。最近,Nystrom和column-sampling方法出现在数值线性代数社区随机近似的大型矩阵的奇异值分解。然而,他们的效用为统计应用程序仍不清楚。我们比较这些理论上近似边界之间的距离感应子空间和所需的,但却是不可行的,PCA子空间。另外我们展示经验,通过模拟和实际数据的例子,逼近精度和计算复杂度的权衡。
城市大学教授Seita小池百合子,东京
2015年11月4日,星期三,下午4点
107信息
社会机器人是机器人技术发展的主要领域之一,在日本,尤其是在日常使用的个人机器人领域。这个演讲将首先报告的当前状态的艺术在日本机器人技术,包括像毕宿五的商业化平台胡椒人形,Palro,帕罗seal-like机器人。我们将介绍我们的实验室的工作设计一个机器人原型“Mugbot”为例,说明一个社会机器人可以通过与社区的互动发展,以及如何使用机器人形状社区。Mugbot已经被儿童教育背景,并介绍几家制造商神仙DIY机器人平台。
生物:Seita小池百合子的信息学教授东京城市大学。他创立并指导设计实验室的信息。实验室的研究侧重于信息设计、社会机器人技术,教育和人机交互。工作多年后与NEC的个人机器人Papero,小池百合子博士开发了自己的社交机器人原型,Mugbot,在2012年赢得了四个蓝丝带创造者大会奖项。小池百合子博士获得了博士学位1986年千叶大学的工业设计。
罗马Fedorov,米兰理工大学
周三,11月11日下午1:00
信息学西107
环境监测领域,经常遭受缺乏重大和详尽的输入数据。另一方面,公众的数量由用户生成的内容或传感器网络可用现在达到前所未有的数量。这个庞大的数据集合包含了大量的潜在的知识,可以用来改善环境模型。特别是,计算机视觉技术可以应用于视觉数据,为了提取相关的环境信息。例如,估计在山区积雪,也就是说,地球表面被雪覆盖的空间范围,是一种有效的环境监测和水管理的重要挑战。公开的视觉内容,用户生成的照片和图像提要的形式从户外摄像头,可以作为额外的测量杠杆的来源,补充现有的地面,卫星和机载传感器数据。SnowWatch平台实现了两个内容采集和处理管道根据这样的来源,解决具体的每个人带来的挑战,例如,识别山峰,过滤掉在恶劣天气条件下拍摄的图像,处理不同的照明条件下,和一个像素分类如雪或non-snow区域。最终结果总结在积雪指数,这表明一个特定的山和天,可见区域的分数被雪覆盖,可能在不同的海拔高度。喂养积雪索引来真正的环境模型揭示了环境产生数据的一致性和效用。
教授Michael Trosset,单位部门的统计数据
周三,11月18日下午1:00
信息学西107
Isomap、局部线性嵌入(米歇尔)和拉普拉斯算子Eigenmaps最初提升为非线性降维技术。努力开发流形学习理论都假定数据在低维流形,流形学习的目标是识别这些集合管。我认为这个目标在概念上不同于非线性降维的目的。例如,黑森eigenmaps可以(理论上)参数化Isomap不能恢复,但Isomap可以构造低维黎曼流形的躲避黑森eigenmaps欧几里得表示。
计算效率之间的平衡和样本在强化学习效率是一个重要的目标。时间不同学习算法随机更新值函数,用一个线性时间复杂度的特性,而最小二乘时间差分算法有效样本的数量,但可以二次特性。在这次演讲中,我将讨论最近的进展的目标更好的平衡计算和样本效率的一个新类使用增量矩阵近似的算法。
统计关系学习(SRL)模型结合概率论的强大的形式和一阶逻辑handleuncertainty大型,复杂的问题。时提供一种非常有效的表示模式由于其简洁和参数共享、高效学习在这些模型是一个重要的问题。首先,我将讨论先进的学习方法
基于提高表示独立。我们的结果表明,学习多个弱模型会导致戏剧性的改善精度和效率。
SRL模型的最关键的一个有吸引力的特性是它们的建模域使用丰富的表示可能允许车缝人工交互。然而,在当前生存研究实验室的研究中,人类被限制为仅被贴标签机或oracle提供整个模型。我将我们最近的工作,允许更合理的人机交互,人力投入被认为是“建议”和学习算法结合了这个建议和数据。最后,我将讨论我们的工作用人SRL模型实现跨看似无关的领域转移允许更有效的学习资料难得域。