AI演讲系列

感兴趣的人工智能、机器学习、机器人、计算机视觉、自然语言处理、和/或广泛的相关领域?欢迎您的光临!大多数谈判2021年春季将于星期二下午1点- 2点通过放大。订阅我们的邮件列表发送一个空白的邮件给list@list.indiana.edu主题:“订阅ai-seminar-l”。大卫•克兰德尔联系djcran@indiana.edu,问题或建议的人。

2021年春季

4为什么社交媒体使我们容易受到操纵

菲利波Menczer教授,IU马夫
* * *周二2月9日,1:15pm * * *

随着社交媒体新闻和信息的主要渠道扩散,就关键的了解认知之间的复杂的相互作用,社会和算法偏见引发了我们对在线社交网络的依赖使我们容易操纵和虚假信息。这个演讲概述进行网络分析,建模和机器学习努力学习的病毒传播错误信息和开发工具为打击在线操作的意见。

一步细化谱低秩随机图的方法

方正教授谢、国际单位统计
2月23日星期二下午1点

随机图模型在统计和机器学习的一个热门话题,以及广泛的应用领域。在这个演讲我将介绍谱方法及其对煤的一步细化随机图。谱方法,包括邻接谱嵌入和拉普拉斯算子谱嵌入,被证明是最优,可以提高各自的一步细化。这些结果都是建立在一组光谱方法和中心极限定理的一步提纯。仿真例子和一个真实的维基百科图的分析提供数据证明该方法的有效性。

人工智能和环境

教授Nathan Ensmenger,IU马夫
3月2日星期二下午1点

AI系统往往被视为无实体的缩影,非物质的技术。他们生活在云端,与人类只能通过信息交互。然而AI-driven社会环境的影响是显著的,无论是能源、水和矿产资源应AI功能,而且在人工智能的方式改变我们与自然世界的感知和交互。

用人类的视角来理解自然语言推理(NLI)模型

艾迪娜威廉斯博士Facebook的人工智能研究
* * *星期二3月9日11点* * *

鉴于世界上NLP模型的越来越突出的作用,这是至关重要的,我们开发一个更好的理解他们的行为。在这个演讲,我提出了两种不同的角度对这个话题,人类依靠直觉NLI NLI基础模型数据和行为。首先,我们hand-annotate NLI基础数据集的发展设置困难对抗更好地了解哪些类型的推理需要得到正确的标签。我们表明,相同类型的推理是负责不同的先进的模型的成功与失败,表明我们可能受益于我们的努力关注架构可以处理这些现象。第二,我们问人为的解释模型的推理决策对齐模型如何做出这些决定。我们提出一个一致性指标基于人为的自然语言解释和发现我们的模型是对人类只有弱一致。综合起来,这些项目暴露的机会使用人类的角度来改进我们当前的最佳模型。

AI请人帮忙:如何更好地优化过程不确定性建模

帕特里克Haffner博士,交流有限责任公司
3月16日,* * *周二11点* * *

错误由AI系统的影响是越来越烦人的和昂贵的。然而,即使在一个简单的分类器,精确校准的机器学习技术仅为我们提供一个概率这个例子已经在训练数据:系统仍然无法拒绝out-of-distribution (OOD)或模棱两可的例子。部署会话上下文的AI系统,我们将通过示例展示如何关键这个拒绝的能力,例如,决定何时转移到人类的协助或接有源标签的例子。特别是,我们将展示一些改进在不确定性估计会导致大量减少昂贵的人力援助。
之后简要回顾过去的工作和最新进展在模型不确定性的估计OOD,我们将关注较少,但更实用和有用的,模糊技术模型,特别是使用有限状态机和多实例学习。虽然主要的目标是深入学习系统,这个演讲将严重依赖于更多的简单线性的例子。

跨站点一致对抗学习单级核认可

Xuhong教授张,IU马夫
周二4月6日下午1点

通过缩放:https://iu.zoom.us/j/96980684858

识别细胞核或细胞在显微镜是一项基本任务和数字病理图像分析。深度学习,尤其是卷积神经网络(CNN)最近获得优秀的对象识别性能。然而,CNN通常需要大量的带注释的图像数据,这通常是很难获得在医学成像领域,从而可能造成障碍将最先进的CNN模型应用于单个核细胞/量化。在本文中,我们提出一种新颖的、统一的单级核对抗的学习框架识别跨站点显微镜图像数据集。具体地说,这个框架生成对抗学习适用于image-to-image翻译两个不同的站点之间的数据集,同时学习深回归模型来识别不同类型的核。此外,它包括一个跨站到联合学习保持一致性语义信息在图像翻译,和这个新引入的约束可以促进和提高敌对的学习和回归模型的性能。我们评估该方法在两个病理图像数据集,从两个不同的机构有不同的成像获得的协议。实验结果表明,我们的方法可以显著提高性能的核心识别相比,参考基线和最近也很有竞争力的全面监督模型。

关系提取从半结构化的Web

Prashant Shiralkar博士,亚马逊
* * *周二4月13日11点* * *

通过缩放:* * *https://iu.zoom.us/j/97170234525* * *

半结构化的网站IMDb和改编等充斥在网络上和富含信息通常是由底层数据库填充。从这些网站中提取知识可以丰富我们的知识基础饲料Alexa让她更多的知识,同时也提高亚马逊的报道目录提供一个增强客户体验。然而,鉴于演示布局异质性和术语使用这些网站,完全自动化的任务信息提取(IE)尺度大小的网络是一个重大的挑战。在这次演讲中,我们将概述一些最近的IE技术设计的产品图团队在亚马逊在应对这些挑战。

使用人工智能在线成人教育

阿肖克•k•戈埃尔教授、学校的交互式计算、乔治亚理工学院
4月20日周二下午1点

COVID-19迫使几乎所有在线教育。这是一个完美的机会来使用AI改进网络成人教育。我将给我研究的简要概述,然后详细描述三个小说和交织在一起的人工智能技术:(1)吉尔沃森,一个虚拟的教学助理等回答问题基于教育文件类教学大纲,(2)萨米,虚拟社会代理促进在线交互,和(3)维拉,虚拟实验研究助理支持研究性学习的科学知识。最初的结果是积极的:(i)吉尔沃森问答已经被> > 20 5000名学生在线课程和保存老师> 500小时的工作;(3)萨米被用于> 10在线课程,促进社会交往和社会;和(iii)维拉被用于混纺类和在线免费一百万世界各地的用户。放在一起,这些人工智能技术帮助提供更多可用的同时在线学习(通过网上材料),负担得起的(通过节省老师时间),和可实现的(通过提供学习帮助,培养学生参与)。

标题TBD

乔尔Tetreault博士,Dataminr
时间待定

抽象的TBD

标题TBD

曼迪Mejia教授、国际单位统计
时间待定

抽象的TBD

2020年秋季

个性化的语音增强:测试时间适应使用没有或很少有私人数据

Minje金教授,IU智能系统工程
9月15日周二上午11点

机器学习应用成功的关键之一是提高每个用户的个人经验通过个性化的模型。个性化的模型可能是一个比一个通用模型,能效高的解决方案,因为它集中在一个特定的子问题,一个较小的模型结构可以足够好。然而,训练一个个性化的模型需要的数据从用户特定的测试时间,这并不总是可用的由于他们的私人性质。此外,这些数据往往是无标号,因为它只能在测试期间收集的时间,一旦在系统部署到用户设备。可以依赖于一个通用模型的泛化能力,但这样一个模型可以计算/空间复杂实时处理在一个资源受限的设备。在这次演讲中,我将提出一些技术规避缺乏标记的个人数据在语音增强的背景下。我们的机器学习模型将不需要或很少数据样本测试时间用户,而他们仍然可以实现个性化的目标。为此,我们将调查模块化语音增强模型以及潜在的敌对的优化和self-supervised学习没有——或者few-shot微调个性化语音增强。因为我们的研究达到个性化的目标在保护隐私和资源的方式,这是一个一步更可用和可负担得起的AI的社会,而现代人工智能的形式往往是一个大规模的通才,这有时让模型表现不佳的社会弱势群体。

电子健康AI推理和大规模的生活方式数据

教授Xiaozhong刘,IU马夫
周二9月22日,上午11点

使用大型生活数据,例如,饮食信息,在线购物记录,电动药房处方日志,和社交网络,各种health-AI任务是令人兴奋的但有挑战性。通过利用先进的机器学习,数据分析和联合学习技术,我们可以推断出非常丰富的用户生活方式的知识,它可以帮助我们探索各种各样的个人健康风险和定位在疫情暴发期间最脆弱的群体。在这次演讲中,我将分享三个最近的工作,健康饮食建议,计算用户健康分析,和COVID19公众意识建模,而所有这些采用超大规模用户生活方式的数据,例如,9400万+ 1500亿年收购/用户查询日志,机器学习。不像在这个方向上努力之前,大规模的生活方式数据使得创新和不同人群的全面调查。它提供了重要的潜力提高我们理解个人/社区卫生风险。

学习连接自然交流的图像和文本

教授Malihe Alikhani,皮特网络
10月5日星期一,上午11点

伴随演讲手势图像的社交媒体文章、人类毫不费力地把单词与视觉演示。然而,机器不具备理解和生成此类演讲由于人们的普遍依赖文字和图像相关的常识和世界知识。我现在小说框架建模和学习更深层次的结合理解文本和图像的分类推理预测时间的关系,因果和逻辑悖论在上下文中。这使得系统精度高而做出推论揭示作者期望和社会环境的偏好。我继续设计方法生成文本基于视觉输入,使用这些推论来为用户提供关键请求的信息。结果显示一个戏剧性的改善所生成的文本的一致性和质量通过减少虚假信息了一半。最后,我画我的其他项目在人机协作和会话系统和描述我的研究视野:构建人类交际系统和人工智能接地利用语言的认知科学使用。

使用虚拟现实和人工智能反向工程智能的起源

教授贾斯汀木,IU马夫
10月20日周二上午11点

智力的起源和计算基础是什么?我们怎么能复制生物智能机器?为了解决这些问题,我的实验室使用一种双管齐下的方式。首先,我们执行controlled-rearing实验,使用刚出生的小鸡作为一个模型系统。我们在严格控制虚拟世界养小鸡,记录他们的行为24/7他们学会感知和理解他们的环境。使用虚拟现实,我们探讨核心认知能力(例如,对象感知)出现在新生儿的大脑。第二,我们对自主执行并行实验人工代理,使用虚拟controlled-rearing腔。我们提高人工代理在同一环境的新生儿,并测试他们是否开发相同的能力时相同的经历。代理可以配备不同的学习算法,所以通过比较动物和代理,我们可以隔离需要模拟生物智能的核心学习机制。促进进步,我们正在创造一个“智力的起源”的实验,其中包括基准评估人工大脑是否学习像新生儿大脑在一系列的任务。

测地线结构恢复Isomap:欧几里得表示

教授Michael Trosset、国际单位统计
10月27日周二上午11点

非线性降维流形学习技术躺在一个低维流形假设高维特征向量,然后试图利用流形结构获得有用的数据的低维欧几里得表示。Isomap,开创性的流形学习技术,是一种优雅的合成两个简单的想法:黎曼距离的近似最短路径距离图所在流形结构,并与欧氏距离的近似最短路径距离多维标度。我们重新审视Isomap的基本原理,澄清什么Isomap它不是。特别是,我们探索普遍认为Isomap歧管时只能使用参数化Euclideanspace凸区域的。我们认为这种看法是基于一个非常狭窄的解释流形学习参数化复苏,我们提交Isomap更好理解为构建欧几里得测地线结构的表征。我们考虑一个众所周知的例子,以前Isomap解释为证据的局限性,我们重新审视原始ofIsomap收敛性质的分析,认为不需要凸性收敛于黎曼距离最短路径距离。

两个解析器——最后一章的故事吗?

教授乔阿欣Nivre乌普萨拉大学
11月2日星期一上午11点

数据驱动的依赖项解析近20年来一直由两个主要方法:基于解析和跃迁过程解析。在其最简单的形式,这两种方法是完全不同的和互补的优势和劣势,这是反映在不同的错误配置文件。多年来,然而,研究旨在减轻每种方法的弱点(在不牺牲优势)导致逐渐收敛方法,进一步加快的深度学习技术的采用。在这次演讲中,我将调查的发展基于和跃迁过程依赖解析从历史的角度来看,但重点是最近的工作分析的影响深度学习这些语法分析器的结构和行为。

NLP评分内容的教育

Brian博士赖尔登教育考试服务
11月30日星期一,上午11点

最近的进步表示学习自然语言处理已被证明有效的在许多自然语言处理任务和应用程序。这包括教育,最近的神经方法证明改善人机协议在核心任务包括演讲能力评估,论文得分,简短的回答(内容)得分,和观点挖掘。这个演讲将提供一个简短的概述NLP研究得分和反馈在ETS教育,关注学生得分含量反应。我们将讨论最近的工作展示挑战先进的神经方法的可解释性和健壮性,讨论剩下的障碍需要可靠地捕捉学生思想教育的应用程序。

2020年夏天

可伸缩的和保护隐私的硬件/算法共同设计为加速基因组测序

Lei江教授,IU智能系统工程
6月9日周二下午4点

基因组测序是个性化医疗的基础。分子肿瘤基因组测序的输出管道的测试可以用来优先抗癌治疗和病人直接管理。因此,它的延迟是一个生死攸关的问题。尽管测序机器的巨大进步,摩尔定律不能赶上基因组数据的爆炸。是具有挑战性的先进的硬件平台来处理基因组测序管道有效,由于缺少可伸缩和大容量的主要记忆。此外,频繁抓取小DNA读取小空间位置显著增加了记忆的I / O数据传输能量。最后,盲目上传私人基因数据不可信云中的服务器是危险的。在这次演讲中,我将提供一个可伸缩的ReRAM-based主内存硬件系统,一个算法/硬件协同设计阅读对齐processing-in-memory加速器和保护隐私神经网络算法设计加速基因组测序。

深度学习时间在MLPerf系列和科学数据

教授杰弗里·福克斯,IU智能系统工程
周二6月16日下午4点

深度学习已经应用于许多时间序列和序列与序列映射,但在许多地区,最好的方法是不清楚。可能在领导与音频行业的应用和ride-hailing。我们讨论一些研究的例子包括COVID日常数据,解常微分方程,和地震。深度学习代理人很有前途。我们展示如何与行业协会合作MLPerf,我们也许能够建立最佳实践和帮助社区发现和想法应用到新的领域。

Autism-inspired AI视觉空间的社会推理

教授Maithilee达,范德比尔特大学计算机科学系
周二6月23日下午4点

自闭症个体认为不同于正常个体,包括许多在视觉空间的优势在社会和心理理论推理推理和挑战。我们的研究旨在使用人工智能计算方法来更好的模型和理解自闭症和其他认知差异neurodiverse条件,同样使用我们学习研究神经元多样化通知新的人工智能技术的发展。在这次演讲中,我将讨论两个当前项目:1)学习策略差异的背景下,标准化的人类视觉空间的推理测试,包括智能代理如何发现和利用新策略基于个人的认知资源;2)社会认知的研究认知模型的上下文中发展中一个新的教育游戏,电影侦探,教学理论的思想和社会推理技能自闭症中学生在一个典型的以视觉为导向的方式。

和贝丝苍白在美国国家科学基金会发生

贝丝Plale教授,IU马夫
6月30日周二下午4点

苍白,发生博士是谁完成任期3年在美国国家科学基金会(NSF),将谈论机构优先事项,将唤起注意人工智能编程活动,将CISE说话重点包括扩大参与和开放的科学。用于早期职业研究员,这次谈话也会唤起注意的一些力学与代理进行交互,可以混淆新人,并将留下充足的时间来讨论。

可操作的控制模型在生物医学领域的复杂系统

教授路易斯•罗查、IU信息学和认知科学
* * *星期四7月9日,中午* * *

现代人工智能(AI)和机器学习(ML)技术预测从先前的观测系统行为。然而,在生物学中,在真正的复杂系统,深刻转型系统行为可能发生从从未见过observations-think人畜共患病和COVID-19大流行。此外,AI /毫升技术通常不能为他们的预测提供了一种解释。我认为复杂系统建模,利用人工智能/毫升技术来估计参数,需要生产的动力学模型,可以预测和解释罕见的或看不见的控制事件的系统行为。尤其是对于理解生化调控在环境和动力扰动下的进化事件。朝着这个目标,我将我们的最近的研究发现有效控制导引动态生化调控路径。我们的方法集中在消除冗余从系统生物学模型的发展,细胞周期,癌症的反应等等。删除大量的冗余在这些模型,揭示了首选途径扰动的传播和动力响应的构建块,导致可操作的控制干预措施的预测。

对心理声学的语音处理和科学有效的机器学习

唐纳德·威廉姆森教授、IU计算机科学
7月14日周二下午4点

机器学习已经使语音处理的应用,如语音识别、更普遍和无处不在的,它已成为日常生活的重要组成部分对数以百万计的人。然而,对于其他领域在语音处理,使用不太明显。这部分是因为机器(深)学习并没有导致现实的输出声音自然和真实的人类观察员。在这次演讲中,我们将讨论我们最近努力确保输出心理声学的言论从机器学习算法和科学有效。特别是,我们将展示如何将感性和科学原则纳入学习算法可能导致进一步的改进。

用认知科学和神经科学来帮助推动人工智能

Zoran Tiganj教授、IU计算机科学和认知科学
周二7月21日下午4点

制造人工代理能够模仿人类的学习和推理一直是人工智能的长期目标。我将讨论一些经验数据和计算模型从神经科学和认知科学,能帮助我们朝着这个目标前进。具体来说,我将谈论的结构化表示知识的重要性,尤其是对精神或认知地图的空间,时间,和概念。我将数据从最近的行为和神经的研究,表明大脑保持一个压缩精神过去的时间线和用它来构造一个压缩精神未来的时间表。从计算的角度来看,这些发现说明联想学习如何扮演一个角色在构建结构化表示的知识。最后,我将讨论可能的策略将这些发现构建人工代理,尤其是memory-augmented和引起神经网络。

优化与L0范数及其应用

王教授杰出、IU计算机科学
周二7月28日,下午4点

持续激增稀疏学习L0范数吸引了大量的注意力在几个科学社区。在这次演讲中,我将先去了最近的进展稀疏的回归和显示L0范数正规化的优势超过其他类型的sparsity-inducing正规化(如套索,MCP、竹荚鱼)。在谈话的第二部分,我将专注于近端替代线性化最小化(PALM)算法,能够解决非凸和模型的优化。我将讨论如何把深层神经网络(款)模型到棕榈框架培训款非凸和模型的合法化。具体来说,我将谈论修剪款使用L0范数稀疏集团套索正规化。除了使用稀疏L0规范诱导模型,最后,我将讨论如何使用二进制L0范数的性质来生成标签信息集成协同过滤模型和字典学习模型。和如何应用集成模型来预测基因调控网络。

健壮的多视点视觉学习:知识流动的角度来看

丁教授均IUPUI计算机和信息技术
8月4日周二下午4点

多视点数据广泛访问现在由于各种类型的特性,中诚信和不同的传感器。例如,最受欢迎的商业深度传感器Kinect使用可见光和近红外传感器深度估计;自动驾驶使用视觉和雷达/生产实时3 d激光雷达传感器信息在路上;从不同的观点和分析算法更喜欢脸图像高保真重建和识别。他们倾向于促进更好的数据表示在不同的应用场景。本质上,多个特性试图揭示各种知识在每个视图来减轻最后的任务,因为每个视图保存共享和私人信息。最近,有一堆的方法提出了处理多视点视觉数据。我们的教程涵盖了大部分多视点视觉数据表示方法从两个知识流的角度,即。、知识融合、知识转移、从传统的多视点集中学习zero-shot学习,从学习转移到few-shot学习。我们将讨论当前和即将到来的挑战,这将造福于人工智能社区在工业和学术界,从文献综述到未来的发展方向。

从黑暗的网络连接利用已知的漏洞为主动网络威胁情报:一种引起深刻的结构化语义模型的方法

Sagar教授Samtani凯利商学院
8月18日周二下午4点

黑暗的网络已成为一个有价值的来源积极开发网络威胁情报(CTI)的能力。尽管它的价值,黑暗的Web数据包含成千上万的非结构化,un-sanitized文本记录包含重要的非天然的语言。这可以防止标准的直接应用CTI分析(如恶意软件分析,IP声誉服务)和文本挖掘方法执行关键任务。这样一个挑战属于系统链接黑暗Web利用在现代组织目前已知的漏洞。在这个演讲,我将最近的工作扩展深度学习技术,即深层结构的语义模型(DSSM)(绘制神经信息检索)将新兴的注意机制可解释性的深度学习文学。合成利用漏洞注意DSSM (EVA-DSSM)自动链接黑客论坛利用和漏洞企业漏洞评估工具提供的基于他们的名字,输出可翻译的和可辩解的文本功能,创建链接,是至关重要的,为后续的补救和缓解气候变化的努力提供优先链接。严格的评估表明,EVA-DSSM优于基准方法来自分布语义,概率匹配和深度上优于短的文本匹配算法匹配相关漏洞主要漏洞评估工具0-day web应用程序利用,远程攻击,本地攻击和拒绝服务攻击。框架在两种情况下的效用:选择主要的美国医院和系统监控和数据采集(SCADA)系统。

之前的谈判,请访问:IIS研讨会