我演讲的起源和发展的最重要的类型之一为监督学习算法:决策树。一系列的研究人员,每个稍微歪斜的占主导地位的实践和认知领域的优点,来间接的树木在1970年代:数据驱动的统计学家,机器学习专家集中在大型数据集,社会科学家对多元统计不满意,一个物理学家感兴趣的主要是在电脑最终是谁在统计部门终身。情况后,不同形式的树的创造者部署“应用”科学哲学的批判当代实践,甚至促进实践学科认知标准。面对越来越多的highdimensional数据,这些作者一次又一次地提倡data-focused实证主义。树的历史不干净地分为理论和应用阶段;一个学术和商业的阶段;统计和计算阶段;甚至一个算法设计和实现阶段。这段历史是迭代:算法的实现实际上现有电脑与各种限制驱动器的发展和转换技术。最近复兴和当前胜利前的神经网络,决策树是人工智能和机器学习的变换中心近年来:关注的中心目标的转变与人类可理解性预测的问题,并从符号解释转向有效但高深莫测的黑盒。 Trees exploded in the late 1980s and 1980s as paragons of interpretable algorithms but developed in the late 1990s into a key example of powerful but opaque ensemble models, predictive but almost unknowable. We need to explain, rather than take as given, the shift in values to prediction—to an instrumentalism—central to the ethos and practice of the contemporary data sciences. Opacity needs its history—just as transparency does.