它

印第安纳州商业研究中心的出版物在印第安纳大学凯利商学院的。雷竞技官方网站下载

2020年人口普查:平衡隐私和数据的可靠性

马特Kinghorn
色彩斑斓的指纹

微分隐私(DP)过程包括添加一个特定数量的统计噪声的大部分数据变量发布2020年的人口普查保护隐私。

美国人口普查局目前正在进行其10年一次的全国人口的人数。宪法规定在十年一次的人口普查为重新分配在国会表示,数据用户也依赖于人口普查收集的数据对许多目的分配公共资金向州和地方,公共政策制定和评估,以及广泛的研究和分析活动。

人口普查局,之间总是存在一种紧张的目标提供完整和可靠的数据授权保护所有普查对象的隐私。近几十年来,美国人口普查局(Census Bureau)实现了一种避免披露技术被称为“数据交换”来保护隐私。与数据交换,如果有情况应答者的特点是独特的地理区域,所以可能会使识别它们交换信息将与被调查者在附近区域。在这个假设的情况下,这些地理区域的数据最终发布将准确的人口总数等措施,但一些信息的特征数量会改变来保护隐私。

然而,已经被越来越多的担忧,美国人口普查局的披露避免技术不再提供足够的隐私保护(尽管没有已知的情况下被人口普查reidentifications)由于计算能力的进步,更复杂的数据处理技术和更大的可用性的个人信息从其他来源。因此,人口普查局决定采取一种新的披露避免2020年的人口普查的技术称为“微分隐私。”

微分隐私(DP)过程涉及添加特定数量的统计噪音或所谓的“privacy-loss预算”——大多数发表的2020年人口普查数据的变量。这个过程的细节超出了这个范围简短的总结,但是那些有兴趣学习更多可以查看有关此主题的美国人口普查局的web资源1或视图下面的视频。

对于大多数数据用户来说,这种变化将的底线是,更大的隐私保护提供的DP可以妥协数据的准确性在某些情况下,比如地理区域或小群体(如年龄、种族群体,等等)。重要的是要注意,三个变量不会被改变的数据DP程序和将报告为枚举。这三个“不变”的措施是:人口的州(国会提供了准确的数据重新分配),总住房普查块级别(人口普查地理的最小单位)和组块级别的。所有其他变量将受到DP程序。

首次人口普查演示数据显示惊人的结果

帮助用户数据衡量的影响,DP对人口普查的结果,美国人口普查局公布了“2010示范数据产品,其中包括实际数据公布的2010年人口普查和同伴后的2010年业绩数据集应用新的DP程序。之后有机会回顾这些数字,许多数据的反应用户社区接壤的恐慌。简单地说,数据显示这样的重大偏差和扭曲,他们是不适合使用在许多传统上依赖于人口普查数据的应用程序。

人口普查局识别问题,正在解决

在最近的博客中,人口普查局官员承认他们收到的数据用户的反馈表明,DP程序,按照目前的实现,介绍了不可接受的误差水平。2局报告,随后的分析表明,这种错误在很大程度上是一个无意的副产品的后处理程序(而不是故意“噪音”引入到数据通过DP过程),而且它正在通过一些解决方案。

理想情况下,人口普查局公布第二套演示数据一旦纠正这些后处理错误,但是由于时间和资源的限制,第二个版本是不可能的。相反,美国人口普查局(Census Bureau)正在开发一套总结数据质量度量,它将使用评估的进展,因为它对DP的过程。3一旦完成,国家统计局将应用这些措施之前发布的演示数据产品作为基准,然后发布更新汇总统计,希望显示他们正在内部改善。

在印第安纳州的商业研究中心,我们将继续密切关注这个过程和印第安纳州提供更新数据的用户社区。我们也一定要给额外审查的实际最终公布的2020年人口普查数据,看是否有任何地区数据似乎不合理。

人口普查局面临着一个两难的局面:提供细粒度的、可靠的数据,我们都期待,同时保证所有受访者的隐私。与微分隐私,我们可能不得不牺牲一点前确保后者。我们只是希望美国能够取得平衡,满足目标。

笔记

  1. “避免披露,2020年的人口普查,美国人口普查局,最后修改3月27日,2020年,www.census.gov /关于/政策/隐私/ statistical_safeguards /披露-逃避- 2020 census.html
  2. 约翰•m•Abowd和维多利亚a . Velkoff”现代化避免披露:我们学到了什么,我们现在,”研究问题(博客),2020年3月13日,www.census.gov /新闻/博客/ research-matters / 2020/03 / modernizing_disclosu.html
  3. “2020”披露回避系统更新,美国人口普查局2021年7月1日最后修改www.census.gov /数据/学院/在线研讨会/ 2021 / disclosure-avoidance-series / 2020 -披露-逃避-系统- update.html
Baidu
map