数据的错误不要犯:当你不应该平均平均水平
处理数据有时会导致混乱。一个常见错误是平均平均数据。这通常可以看到当试图创建一个从县数据区域数量。本文考察几个流行的数据集平均数据扭曲了准确性。值得庆幸的是,统计印第安纳州(www.stats.indiana.edu),内置的功能来帮助你避免错误。
失业率
失业率是一个很好的例子,当你不应该平均多个利率自率是计算本身(除以劳动力失业)。表1显示了拉斐德市区县组成。平均利率这三个在一起,你会得到7.0%。然而,地铁真正的失业率是7.3%(7260除以100113人失业劳动力)。
表1:拉斐特地铁县的失业率,2012年11月
地理位置 | 失业率 |
---|---|
本顿 | 6.8 |
卡罗尔 | 7.0 |
蒂珀卡努河 | 7.3 |
你得到的如果你平均县利率 | 7.0 |
真正的地铁失业率 | 7.3 |
来源:印第安纳州IBRC,使用部门的劳动力发展数据
个人人均收入
个人人均收入(PCPI)是另一个数据集,您不应该将数据聚合成区域使用平均自PCPI真的是一个计算(收入除以人口)。即使他们这样做给每个县同等重视,每个人都有不同的人口水平。表2使用10-county Indianapolis-Carmel市区为例,表明县平均不同于真正的PCPI超过500美元。
表2:Indianapolis-Carmel市区PCPI, 2011
区域 | PCPI |
---|---|
布恩县 | 52975美元 |
汉密尔顿县 | 51824美元 |
汉考克县 | 43714美元 |
马里恩县 | 38309美元 |
摩根县 | 37634美元 |
约翰逊县 | 36570美元 |
亨德里克斯县 | 36188美元 |
布朗县 | 35863美元 |
谢尔比县 | 35376美元 |
普特南郡 | 31817美元 |
你得到的如果你平均县PCPIs | 40027美元 |
真正的地铁PCPI | 40572美元 |
来源:IBRC,利用经济分析局的数据
印第安纳州使用统计数据如何帮助
统计印第安纳内置的功能来为城市提供统计数据,居住区和综合统计区域,以及各种各样的预先存在的地区,比如美国劳动力发展经济增长区域和印第安纳州经济发展公司区域。此外,您可以使用自定义地区建造任何没有预定义的印第安纳州地区。下面的链接带你到相关输出数据本文中使用的印第安纳州。
一个警告有关中位数
报告数据的中值(例如,家庭收入中值)是另一个领域平均造成的问题。然而,由于中位数时,事情变得有些复杂,因为原始数据用于计算值往往是不可用。回想一下,中位数是中间值。因此,在家庭收入中值的情况下,该地区一半的家庭收入高于中间值和家庭低于中位数的一半。问题是,我们没有在该地区每个家庭的收入数据计算区域中值。通常能做的最好的如果一个区域中值是绝对必要的,继续和平均。在这种情况下,一定要叫它平均中值而不是一个中间值。
瑞秋很奇怪
Geodemographic分析师,印第安纳州商业研究中心,印第安纳大学凯利商学院雷竞技官方网站下载