3.4.2非概率样本：权重

这种翻译是由一个计算机创建。 ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

3.4.2非概率样本：权重

与非概率的样品，权重可以撤消引起的假定采样过程的扭曲。

在研究人员从概率的样品重量的反应相同的方式，他们还可以加权来自非概率的样品的响应。例如，作为替代的CPS，假设您放置在数以千计的网站横幅广告招募参与者估计失业率的调查。当然，你会怀疑你的样品的平均简单将失业率的一个很好的估计。你怀疑可能是因为你认为一些人更容易完成的调查比其他人。例如，谁不花大量的时间在网络上的人是不太可能完成的调查。

正如我们在上一节中所看到的，但是，如果我们知道怎么样选择，因为我们做的概率样本，那么我们就可以撤销由采样过程中的扭曲。不幸的是，与非概率样品时，我们不知道如何选择的样本。但是，我们可以对采样过程假设，然后以相同的方式应用的加权。如果这些假设是正确的，那么权重将撤消由采样过程中的扭曲。

例如，假设在响应您的横幅广告，你招募10万的受访者。但是，你不相信，这些10万受访者的美国成年人简单随机样本。事实上，当你比较的受访者对美国的人口，你会发现一些州（如纽约）的人的比例过大以及人们从一些国家（例如，阿拉斯加）的代表性不足。因此，样品的失业率很可能是在目标人群失业率的糟糕的估计。

撤消，在采样过程中发生的失真的一种方法是分配权重给每个人;较低的权重，以人的状态样品（如纽约）和较高的权重，以人民在超限额从样品（例如，阿拉斯加）在低于限额的国家。更具体地，对于每个受访重量与他们患病相对样品中它们在美国人群患病。这种加权过程称为后分层 ，并在罗德岛的受访者分别给予体重低于加州受访者体重的想法应该提醒你的例子在第3.4.1节。事后分层要求您知道足以把你的受访者为组，并了解目标人群的每一组中的比例。

虽然概率的样品和非概率样本的加权是相同的数学（见技术附件），它们在不同的情况下工作得很好。如果研究者拥有完善的概率抽样（即，没有覆盖的错误和没有非响应），那么权重将产生在所有情况下的所有特征的无偏估计。这种强大的理论保证是为什么概率样本的倡导者发现他们如此大的吸引力。另一方面，加权非概率的样品将仅产生用于所有性状无偏估计，如果响应倾向是为大家各组中的相同。换句话说，回想起我们的例子中，采用分层后会产生无偏估计如果每个人都在纽约参加了，每个人都在阿拉斯加有参与等方面的相同的概率的概率相同。这种假设被称为均质响应倾向-组内的假设，和它在明知起着关键的作用，如果分层后会与非概率样品很好地工作。

不幸的是，在我们的例子中，均质响应倾向，组内的假设似乎不太可能是真的。也就是说，这似乎不太可能，每个人都在阿拉斯加拥有在您的调查是相同的概率。但是，有要记住关于分层后三个重要点，所有这一切使它看起来更有前途。

首先，均质响应倾向，组内的假设变得群体数量的增加更合理。和，研究人员不局限于只基于单个地理维度基。例如，我们可以基于状态，年龄，性别和教育程度创建组。这似乎更合理，有组内18-29齐响应倾向，女性，大学毕业生生活在阿拉斯加比群生活在阿拉斯加所有的人的范围内。因此，作为用于分层后增加组的数量，假设需要支持它变得更合理。鉴于这一事实，这似乎是一个研究人员希望创建分层后群体数量庞大。但是，由于基数量的增加，研究者遇到不同的问题：数据稀疏。如果只有人每组一个小数目，那么估计会更明朗，而在极端情况下，那里是一个没有受访者一组，然后分层后完全分解。有两种方法进行homogeneous-响应倾向性组内的假设的合理性，并为每个组合理的样本量的需求之间的这种内在张力。一种方法是移动到一个更复杂的统计模型，用于计算权重和其它是收集一个更大，更多样化的样品，这有助于确保每个组中合理样本大小。而且，有时研究人员都做，因为我将在下面介绍更多的细节。

与非概率样本后分层工作时，第二个考虑是，概率分析样品时均相反应，倾向性的组内的假设已经被频繁地进行。在实践中是需要的概率的样品这种假设的原因是概率样品具有不答复，以及用于调节用于非反应的最常见的方法是如上所述的后分层。当然，仅仅是因为许多研究人员做出了一定的假设并不意味着你也应该这样做。但是，这并不意味着，在实践非概率样本进行比较概率样本时，我们必须牢记，都依赖于假设和辅助信息以产生估计。在最现实的设置，根本就没有免费的假设的方法进行推理。

最后，如果你关心在大约一个特定的估计，在我们的例子失业率，那么你就需要比均相反应，倾向性的组内的假设较弱的条件。特别是，你不需要假设，每个人都有同样的反应倾向，你只需要假定有各组内的反应倾向和失业率之间没有相关性。当然，即使本较弱条件不会在某些情况下成立。例如，假设估计是做志愿工作的美国人的比例。如果人们谁做志愿工作更有可能同意参与调查，然后研究人员将系统地高估志愿的数量，即使他们分层后的调整，已经由经验证明结果Abraham, Helms, and Presser (2009) 。

正如我刚才所说，非概率样本由社会科学家观察以极大的怀疑态度，部分原因是因为他们的一些调查研究的初期最尴尬的失败中的作用。我们是如何走到今天用非概率样本一个明显的例子是王炜，大卫·罗斯柴尔德，沙拉德·戈埃尔，以及安德鲁·格尔曼的，使用美国的Xbox用户的非概率抽样正确地恢复了2012年美国大选结果的研究-a决然非随机的美国人样品(Wang et al. 2015)研究人员招募了受访者从Xbox游戏系统，正如你所预料的，在Xbox样品倾斜男性和扭曲年轻：18 - 29岁的年轻人占全体选民的19％，但在Xbox样本的65％，男性占47％的选民和Xbox样品（图3.4）的93％。因为这些强大的人口偏见，原始的Xbox数据是选举申报书的一个贫穷的指标。据预测罗姆尼在美国总统奥巴马强烈的胜利。再次，这是原始的，未经调整的非概率样本的危险的另一个例子，是让人想起了文艺文摘惨败。

图3.4：在王等人的受访者人口。（2015）。由于受访者从招募的Xbox，他们更可能是年轻的，更可能是男性，相对于选民在2012年大选。

图3.4：在受访者人口Wang et al. (2015)由于受访者从招募的Xbox，他们更可能是年轻的，更可能是男性，相对于选民在2012年大选。

不过，王和同事们意识到这些问题，并试图加权受访者以纠正采样过程。特别是，他们所使用的分层后我告诉你一个更复杂的形式。这是值得我们学习更加一下他们的做法，因为它建立关于分层后的直觉，以及所使用的特定版本与同事王某是最令人兴奋的方法来加权非概率样本之一。

在我们对3.4.1节估计失业率简单的例子，我们基于居住的州分的人口分组。相比之下，与同事王某划分人口纳入到由定义176256组：性别（2类），种族（4类），年龄（4类），教育（4类），州（51类），方ID（3类），思想（3类）和2008票（3类）。随着越来越多的群体，研究人员希望，这将是越来越有可能在每个组中，反应倾向是不相关对奥巴马的支持。接下来，而非构建个人层面的权重，因为我们在我们的例子一样，王某和同事使用了一种复杂的模型来估计每个组会投票支持奥巴马的人的比例。最后，他们结合每个组的已知大小的支持，这些集团估计产生的支撑，估计整体水平。换句话说，他们砍了人口分成不同的组，每个组中估计奥巴马的支持，然后拿着组测算的加权平均产生的总体估计。

因此，在他们的方法的一大挑战是估计奥巴马的支持在每个176256组。虽然他们的小组成员包括345858独特的参与者，由选举投票的标准数量庞大，有为此Wang和同事们几乎没有受访者很多，许多团体。因此，估计他们使用的技术，每个组被称为多层次的回归与分层后，研究者它亲切地称呼P.先生从本质上讲，一个特定的组内估计奥巴马的支持，P先生集合许多信息的支持密切相关的群体。例如，考虑估计女性，西班牙裔对奥巴马的支持所带来的挑战，18-29岁之间，谁是大学本科毕业，谁注册的民主党人，谁自我认定为温和派，谁在2008年投票支持奥巴马此是一个非常，非常具体的基团，并且可以存在与这些特征的样品中的任何人。因此，为了使这个组的估计，P先生一起池从人非常相似的群体估计。

使用这种分析策略，王和他的同事们能够使用Xbox非概率样本非常密切地估计，奥巴马在2012年大选中获得全面支持（图3.5）。事实上他们的估计比民意调查的聚合更加准确。因此，在这种情况下，加权特异性先生P.-似乎做好校正非概率数据的偏差;偏见，当你从未经调整的Xbox数据的估计是可见的。

图3.5：从Wang等人的估计。（2015）。未经调整的Xbox试样产生不准确的估计。但是，加权的Xbox样品产生了比平均基于概率的电话调查更准确的估计。

图3.5：从估计Wang et al. (2015)未经调整的Xbox试样产生不准确的估计。但是，加权的Xbox样品产生了比平均基于概率的电话调查更准确的估计。

有来自Wang及其同事的研究中两个主要的教训。首先，未经调整的非概率样本可能会导致不良的估计;这是许多研究人员之前听说过一个教训。但是，第二个教训是，非概率样本，正确加权，实际上可以产生相当不错的估计。事实上，他们的估计比从pollster.com，更传统的选举投票的集合的估计更准确。

最后，有什么我们可以从这个具体的研究学习重要的限制。正因为后分层在这种特殊情况下运作良好，也不能保证它会在其他情况下正常工作。事实上，选举也许最简单的设置之一，因为民意调查机构一直在研究选举近100年，还有定期的反馈（我们可以看到谁赢得选举），以及政党认同和人口特征都比较预测投票。在这一点上，我们缺乏坚实的理论和实际经验，知道什么时候加权调整非概率样本将产生足够精确的估计。有一点是明确的，但是，是如果你是被迫与非概率样本的工作，然后有足够的理由相信，调整后估计会比未调整的估计更好。