活动

  • 难度:容易简单 ,中等中 ,很难硬 , 很难很难
  • 需要数学( 需要数学
  • 需要编码( 需要编码
  • 数据采集​​ ( 数据采集
  • 我最喜欢的 ( 我的最爱
  1. [ 硬需要数学 ]在本章中,我对后分层非常积极。但是,这并不总能提高估算的质量。构建分层后可能会降低估算质量的情况。 (有关提示,请参阅Thomsen (1973) 。)

  2. [ 硬数据采集需要编码 ]设计并对亚马逊机械土耳其人进行非概率调查,询问枪支所有权和对枪支管制的态度。为了将您的估算值与概率样本得出的估算值进行比较,请直接从皮尤研究中心(Pew Research Center)运行的高质量调查中复制问题文本和响应选项。

    1. 您的调查需要多长时间?它要多少钱?您的样本的人口统计数据与美国人口的人口统计数据相比如何?
    2. 使用您的样本对枪支所有权的原始估计是多少?
    3. 使用后分层或其他技术纠正样本的非代表性。现在对枪支所有权的估计是多少?
    4. 您的估算值与基于概率的样本的最新估算值相比如何?如果存在差异,您认为如何解释这些差异?
    5. 重复问题(b) - (d)对枪支管制的态度。您的发现有何不同?
  3. [ 很难数据采集需要编码 Goel及其同事(2016)管理了49项来自一般社会调查(GSS)的多项选择态度问题,并选择皮尤研究中心对来自亚马逊机械土耳其人的受访者的非概率抽样调查。然后,他们使用基于模型的后分层调整了数据的非代表性,并将调整后的估计值与基于概率的GSS和Pew调查的估算值进行了比较。对亚马逊机械突击队进行同样的调查,并尝试通过比较调整后的估计值与最近几轮GSS和皮尤调查的估计值来复制图2a和图2b。 (有关49个问题的清单,请参阅附录表A2。)

    1. 将您的结果与Pew和GSS的结果进行比较和对比。
    2. 将您的结果与Goel, Obeng, and Rothschild (2016)的Mechanical Turk调查结果进行比较和对比。
  4. [ 中数据采集需要编码许多研究使用自我报告的手机使用措施。这是一个有趣的环境,研究人员可以将自我报告的行为与记录的行为进行比较(参见例如Boase and Ling (2013) )。要问的两个常见行为是打电话和发短信,两个常见的时间框架是“昨天”和“过去一周”。

    1. 在收集任何数据之前,您认为哪种自我报告措施更准确?为什么?
    2. 招募五位朋友参加您的调查。请简要总结这五位朋友的样本。这个抽样程序可能会在您的估算中产生特定的偏差吗?
    3. 向他们询问以下微观调查问题:
    • “你昨天多少次用手机给别人打电话?”
    • “你昨天发了多少短信?”
    • “在过去的七天里,你有多少次使用手机给别人打电话?”
    • “在过去七天内,您使用手机多少次发送或接收短信/短信?”
    1. 完成此微观测量后,请检查他们的电话或服务提供商记录的使用数据。自我报告使用情况与日志数据相比如何?哪个最准确,哪个最不准确?
    2. 现在将您收集的数据与您班级中其他人的数据相结合(如果您正在为一个班级执行此活动)。使用这个更大的数据集,重复部分(d)。
  5. [ 中数据采集 ] Schuman和Presser (1996)认为问题顺序对两类问题很重要:部分问题,其中两个问题具有相同的特异性水平(例如,两个总统候选人的评级);并且整体问题是一般问题跟随一个更具体的问题(例如,询问“你对你的工作有多满意?”,然后是“你对自己的生活有多满意?”)。

    它们进一步表征了两种类型的问题顺序效应:一致性效应发生在对后一个问题的回答(比其他情况下)更接近于先前问题的回答时;当对两个问题的回答之间存在较大差异时,会出现对比效应。

    1. 创建一对您认为会产生大量问题效果的零件问题;你认为会产生大量订单效应的一对完整问题;和一对你认为无关紧要的问题。在Amazon Mechanical Turk上运行调查实验以测试您的问题。
    2. 你能创造出多大的零件效应?它是一致性还是对比效果?
    3. 你能创造出多大的整体效果?它是一致性还是对比效果?
    4. 您的配对中是否存在问题订单效应,您认为订单不重要?
  6. [ 中数据采集基于Schuman和Presser的工作, Moore (2002)描述了问题顺序效应的一个单独维度:加法和减法效应。虽然受访者对这两个项目相互评估的结果产生了对比和一致性效应,但当受访者对提出问题的更大框架更敏感时,会产生加性和减性效应。阅读Moore (2002) ,然后在MTurk上设计并运行一项调查实验,以证明加法或减法效应。

  7. [ 硬数据采集 ] Christopher Antoun及其同事(2015)进行了一项研究,比较了从四个不同的在线招聘来源获得的便利样本:MTurk,Craigslist,Google AdWords和Facebook。设计一个简单的调查,并通过至少两个不同的在线招聘来源招募参与者(这些来源可能与Antoun et al. (2015)使用的四个来源不同)。

    1. 比较不同来源之间的每个招聘成本 - 金钱和时间。
    2. 比较从不同来源获得的样品的组成。
    3. 比较样本之间的数据质量。有关如何衡量受访者数据质量的想法,请参阅Schober et al. (2015)
    4. 您首选的来源是什么?为什么?
  8. [ 中为了预测2016年欧盟公投(即英国退欧)的结果,YouGov--一家基于互联网的市场研究公司 - 对英国约80万受访者组成的小组进行了在线调查。

    有关YouGov统计模型的详细说明,请访问https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/。粗略地说,YouGov根据2015年大选投票选择,年龄,资格,性别,面试日期以及他们所居住的选区,将选民划分为不同类型。首先,他们使用从YouGov小组成员那里收集的数据,在投票的人中估算出每个选民类型中打算投票的人的比例。他们通过使用2015年英国选举研究(BES)来评估每种选民类型的投票率,这是一项选举后的面对面调查,该调查验证了选民名册的投票率。最后,根据最新的人口普查和年度人口调查(以及其他数据来源的一些补充信息),他们估计了选民中每种选民的人数。

    在投票前三天,YouGov表现出两分领先优势。在投票前夕,民意调查表明结果太接近于召唤(49/51保留)。最后的当天研究预测48/52支持Remain(https://yougov.co.uk/news/2016/06/23/yougov-day-poll/)。事实上,这个估计错过了最终结果(52/48离开)4个百分点。

    1. 使用本章中讨论的总调查错误框架来评估可能出错的地方。
    2. 选举后YouGov的回应(https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/)解释说:“这似乎在很大程度上是由于投票率 - 我们一直认为对于这种精细平衡的种族的结果至关重要。我们的投票率模型部分基于受访者是否在上届大选中投票,而投票率高于大选的投票水平,尤其是在北方。“这是否会改变你对(a)部分的回答?
  9. [ 中需要编码 ]编写一个模拟来说明图3.2中的每个表示错误。

    1. 创建这些错误实际抵消的情况。
    2. 创建错误相互复合的情况。
  10. [ 很难需要编码 Blumenstock及其同事(2015)涉及建立一个机器学习模型,该模型可以使用数字跟踪数据来预测调查反应。现在,您将使用不同的数据集尝试相同的操作。 Kosinski, Stillwell, and Graepel (2013)发现Facebook喜欢可以预测个人特征和属性。令人惊讶的是,这些预测甚至可以比朋友和同事更准确(Youyou, Kosinski, and Stillwell 2015)

    1. 阅读Kosinski, Stillwell, and Graepel (2013) ,并复制图2.他们的数据可在http://mypersonality.org/上获得。
    2. 现在,复制图3。
    3. 最后,在您自己的Facebook数据上尝试他们的模型:http://applymagicsauce.com/。它对你有多好?
  11. [ 中 ] Toole et al. (2015)使用来自手机的呼叫详细记录(CDR)来预测总体失业趋势。

    1. 比较和对比Toole et al. (2015)的研究设计Toole et al. (2015)Blumenstock, Cadamuro, and On (2015)
    2. 您是否认为CDR应取代传统调查,补充或不用于政府决策者追踪失业?为什么?
    3. 有什么证据可以说服CDR可以完全取代传统的失业率指标?