活動

  • 難易度:簡単簡単 、培地中 、ハードハード 、 とても厳しいとても厳しい
  • 数学を必要とする( 数学が必要です
  • コーディングが必要( コーディングが必要
  • データ収集 ( データ収集
  • 私のお気に入り ( お気に入り
  1. [ ハード数学が必要です ]この章では、層別化について非常に肯定的でした。しかし、これは必ずしも見積りの質を改善するとは限らない。事後成層が見積りの質を低下させる可能性のある状況を構築する。 (ヒントについては、 Thomsen (1973)参照してくださいThomsen (1973)

  2. [ ハードデータ収集コーディングが必要 ]アマチュアメカニカル・タークの非確率調査をデザインし、銃の所有と銃規制に対する態度について質問する。推定値を確率サンプルから導かれたものと比較できるように、ピューリサーチセンターで実行されるような高品質の調査から質問テキストと回答オプションを直接コピーしてください。

    1. あなたのアンケートはどのくらいの期間かかりますか?それはどれくらいしますか?あなたのサンプルの人口統計は、米国人口の人口統計とどのように比較されますか?
    2. あなたのサンプルを使って銃の所有権の生の推定値は何ですか?
    3. ポスト・レイヤーやその他の技術を使用して、サンプルの非代表性を修正します。今、銃の所有権の見積もりは?
    4. あなたの見積もりは、確率ベースのサンプルからの最新の見積もりとどのように比較されますか?矛盾があれば、どういう意味でしょうか?
    5. 銃規制に対する態度については、(b) - (d)の質問を繰り返します。あなたの発見はどうやって違いますか?
  3. [ とても厳しいデータ収集コーディングが必要 Goelら(2016)は、General Social Survey(GSS)から抽出された多肢選択式の49の質問を管理し、Pew Research CenterによるAmazon Mechanical Turkの回答者の非確率サンプルへの調査を選択した。次に、モデルベースの事後階層化を使用してデータの非代表性を調整し、その調整後の見積もりを確率ベースのGSSおよびPew調査の見積もりと比較しました。 Amazon Mechanical Turkについても同様の調査を行い、調整後の見積もりとGSSおよびPew調査の最新ラウンドの見積もりとを比較して、図2aと図2bを複製してみてください。 (49の質問のリストについては、付録の表A2を参照してください)。

    1. あなたの結果をPewとGSSの結果と比較して比較する。
    2. 結果をGoel, Obeng, and Rothschild (2016)のMechanical Turk調査の結果と比較して比較してください。
  4. [ 中データ収集コーディングが必要 ]多くの研究では、自己報告した携帯電話使用の測定値を使用しています。これは、研究者が自己報告行動と記録された行動を比較できる興味深い設定です( Boase and Ling (2013)参照)。尋ねる2つの一般的な行動は、呼び出しと文字送信であり、2つの共通の時間枠は「昨日」と「過去1週間」です。

    1. データを収集する前に、どの自己報告尺度の方がより正確だと思いますか?どうして?
    2. あなたの友人の5人をあなたのアンケートに招待してください。これらの5人の友人がどのようにサンプルされたかを簡単に要約してください。このサンプリング手順により、見積もりに特定の偏りが生じる可能性がありますか?
    3. マイクロサーベイに関する次の質問をしてください。
    • "あなたは昨日あなたの携帯電話を使って他の人に何回電話しましたか?"
    • "あなたは昨日何種類のテキストメッセージを送ったのですか?"
    • あなたの携帯電話を使って過去7日間に他の人に何回電話しましたか?
    • あなたの携帯電話を使って過去7日間にSMS / SMSを送受信した回数は何回ですか?
    1. このマイクロサーベイが完了したら、電話またはサービスプロバイダが記録した使用状況データを確認するように頼んでください。自己報告の使い方とログデータの比較最も正確なのはどちらですか?
    2. 収集したデータとクラス内の他の人のデータを結合します(クラスに対してこのアクティビティを実行している場合)。この大きなデータセットで、パート(d)を繰り返します。
  5. [ 中データ収集 ] Schuman and Presser (1996)は、問題の順序は2つのタイプの問題、すなわち2つの質問が同じレベルの特異性(例えば、2人の大統領候補者の評価)であるパー​​トパートの質問については問題であると主張する。 (例えば、あなたの仕事にどれくらい満足していますか?」、「あなたの人生にはどれくらい満足していますか?」など)を入力してください。

    彼らはさらに、次の2つのタイプの質問順序効果を特徴づける。一貫性効果は、後の質問への応答が、以前の質問に与えられたものに近い(そうでなければそうであろう)コントラスト効果は、2つの質問に対する応答の差が大きい場合に発生します。

    1. 大きな質問の順序効果があると思われるパート・パートの質問のペアを作成します。あなたが大規模な注文効果を持つと思う部分的な質問のペア。あなたの順序が重要ではないと考える一対の質問があります。あなたの質問をテストするために、Amazon Mechanical Turkの調査実験を実行してください。
    2. パーツパート効果の大きさはどれくらいですか?一貫性やコントラスト効果でしたか?
    3. 全体的な効果の大きさはどのくらい大きくできましたか?一貫性やコントラスト効果でしたか?
    4. 注文が問題ではないと思っていたあなたのペアに質問の順序効果がありましたか?
  6. [ 中データ収集 ] Schuman and Presserの研究に基づいて、 Moore (2002)は質問順序効果の別次元を述べている:加法効果と減法効果。コントラストと一貫性の影響は、回答者が相互に関連して2つの項目を評価した結果として生成されますが、回答者が質問が提起されるより大きな枠組みに対してより敏感になると、 Moore (2002)を読んだ後、MTurkの調査実験を設計して実行し、加減算効果を実証してください。

  7. [ ハードデータ収集 ] Christopher Antounと同僚(2015)は、4つの異なるオンライン求人サイト(MTurk、Craigslist、Google AdWords、Facebook)から入手した便利なサンプルを比較した調査を実施しました。簡単なアンケートを作成し、少なくとも2つの異なるオンライン求人情報源(これらの情報源はAntoun et al. (2015)使用されている4つの情報源とは異なる場合があります)を通じて参加者を募集します。

    1. 採用者1人当たりのコストを、さまざまな情報源間の金額と時間の点で比較します。
    2. 異なるソースから得られたサンプルの組成を比較する。
    3. サンプル間のデータの品質を比較する。回答者からのデータ品質を測定する方法については、 Schober et al. (2015)
    4. あなたの好みのソースは何ですか?どうして?
  8. [ 中 ]インターネットベースの市場調査会社YouGovは、2016年のEU国民投票(Brexit)の結果を予測するために、英国の約80万人の回答者を対象にオンライン投票を実施しました。

    YouGovの統計モデルの詳細については、https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/を参照してください。大まかに言えば、YouGovは投票者を2015年の総選挙投票の選択、年齢、資格、性別、面接日、および彼らが住んでいた選挙区に基づいて分類しました。第1に、YouGovパネリストから収集したデータを使用して、投票した人の中で、Leaveを投票しようとした各投票者タイプの人の割合を見積もりました。彼らは、選挙ロールからの投票率を検証した選挙後の対面調査である2015英国選挙研究(BES)を用いて各投票者の投票率を推定した。最後に、最新の国勢調査と年次人口調査(他のデータソースからの追加情報をもとに)に基づいて、有権者の各投票者タイプがどれくらいの人数であるかを推定しました。

    投票3日前、YouGovはLeaveの2点リードを示した。投票前夜、投票結果は電話には近すぎると示された(49/51 Remain)。最終的なオンデイ日の調査では、Remain(https://yougov.co.uk/news/2016/06/23/yougov-day-poll/)に有利な48/52が予測された。実際、この推定値は最終結果(52/48 Leave)を4%ポイント逸していました。

    1. この章で説明した全調査エラーフレームワークを使用して、何が間違っていたかを評価します。
    2. 選挙後のYouGovの反応(https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/)は次のように説明しています。「これは投票率が高いため、私たちは、このようなきめ細かなバランスの取れたレースの成果には、すべてのことが重要だと言いました。私たちの投票率モデルは、最後の総選挙で回答者が投票したかどうか、また総選挙を上回る投票率でモデルを混乱させたかどうかに一部基づいています。
  9. [ 中コーディングが必要 ]図3.2の表現エラーのそれぞれを説明するシミュレーションを作成します。

    1. これらのエラーが実際にキャンセルされる状況を作成します。
    2. エラーが相互に複合する状況を作ります。
  10. [ とても厳しいコーディングが必要 ] Blumenstockとその同僚(2015)の研究には、デジタルトレースデータを使用して調査回答を予測できる機械学習モデルを構築することが含まれていました。さて、別のデータセットで同じことを試してみましょう。 Kosinski, Stillwell, and Graepel (2013)は、Facebookの好みが個々の特性や属性を予測できることを発見しました。驚いたことに、これらの予測は、友人や同僚のものよりもさらに正確です(Youyou, Kosinski, and Stillwell 2015)

    1. Kosinski, Stillwell, and Graepel (2013)を読んでKosinski, Stillwell, and Graepel (2013)図2を複製してください。それらのデータはhttp://mypersonality.org/で入手できます
    2. さて、図3を複製してください。
    3. 最後に、自分のFacebookデータ(http://applymagicsauce.com/)でモデルを試してみましょう。どれくらいうまくいくのですか?
  11. [ 中 ] Toole et al. (2015) 、携帯電話からのコール・ディテール・レコード(CDR)を使用して、失業傾向全体を予測しました。

    1. Toole et al. (2015)研究設計を比較し、対照するToole et al. (2015)Blumenstock, Cadamuro, and On (2015)です。
    2. CDRが伝統的な調査に取って代わるべきか、補完するか、あるいは政府の政策立案者が失業率を追跡するために全く使われないと思いますか?どうして?
    3. CDRは失業率の伝統的な尺度に完全に置き換わることができるというあなたの証拠は何でしょうか?