3.4.2非確率サンプル：重み付け

この翻訳は、コンピュータによって作成されました。 ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

3.4.2非確率サンプル：重み付け

非確率サンプルを用いて、重みが想定サンプリング処理に起因する歪みを元に戻すことができます。

研究者は、確率サンプルからの応答を重み付けするのと同じように、それらはまた、非確率サンプルからの応答を重み付けすることができます。たとえば、CPSの代替として、あなたが失業率を推定するための調査のための参加者を募集するためにウェブサイトの何千ものバナー広告を置いていることを想像してみてください。当然、あなたはあなたのサンプルの単純平均では失業率の良好な推定値であることを懐疑的になります。あなたは何人かの人々は他よりもあなたの調査を完了する可能性が高いと思いますので、あなたの懐疑論は、おそらくです。たとえば、ウェブ上で多くの時間を費やすことはありません人々があなたの調査を完了する可能性が低いです。

我々は最後のセクションで見たように、しかし、我々は知っている場合はサンプルが選択されたとしてされたどのように我々は確率で行うサンプル-、我々はサンプリング処理に起因する歪みを元に戻すことができます。非確率サンプルで作業する場合残念ながら、私たちはサンプルを選択したのか分かりません。しかし、我々は、サンプリング処理についての仮定をし、その後、同じように重み付けを適用することができます。これらの仮定が正しい場合、重み付けは、サンプリングプロセスによって引き起こされる歪みを元に戻します。

たとえば、あなたのバナー広告に応答して、あなたが100,000回答者を募集していることを想像してみてください。ただし、これらの10万回答者が米国成人の単純無作為サンプルであることを信じていません。あなたは米国の人口にあなたの回答を比較したときに実際には、あなたはいくつかの状態（例えば、ニューヨーク）からの人々は、いくつかの状態（例えば、アラスカ州）からオーバー表現され、その人があるの下で、表現されていることがわかります。このように、あなたのサンプルの失業率は、標的集団における失業率の悪い推定値である可能性が高いです。

サンプリングプロセスで起こった歪みを元に戻すための一つの方法は、人それぞれに重みを割り当てることです。試料（例えば、アラスカ州）に過小表現されている状態から、人々に（例えば、ニューヨーク）サンプルおよびより高い重みで過剰表現されている状態から人々に低い重み。具体的には、各回答の重みは、米国の人口での有病率にあなたのサンプルの相対的にその有病率に関連しています。この重み付け手順はポスト層化と呼ばれ、計量の考え方は、ロードアイランド州からの回答は、カリフォルニアからの回答よりも小さい重みを与えられたセクション3.4.1に例を思い出させる必要があります。ポスト成層では、グループにあなたの回答を入れて、各グループ内の標的集団の割合を知ることが十分に知っている必要があります。

確率サンプルの非確率サンプルの重みは（技術的な付録を参照してください）、数学的に同じであるが、それらは異なる状況でうまく機能します。研究者は、完璧な確率サンプル（すなわち、無カバレッジエラーなし非応答）を持っている場合は、重み付けは、全ての場合において、すべての形質の公平な推定値を生成します。確率サンプルの支持者は彼らがそのように魅力を感じるのはこの強力な理論的保証があります。応答性向は、各グループの全員に対して同じである一方、非確率サンプルを重み付けするだけで、すべての形質について、公正な推定値を生成します。言い換えれば、ニューヨークの誰もが参加し、アラスカの誰もがそうに参加し、同じ確率を持っているのと同じ確率を持っている場合は公平な推定値を生成しますポスト成層を使用して、私達の例に戻って考えて。この仮定は、 均質な応答-性向-内のグループの仮定と呼ばれ、後の成層は、非確率サンプルとうまくいくかどうかは知ることに重要な役割を果たしています。

残念ながら、私たちの例では、均質な応答-性向-内のグループ仮定が真である可能性が低いと思われます。つまり、アラスカの誰もがあなたの調査であることの同じ確率を持っているとは考えにくいです。しかし、それはより有望に見えるようにこれらのすべてはポスト成層について心に留めておくべき3つの重要なポイントがあります。

まず、均質な応答-性向-内のグループの仮定は、グループの数が増加するにつれて、よりもっともらしいとなります。そして、研究者は、単に1つの地理的なディメンションに基づいてグループに限定されるものではありません。例えば、我々は状態、年齢、性別、教育のレベルに基づいてグループを作成することができます。これは、18から29のグループ内で均質な応答傾向があることがよりもっともらしいようで、アラスカに住むすべての人々のグループ内よりもアラスカに住んでいる女性、大卒。したがって、ポスト層化増加のために使用されるグループの数として、仮定は、それがより合理的になってサポートするために必要。この事実を考えると、研究者がポスト層化のためのグループの膨大な数を作成したいと思うように思えます。データスパース：しかし、グループ数の増加に伴って、研究者らは、別の問題に遭遇します。人々のほんの数は、各グループに存在する場合、推定値はより不確実になり、何の回答を持っていないグループがある極端な場合には、その後のポスト成層が完全に分解します。 homogeneous-応答性向-内のグループの仮定の妥当性と各グループの合理的なサンプルサイズの需要との間のこの固有の緊張のうち二つの方法があります。一つのアプローチは、重みを計算するためのより高度な統計モデルに移行することであり、他方は、各グループの合理的なサンプルサイズを確保することができます大きく、より多様なサンプルを収集することです。私は、以下でより詳細に説明しますようにと、時には研究者が、両方を行います。

非確率サンプルから後層別での作業第二の検討事項は、確率のサンプルを分析する際に均一な応答-傾向-内のグループ仮定が既に頻繁に行われていることです。この仮定は、実際には、確率のサンプルのために必要とされる理由は、確率サンプルが非応答を有することで、上述したような非応答を調節するための最も一般的な方法は、後の成層です。もちろん、多くの研究者は、特定の仮定はあなたもそれを行う必要があることを意味するものではありません作るという理由だけで。しかし、それは実際には確率サンプルに非確率サンプルを比較した場合、我々は両方の推定値を生成するために、仮定および補助情報に依存していることを心に留めておく必要があることを意味します。最も現実的な設定では、推論への仮定のないアプローチは、単に存在しません。

あなたが失業率、そして、私たちの例では、特に、中1の推定値を心配している場合最後に、あなたは、均質な応答-傾向-内のグループの仮定よりも弱い条件を必要としています。具体的には、あなたは誰もが同じ応答性向を持っていることを前提とする必要はありません、あなただけの各グループ内の応答の傾向と失業率の間に相関がないことを前提とする必要があります。もちろん、これでも弱い条件はいくつかの状況で保持されません。例えば、ボランティア活動を行うアメリカ人の割合を推定想像してみてください。ボランティア活動を行う人々が調査であることに同意する可能性が高い場合には、研究者がすることによって経験的に実証されているボランティア、彼らは後層別調整を行う場合であっても、結果の量推定オーバーします系統的Abraham, Helms, and Presser (2009)

私が先に言ったように、非確率サンプルがあるため、調査研究の初期の時代の中で最も厄介な障害の一部におけるその役割の一部には、社会科学者によって大きな懐疑的に見ています。我々は非確率サンプルが付属しているどのくらいの明確な例は正しくアメリカのXboxのユーザーの非確率サンプルを使用して、2012年の米国の選挙の結果を回復魏王、デビッド・ロスチャイルド、シャラドGoelさん、そしてアンドリュー・ゲルマンの研究でありますアメリカ人の-a明らかに非ランダムサンプル(Wang et al. 2015)研究者は、Xboxのゲームシステムからの回答を募集し、ご想像のとおり、Xboxのサンプルは男性とスキュー若者を歪め：18から29歳は、有権者の19％が、Xboxのサンプルの65％を構成し、男性が47％を占めます有権者とXboxサンプル（図3.4）の93％の。そのため、これらの強力な人口統計的バイアスの、生のXboxのデータは、選挙結果の悪い指標でした。これは、バラク・オバマオーバーミット・ロムニーのための強力な勝利を予測しました。繰り返しますが、これは生の、未調整の非確率サンプルの危険性の別の例であり、 文学ダイジェスト失態を彷彿とさせます。

図3.4：Wangらの回答者の人口統計。（2015年）。回答者は、通Xboxから募集されたので、彼らは2012年の選挙で有権者に比べ、若い男性である可能性が高いことが多かったです。

図3.4：の回答者の人口統計Wang et al. (2015) 。回答者は、通Xboxから募集されたので、彼らは2012年の選挙で有権者に比べ、若い男性である可能性が高いことが多かったです。

しかし、王らは、これらの問題を知っていたし、サンプリング処理を補正するために回答を重み付けすることを試みました。特に、それらは私があなたに言った後成層のより洗練されたフォームを使用しました。それは後の成層についての直感を構築するためのアプローチについてもう少し学習の価値がある、と使用される特定のバージョン王らは、重み付け非確率サンプルに最もエキサイティングなアプローチの一つです。

3.4.1項で失業率の推定についての私達の簡単な例では、住居の状態に基づいてグループに人口を分割しました。これとは対照的に、王とその同僚は、によって定義された176256グループに人口に分け：性別（2種類）、レース（4種類）、年齢（4種類）、教育（4種類）、状態（51種類）、パーティのID（3カテゴリ）、イデオロギー（3種類）と2008票（3種類）。複数の基で、研究者は、各グループ内で、応答傾向がオバマ氏をサポートする無相関であったことをますます可能性が高いことを望みました。次に、むしろ私たちは私たちの例で行ったように、個々のレベルの重みを構築するよりも、王とその同僚は、オバマ氏に投票することになる各グループの人々の割合を推定するために複雑なモデルを使用していました。最後に、彼らは支援の推定全体的なレベルを生成するために、各グループの既知のサイズとサポートのこれらのグループの見積もりを組み合わせます。言い換えれば、それらは、異なるグループに集団をみじん切り各グループのObamaのためのサポートを推定し、その後全体の推定値を生成するために、グループ推定値の加重平均を取りました。

このように、彼らのアプローチでの大きな課題は、これらの176256グループのそれぞれにオバマ氏のサポートを推定することです。そのパネルは345858ユニークな参加者が含まれていますが、選挙ポーリングの基準では膨大な数には、王とその同僚は、ほとんどの回答者が持っていたために多くの、多くのグループがありました。したがって、彼らは多くの研究者が愛情を込めて、特定のグループ内でオバマ氏のサポートを推定するために、基本的に氏P.を呼び出すポスト成層とマルチレベル回帰と呼ばれる技術、氏P.プール情報を使用し、各グループ内でのサポートを推定します密接に関連したグループ。たとえば、誰穏健派として自己識別民主党登録されている大学の卒業生は、であり、この2008年にオバマ氏に投票した人、18-29歳の間に、女性のヒスパニック系の間でオバマ氏のサポートを推定するという課題を考えます非常に、非常に特定のグループであり、これらの特徴を有する試料中の誰もが存在しないことが可能です。したがって、このグループの見積りを行うために、氏P.プールは一緒に非常によく似たグループの人々から推定します。

この分析戦略を使用して、王とその同僚は、非常に密接にオバマ氏が2012年選挙（図3.5）で受信した総合的な支援を推定するためのXbox非確率サンプルを使用することができました。実際には、それらの推定値は、世論調査の集計よりも正確でした。したがって、この場合には、重み付け特異氏は非確率データに偏りを補正する良い仕事をするために、Pは、と思われます。あなたは未調整Xboxのデータから推計を見たときに表示されるバイアス。

図3.5：王らから推計。（2015年）。未調整のXboxサンプルは不正確な推定値を生成しました。しかし、重み付けされたXboxのサンプルは、確率ベースの電話調査の平均値よりも正確だった推定値を生成しました。

図3.5：からの見積もりWang et al. (2015) 。未調整のXboxサンプルは不正確な推定値を生成しました。しかし、重み付けされたXboxのサンプルは、確率ベースの電話調査の平均値よりも正確だった推定値を生成しました。

王とその同僚の研究から、二つの主な教訓があります。まず、未調整の非確率サンプルが悪い見積りにつながることができます。これは、多くの研究者が前に聞いたことが教訓です。しかし、第2の教訓は、非確率サンプルということで、適切に重み付けしたときに、実際には非常に良好な推定値を生成することができます。実際には、彼らの推定値は、より伝統的な選挙世論調査の集計pollster.comからの推定値よりも正確でした。

最後に、私たちはこの1特定の研究から学ぶことができるものに重要な制限があります。ポスト成層は、この特定のケースではうまくいったからといって、それが他のケースでうまく動作するという保証はありません。世論調査は、ほぼ100年のための選挙を勉強し、定期的なフィードバックがある（私たちが選挙に勝つ誰が見ることができる）、および当事者の識別と人口統計学的特性は、投票の比較的予測しているされているため、実際には、選挙は、おそらく最も簡単な設定の一つです。この時点で、我々は非確率サンプルに重み付け調整が十分に正確な推定値を生成する時期を知るために固体理論と実証的な経験を欠いています。明確であることの一つは、しかし、あなたは非確率サンプルで動作するように強制されている場合には、調整後の推定値が非調整の推定値よりも良くなると信じる強い理由があります。