3.4 кој да прашам

Веројатност примероци и не-веројатност примероци не се толку различни во пракса; Во двата случаи, тоа е за сите на тегови.

Земање мостри се од фундаментално значење за истражувањето истражување. Истражувачите речиси никогаш не се поставуваат прашања за сите во нивната целна популација. Во овој поглед, истражувања не се единствени. Повеќето истражувања, во еден или друг начин, вклучува земање мостри. Понекогаш овој пример е направено експлицитно од страна на истражувач; други времиња, тоа се случува имплицитно. На пример, истражувач кој раководи со лабораториски експеримент на студентите на додипломски студии во нејзиниот универзитет, исто така зема примерок. Така, земање мостри е проблем кој доаѓа во текот на оваа книга. Всушност, една од најчестите проблеми што ги слушам за дигиталната ера извори на податоци е ", тие не се репрезентативни." Како што ќе видиме во овој дел, оваа загриженост е и помалку сериозни и посуптилно од многу скептици се реализира. Всушност, јас ќе тврдат дека целиот концепт на "репрезентативност" не е корисно за размислување за веројатност и не-веројатност примероци. Наместо тоа, клучот е да се размислува за тоа како се собираат податоците и како било предрасуди во кој собирање на податоци може да се врати назад, кога се вршат проценки.

Во моментов, доминантен теоретски пристап кон застапеност е теоријата на веројатност. Кога податоците се прибираат со метод на теоријата на веројатност, која е совршено погубен, истражувачите можат да нивната тежина податоци врз основа на начинот на кој тие се собираат за да се направи непристрасни проценки за целната популација. Сепак, добра веројатноста за земање мостри во основа никогаш не се случува во реалниот свет. Постојат обично два главни проблеми 1) разлики помеѓу целната популација и населението рамката и 2) не-одговор (токму тоа се проблемите со кои се уништени книжевната Уметност анкетата). Така, наместо да размислува за теоријата на веројатност како реален модел на она што всушност се случува во светот, тоа е подобро да се мисли на теоријата на веројатност како корисен, апстрактен модел, сличен на оној кога физичарите се размислува за триење топката тркалање по бескрајно долго рампата.

Алтернативата на теоријата на веројатност е не-теоријата на веројатност. Главната разлика помеѓу веројатноста и не-теоријата на веројатност е дека со теоријата на веројатност сите од населението има позната веројатност за вклучување. Постојат, всушност, многу видови на не-теоријата на веројатност, и овие методи на прибирање на податоците стануваат се повеќе заеднички во дигиталната ера. Но, не, теоријата на веројатност има страшно репутација меѓу социјалните научниците и статистичари. Всушност, не-теоријата на веројатност е поврзан со некои од најдраматичните неуспеси на истражувачи истражувањето, како што фијаско книжевна Уметност (дискутирано и порано) и неточни предвидувања за претседателските избори во САД од 1948 година ( "Дјуи порази Труман") (Mosteller 1949; Bean 1950; Freedman, Pisani, and Purves 2007) .

Сепак, сега е вистинското време да се преиспита не-теоријата на веројатност од две причини. Прво, како што веројатноста примероци се повеќе и повеќе тешко да се направи во пракса, на линијата помеѓу веројатноста примероци и не-веројатност примероци се замаглување. Кога има висока стапка на не-одговор (како што постојат во реалниот истражувања сега), вистинската веројатност на подмножества за испитаниците не се познати, а со тоа и веројатноста примероци и не-веројатност примероци не се различни како многу истражувачи веруваат. Всушност, како што ќе видиме подолу, и двата пристапи во основа се потпира на истиот метод проценка: пост-стратификација. Второ, има многу случувања во собирање и анализа на не-веројатност примероци. Овие методи се доволно различни од методите што предизвика проблеми во минатото, кои мислам дека има смисла да се размислува за нив како "не-теоријата на веројатност 2.0." Ние не треба да има еден ирационален аверзија кон не-веројатност методи, бидејќи на грешки кои се случија пред многу време.

Понатаму, со цел да се направи овој аргумент поконкретни, јас ќе ги видиш стандард теоријата на веројатност и тежина (Дел 3.4.1). Клучот Идејата е како да се собираат вашите податоци треба да влијаат на тоа како да се направи проценки. Особено, ако сите не ги имаат истите веројатноста за вклучување, тогаш сите треба да имаат иста тежина. Со други зборови, ако вашиот земање мостри не е демократски, а потоа вашите проценки не треба да бидат демократски. По разгледување на тежина, јас ќе се опише два пристапи за не-теоријата на веројатност: оној кој се фокусира на тежина да се справи со проблемот на несредено собраните податоци (Дел 3.4.2), и оној што се обидува да го стави повеќе контрола врз тоа како податоците се собираат (Дел 3.4.3). Аргументите во главниот текст ќе бидат објаснети подолу со зборови и слики; читателите кои би сакале повеќе математички третман да го видиме и технички додаток.