3.3.1 Заступање

Представљање је о прављењу закључака из ваших саговорника у вашој циљној популацији.

Да бисмо разумели грешке које се могу догодити када се од стране испитаника изјасне на већу популацију, узмемо у обзир Анкета о књижевном дијалогу која је покушала предвидјети исход америчких предсједничких избора из 1936. године. Иако се то десило пре више од 75 година, ова дебакла и даље има важну лекцију за научнике данас.

Литерарни дијалог је био популаран часопис за општи интерес, а од 1920. године почели су да врше анкете из сламова како би предвидјели исход председничких избора. Да би направили ове предвиђања, послали би гласачке листе многим људима, а затим једноставно навели гласачке листе које су враћене; Литерарни Дигест је са поносом објавио да гласачки листићи које су добили нису ни "пондерисани, прилагођени нити тумачени". Овај поступак је тачно предвидио победнике избора 1920, 1924, 1928 и 1932. Године 1936. усред Велике депресије, књижевни Дигест је послала гласачке листиће на 10 милиона људи, чије су имена дошле претежно из телефонских именица и евиденције о регистрацији аутомобила. Ево како су описали њихову методологију:

"Машина глатког покрета ДИГЕСТ-а креће се са брзом прецизношћу од тридесетогодишњег искуства како би смањила нагађања на тешке чињенице ... Ове недеље 500 оловака су гребале више од четвртине милиона адреса дневно. Сваког дана, у великој просторији изнад четврте авеније у четвртој авенији, у Њујорку, 400 радника лукави су милион комада одштампаних материјала - довољно да пружи четрдесет блокова града - у адресиране коверте [сиц]. Сваки сат, у властитој поштанској постави ДИГЕСТ-а, три машине за мерење поштарине су запечатиле и потискивале беле облаке; вешти поштарских службеника су их пребацивали у испупчене поштанске пошиљке; флота ДИГЕСТ камиони су их спустили да експресују поштанске возове. . . Следеће недеље, први одговори из ових десет милиона почети ће доћи до плиме означених гласачких листића, да буду троструки, верификовани, пет пута унакрсно класификовани и укупно. Када је последња бројка обрисана и проверена, ако је раније искуство критеријум, земља ће у року од 1% процијенити стварно популарно гласање од четрдесет милиона [гласача]. "(22. август 1936.)

Фетишизирање величине Литерарног Дигеста је одмах препознато било којем истраживачу "великих података" данас. Од дистрибуираних 10 милиона гласачких листића враћено је невероватних 2,4 милиона - што је отприлике 1.000 пута веће од модерних политичких анкета. Од ових 2,4 милиона испитаника, пресуда је била јасна: Алф Ландон ће поразити актуелног Франклина Роосевелта. Али, заправо, Роосевелт је победио Ландона у клизању. Како би Литерарни дигест могао погрешити са толико података? Наше савремено разумевање узорковања чини грешке Литерарног Дигеста јасним и помаже нам да избјегнемо сличне грешке у будућности.

Јасно размишљање о узимању узорака захтева да размотримо четири различите групе људи (слика 3.2). Прва група је циљна популација ; ово је група коју истраживач дефинира као популацију од интереса. У случају Литерарног дијалога , циљна популација била је бирача на председничким изборима 1936. године.

Након одлучивања о циљној популацији, истраживач треба да развије списак људи који се могу користити за узимање узорака. Ова листа се зове оквир за узорковање, а људи на њему се зову популација рамова . Идеално, циљна популација и популација рамова би били потпуно исти, али у пракси то често није случај. На пример, у случају Литерарног дијалога , број становника био је 10 милиона људи чија су имена долазила претежно из телефонских именица и евиденције о регистрацији аутомобила. Разлике између циљне популације и популације кадрова се називају грешком покривања . Грешка покривања не само по себи гарантује проблеме. Међутим, то може довести до пристрасности покривености ако се људи у популацији кадрова системски разликују од људи у циљној популацији који нису у оквирима популације. Ово је, заправо, управо оно што се догодило у анкети Литерарног Дигеста . Људи у њиховој популацији су вероватније подржавали Алф Ландона, дијелом зато што су били богатији (подсетимо да су и телефони и аутомобили били релативно нови и скупи 1936. године). Дакле, у анкети Литерарног Дигеста грешка покривања довела је до пристрасности покривености.

Слика 3.2: Грешке репрезентације.

Слика 3.2: Грешке репрезентације.

Након дефинисања популације кадрова , следећи корак је да истраживач одабере популацију узорака ; ово су људи на које истраживач покуша да интервјуише. Ако узорак има различите карактеристике од популације оквира, онда узорковање може представити грешку узорковања . Међутим, у случају филатеља Литерари Дигест , заправо није било узорка - часописа да се контактира са свима у оквиру популације - и стога није било грешке узорковања. Многи истраживачи имају тенденцију да се усредсреде на грешку узорковања - то је типично једина врста грешке забележене у маргини грешке пријављене у истраживањима - али филозоф Литерарног Дигеста подсећа на то да треба узети у обзир све изворе грешака, и случајне и систематичне.

На крају, након избора популације узорака, истраживач покушава да интервјуише све своје чланове. Они који су успешно анкетирани се зову испитаници . У идеалном случају, популација узорака и испитаника биће потпуно исти, али у пракси нема одговора. То значи да људи који су одабрани у узорку понекад не учествују. Ако људи који се одазову разликују од оних који не реагују, онда може постојати пристрасност без одговора . Непризнавање пристрасности је био други главни проблем истраживања Литерарног Дигеста . Само 24% људи који су добили гласачки листић су одговорили, а испоставило се да су људи који су подржавали Ландона вјероватно одговорили.

Ангажовање истраживача Литерарног Дигеста , осим што је био пример за представљање идеја репрезентације, је често поновљена парабола, упозоравајући истраживаче о опасностима случајног узимања узорака. Нажалост, мислим да је лекција коју многи људи прикупе из ове приче погрешна. Најчешћи морални елемент приче је да истраживачи не могу научити ништа од узорака без вероватноће (тј. Узорака без строгих правила заснованих на вероватноћи за одабир учесника). Али, као што ћу касније показати у овом поглављу, то није сасвим исправно. Умјесто тога, мислим да постоје стварно два морала за ову причу; морале које су данас истините као што су биле 1936. године. Прво, велика количина прикупљених података без случајности неће гарантовати добру процјену. Уопштено гледано, имајући велики број испитаника смањује варијансе процена, али то не мора нужно смањити пристрасност. Са пуно података, истраживачи могу понекад добити тачну процјену погрешне ствари; они могу бити прецизни нетачни (McFarland and McFarland 2015) . Друга главна лекција филозофа Литерарног Дигеста је да истраживачи морају да објасне како је њихов узорак прикупљен приликом процењивања. Другим речима, пошто је процес узорковања у анкети Литерарног Дигеста био систематски скројен према неким испитаницима, истраживачи су морали да користе сложенији процес процене који је пондерисао неке испитанике више од других. Касније у овом поглављу, показаћу вам једну такву процедуру пондера - пост-стратификацију - која вам омогућава да направите боље процјене из случајних узорака.