3.3.1 Представителство

Този превод е създаден от компютър. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

3.3.1 Представителство

Представителството е за правенето на изводи от вашите респонденти да си целеви групи от населението.

За да се разбере вида на грешки, които могат да се случат, когато се изведе от отговорилите на въпросите по-голямо население, нека разгледаме слама анкета на литературен преглед, който се опита да предвиди изхода от САЩ президентските избори през 1936. Въпреки, че това е било преди повече от 75 години, този провал все още има важна поука, за да научи изследователи днес.

Литературен преглед беше популярното списание общ интерес, и като се започне през 1920 г. те започнаха течаща слама анкети, за да се предскаже на резултатите от президентските избори. За да направите тези прогнози, че ще изпрати бюлетини за партиди за хората, и след това просто да съвпадат с бюлетините, които са били върнати; Литературен преглед гордо съобщава, че бюлетините са получили нито са били "претеглени, коригирана, нито тълкува." Тази процедура правилно прогнозира победителя на изборите през 1920 г., 1924 г., 1928 г. и 1932 г. през 1936 г., в разгара на Голямата депресия, литературен преглед изпрати бюлетини до 10 милиона души, чиито имена предимно дойде от телефонни указатели и записи за регистрация на превозното средство. Ето как те описват тяхната методология:

"Гладки-работещата машина ходове превареният с бързото прецизността на тридесет години опит за намаляване на догадки да твърди факти. , , .Тази Седмица 500 писалки надраскани повече от една четвърт от един милион адреси на ден. Всеки ден, в едно голямо помещение високо над моторно-украсен с ленти Четвърто авеню в Ню Йорк, 400 работници ловко се плъзгат един милион парчета на печатни материали-достатъчно, за да проправи четиридесет градски блокове-в адресирани пликовете [така]. Всеки час, в усвояването е собствената Post Office подстанция, три трака пощенски измервателни машини запечатани и подпечатани белите oblongs; квалифицирани служители в пощите ги обърнат в издут mailsacks; флота Digest камиони СПЕД тях да изразят поща влакове. , , Следващата седмица, първите отговори от тези десет милиона ще започнат предстоящите сезон на маркираните бюлетини, за да бъдат тройни проверка, проверено, пет пъти кръстосано класифицирана и възлиза. Когато последната цифра е totted и проверени, ако минал опит е критерий, че страната ще знаем с точност до една малка част от 1 на сто от действителните народния вот на четиридесет милиона [избирателите]. "(22 август, 1936)

fetishization на размера на преглед е лесен за разпознаване на всеки изследовател "голям данни" днес. От разпределени 10 милиона бюлетини, невероятните 2,4 милиона бюлетини бяха върнати-това е грубо 1000 пъти по-големи, отколкото съвременните политически анкети. От тези 2,4 милиона респонденти присъдата беше ясно: Литературен преглед прогнозира, че претендент Алф Ландън щеше да победи действащия Франклин Рузвелт. Но, в действителност, точно обратното се случи. Рузвелт победен Ландън в свлачище. Как може Литературен преглед да се обърка с толкова много данни? Нашата модерна разбиране за вземане на проби става ясно грешки Литературен преглед и ни помага да се избегне вземане на подобни грешки в бъдеще.

Мислейки ясно за вземане на проби изисква от нас да помисли за четири различни групи от хора (Фигура 3.1). Първата група от хора е целевата група; това е групата, която изследването определя като населението на интереси. В случай на литературен преглед на целевата популация беше гласоподавателите в 1936 президентските избори. След вземането на решение за целево население, изследовател следващия трябва да разработи списък на хората, които могат да се използват за вземане на проби. Този списък се нарича рамка за вземане на проби и населението на рамката за вземане на проби се нарича населението на рамката. В случай на Литературен преглед населението на рамката е на 10 милиона души, чиито имена дойде предимно от телефонни указатели и записи за регистрация на превозното средство. В идеалния случай целевото население и населението в кадър ще бъдат едни и същи, но на практика това е често не е така. Разлики между целевото население и населението рамка се наричат покритие грешка. Покритие грешка не, само по себе си гарантира проблеми. Но, ако хората в населението на рамката са систематично различни от хора, които не са в населението на рамката ще има покритие пристрастия. Покритие грешка е първият от най-големите недостатъци с анкетата на Литературен преглед. Те искаха да научат повече за избирателите-, че е тяхната целева популация-но те изработена рамка за вземане на проби предимно от телефонни указатели и автомобилни регистри, източници, че много по-често по-богати американци, които са по-склонни да подкрепят Алф Ландън (припомни, че и двете от тези технологии, които са общи днес, са сравнително нов в момента и, че САЩ е в разгара на Голямата депресия).

Фигура 3.1: грешки представителство.

След определяне на населението на рамката, следващата стъпка е за един изследовател, за да изберете населението на пробата; това са хората, че изследователят ще се опитват да интервюират. Ако пробата има различни характеристики от населението на рамка, тогава можем да се въведе грешка за вземане на проби. Това е вид на грешка количествено в границите на грешката, която обикновено съпътства оценки. В случай на фиаското на литературен преглед, там действително е имало проба; те се опитали да се свържете с всички в населението на рамката. Въпреки, че не е имало грешка за вземане на проби, не е очевидно все още грешка. Това изяснява, че границите на грешки, които обикновено са докладвани с оценки от проучвания обикновено са подвеждащо малки; те не включват всички източници на грешка.

Накрая, изследовател опитва да интервюира всички в населението на пробата. Тези хора, които са успешно интервюирани се наричат респонденти. В идеалния случай, населението на пробата и на респондентите биха са точно същите, но на практика има липса на отговор. Това означава, че хората, които са избрани в извадката, отказват да участват. Ако хората, които реагират, са различни от тези, които не се повлияват, тогава може да има пристрастия липса на отговор. Пристрастия Non-отговор е вторият основен проблем с анкетата на Литературен преглед. Само 24% от хората, които са получили бюлетина отговори, и се оказа, че хората, които подкрепиха Ландън са по-склонни да реагират.

Отвъд просто е пример за въвеждане на идеите на представителство, анкетата на Литературен преглед е често повтаряно притча, предупреждавайки изследователи за опасностите от случаен вземане на проби. За съжаление, мисля, че урокът, че много хора черпят от тази история е погрешно. Най-честата Поуката от историята е, че изследователите не могат да научат нещо от не-случайни извадки (т.е. проби без строги правила вероятностни-базирани за подбора на участници). Но, както ще покажем по-късно в тази глава, това не е съвсем така. Вместо това, аз мисля, че има наистина две морал към тази история; морал, които са толкова вярно днес, както са били през 1936 г. Първо, голяма част от случайно събрани данни няма да гарантира добра оценка. Второ, изследователите трябва да се отчете как се събира данните им, когато те правят оценки от него. С други думи, тъй като процесът на събиране на данни в анкетата на Литературен преглед е систематично изкривено към някои респонденти, изследователите трябва да се използва по-сложен процес, оценка, че тежи някои интервюирани повече от другите. По-късно в тази глава, аз ще ви покажа един такъв претегляне процедура-пост-стратификация-, че може да ви даде възможност да се направи по-добри оценки с не-случайни извадки.