3.3.1 Претставување

Застапеност е за правење на заклучоци од вашиот испитаниците на вашата целна популација.

Со цел да се разбере каков вид на грешки што може да се случи кога inferring од испитаниците на поголема популација, ајде да се разгледа сламка анкета на книжевна Уметност која се обиде да се предвиди исходот на американските претседателски избори во 1936 година. И покрај тоа што беше пред повеќе од 75 години, овој дебакл се уште има важна лекција да ги учат научници денес.

Литературни билтени беше популарен магазин општ интерес, а почнувајќи во 1920 година се почна да работи слама анкетите да се предвиди резултатите од претседателските избори. Да се направат овие предвидувања ќе испрати гласачките ливчиња за многу луѓе, и потоа да картонче до гласачките ливчиња, кои се вратени; книжевна Уметност гордо објави дека на гласачките ливчиња што ги добија беа ниту "бројат, дилеми, ниту пак да се протолкува." Оваа постапка точно предвиде победникот на изборите во 1920, 1924, 1928 и 1932 година во 1936 година, во екот на Големата депресија, книжевна Уметност испрати гласачките ливчиња до 10 милиони луѓе, чии имиња претежно се од телефонот директориуми и евиденцијата за регистрација на автомобилот. Еве како тие го опишаа нивната методологија:

"Непречено водење на машина се движи Уметност со брза прецизност од триесет години искуство за да се намали Нивни на факти. . . .Ова Недела 500 пенкала изгребани повеќе од една четвртина од еден милион адреси на ден. Секој ден, во една голема соба високо над моторни ribboned Четвртата авенија во Њујорк, 400 работници вешто слајд милиони парчиња на печатени материјали, доволно за да го отвори четириесет блокови-во обрати коверти [sic]. Секој час, во Уметност е Пошта трафостаница, три весело поштарина мерни машини запечатени и печат на Белата oblongs; квалификувани поштенски вработени им превртува во испакнати mailsacks; флота вари камиони грабаше да се изјаснат за пошта возови. . . Следната недела, првиот одговор од овие десет милиони евра ќе се започне со плимата на обележаните гласачки ливчиња, за да биде трипл-проверени, проверат, петкратната крос-класифицирани и изнесува. Кога последен бројка е totted и означено, доколку претходно искуство е критериум, земјата ќе се знае за во дел од 1 отсто вистинските гласовите на четириесет милиони [гласачите]. "(22 август 1936)

фетишизацијата на големината на снимки е веднаш препознатлив за секој истражувач "големи податоци" денес. На дистрибуирани 10 милиони гласачки ливчиња, неверојатни 2,4 милиони гласачки ливчиња беа вратени-тоа е околу 1.000 пати поголема од современите политички избори. Од овие 2,4 милиони испитаниците дека пресудата е јасна: книжевна Уметност предвиде дека предизвикувач Alf Landon требаше да го порази актуелниот претседател Френклин Рузвелт. Но, всушност, точно се случи спротивното. Рузвелт го победи Landon во лизгање на земјиштето. Како може книжевна Уметност одат во ред со толку многу податоци? Нашите модерни разбирање на земање примероци јасно грешки книжевна Уметност и ни помага да се избегне слични грешки во иднина.

Јасно да се размислува за земање примероци бара од нас да се разгледа четири различни групи на луѓе (Слика 3.1). Првата група на луѓе е целната популација; ова е група што истражувањето го дефинира како населението на интерес. Во случај на книжевна Уметност целната популација беше гласачи во 1936 година на претседателските избори. По донесување на одлука на целната популација, истражувач следната треба да се развие листа на луѓе кои може да се користи за земање на примероци. Оваа листа се нарекува рамка за примероци и населението на рамка за земање мостри се нарекува популација рамка. Во случај на книжевна Уметност население рамка беше 10 милиони луѓе чии имиња дојде претежно од телефонот директориуми и евиденцијата за регистрација на автомобилот. Идеално целната популација и население рамка ќе биде иста, но во пракса тоа е често не е случај. Разлики помеѓу целната популација и населението рамка се нарекуваат грешките во опфатот. Покриеност грешка не, само по себе гарантира проблеми. Но, ако луѓето на населението во рамки систематски се различни од луѓе кои не се во популацијата на рамка ќе има покриеност пристрасност. Грешките во опфатот беше првиот од главните недостатоци со истражувањето на книжевните билтени. Тие сакаа да дознаат повеќе за гласачите-тоа беше нивната целна популација, но тие се изградени рамка на примерокот претежно од телефонот директориуми и автомобилската регистри, извори кои повеќе застапени побогатите Американци кои се со поголема веројатност да се поддржи Alf Landon (потсетиме дека и двете од овие технологии, кои се заеднички и денес, се релативно нови во тоа време и дека САД се во средината на Големата депресија).

Слика 3.1: Грешките застапеност.

Слика 3.1: Грешките застапеност.

По дефинирањето население рамка, следниот чекор е за истражувачот да изберете населението на примерокот; овие се луѓето кои истражувачот ќе се обиде да разговара. Ако примерокот има различни карактеристики од населението во рамка, тогаш можеме да се воведе земање мостри грешка. Ова е вид на грешка измерени во маргина на грешка која обично ја придружува проценки. Во случај на фијаско книжевна Уметност, таму всушност не беше примерок; тие се обиделе да се виден на населението во рамка. Иако немаше земање мостри грешка, таму беше очигледно уште грешка. Ова појаснува дека на маргините на грешки, кои вообичаено се пријавени со проценките од истражувањата се обично погрешно мали; тие не ги опфаќаат сите извори на грешка.

Конечно, истражувач се обидува да ги интервјуира сите во населението на примерокот. Оние лица кои успешно се интервјуирани се нарекуваат испитаниците. Идеално, населението на примерокот и на испитаниците ќе биде иста, но во пракса не е позната одговор. Тоа е, луѓето кои се избрани во примерокот не сакаа да учествуваат. Ако луѓе кои одговараат се различни од оние кои не реагираат, тогаш не може да има пристрасност не-одговор. Пристрасност неодговор беше втор главен проблем со истражувањето на книжевните билтени. Само 24% од луѓето кои добиле гласање одговори, и се покажа дека луѓето кои го поддржуваа Landon се со поголема веројатност да се одговори.

Нешто повеќе од еден пример за воведување на идеи за застапување, изборите од книжевна Уметност е често повторуваните парабола, предупредувајќи истражувачи за опасностите од случаен земање мостри. За жал, мислам дека лекцијата дека многу луѓе се извлечат од оваа приказна е погрешен. Најчестите Поуката од оваа приказна е тоа што истражувачите не можат да научат нешто од не-веројатност примероци (т.е. примероци без строги правила веројатноста базирани за избор на учесници). Но, како што ќе се покаже подоцна во ова поглавје, тоа не е сосема во право. Наместо тоа, мислам дека има навистина две моралот на оваа приказна; моралот, кои се како вистински денес како што беа во 1936 година Прво, голема количина на несредено собраните податоци нема да гарантира добра проценка. Второ, истражувачите треба да дадат отчет за тоа како се собираат нивните податоци, кога тие се прават проценки од него. Со други зборови, бидејќи процесот на собирање на податоци во анкетата книжевна Уметност беше систематски насочено кон некои испитаници, истражувачите треба да се користи повеќе сложен процес проценка дека тежината на некои испитаници повеќе од другите. Подоцна во ова поглавје, јас ќе ви покаже една таква тежина постапката пост-стратификација, што може да ви овозможи да се направи подобри проценки со не-веројатност примероци.