3.3.1 Reprezentowanie

Reprezentacja jest o co wnioski od respondentów do populacji docelowej.

W celu zrozumienia tego rodzaju błędów, które mogą się zdarzyć, gdy wnioskowanie od respondentów do większej populacji, rozważmy straw poll Literary Digest, że starał się przewidzieć wynik wyborów prezydenckich w USA w 1936 roku. Mimo, że było ponad 75 lat temu, to klęska wciąż ma ważną lekcję do nauczania naukowców dziś.

Literary Digest był popularny magazyn ogólnego interesu, a od 1920 roku zaczęli uruchomiony słomy ankiet do przewidywania wyników wyborów prezydenckich. Aby te przewidywania wyślą głosowaniach wielu ludzi, a następnie po prostu zgadzają się te głosy, które zostały zwrócone; Literary Digest dumą poinformował, że karty do głosowania są odbierane były ani "ważony, regulowana, ani interpretować." Ta procedura poprawnie przewidzieć zwycięzcę wyborów w roku 1920, 1924, 1928 i 1932. w 1936 roku, w samym środku Wielkiego Kryzysu, Literary Digest wysłał głosowaniach 10 milionów ludzi, których nazwiska przeważnie pochodziły z książek telefonicznych i zapisów rejestracyjnych samochodów. Oto jak to opisano metodologię:

"Smooth-uruchomiona maszyna porusza Trawienie jest z szybkim precyzją trzydzieści lat doświadczenia w celu zmniejszenia zgadywanie do twardych faktów. , , .To Tygodniu 500 długopisy podrapał się ponad ćwierć miliona adresów dziennie. Każdego dnia, w wielkiej sali wysoko nad silnikiem ribboned Fourth Avenue w Nowym Jorku, 400 pracowników zręcznie wsunąć milion kawałków druki-wystarczająco, aby utorować czterdzieści miejskie bloki-adresowanych do kopert [sic!]. Każda godzina, w Digest własnych Poczty podstacji trzy szczękając dozowarki znaczek zamknięte i opieczętowane białe prostokąty; wykwalifikowanych pracowników pocztowych odwrócenie ich do wybrzuszenia mailsacks; ciężarowe floty Digest pędził im kurierską-pociągów. , , W przyszłym tygodniu, pierwsze odpowiedzi z tych dziesięciu milionów rozpocznie przypływu oznakowanych głosowaniach, być potrójnie sprawdzone, zweryfikowane, pięć razy cross-niejawnych i wyniosły. Gdy ostatnia figura została totted i sprawdzane, jeśli dotychczasowe doświadczenie jest kryterium, kraj będzie wiedzieć, aby w ułamku 1 procent rzeczywisty głosowaniu powszechnym czterdziestu milionów wyborców []. "(22 sierpnia 1936)

fetyszyzacja Trawienie w wielkości jest rozpoznawalny do dowolnego "big data" badacza dziś. Spośród 10 milionów głosowania rozprowadzane po fantastycznym 2,4 mln głosowania zostały zwrócone, to w przybliżeniu 1000 razy większe niż w nowoczesnych sondaży politycznych. Z tych 2,4 miliona respondentów werdykt był jasny: Literary Digest przewidział, że challenger Alf Landon szło pokonać urzędującego Franklina Roosevelta. Ale w rzeczywistości, dokładne przeciwieństwo stało. Roosevelt pokonał Landon w osuwisko. Jak Literary Digest mógłby pomylić z tyle danych? Nasze nowoczesne rozumienie próbkowania powoduje błędy Literackiego Digest za jasne i pomaga nam uniknąć podobnych błędów w przyszłości.

Jasno myśleć o pobieraniu próbek wymaga nas do rozważenia cztery różne grupy ludzi (rysunek 3.1). Pierwsza grupa ludzi jest populacja docelowa; jest to grupa, która badanie określa jako populacji. W przypadku Literary Digest populacja docelowa była wyborcy w wyborach prezydenckich w 1936 roku. Po podjęciu decyzji na populację docelową, badacz następna musi opracować listę osób, które mogą być wykorzystywane do pobierania próbek. Lista ta nazywana jest operat a ludność na operatu nazywa ludność ramki. W przypadku Literary Digest populacja ramki było 10 milionów ludzi, których nazwiska przyszedł głównie z książek telefonicznych i zapisów rejestracyjnych samochodów. Idealnie populacja docelowa i populacja ramki byłoby dokładnie takie same, ale w praktyce jest to często nie jest. Różnice między populacji docelowej populacji i ramki są nazywane błąd pokrycia. Błąd Coverage nie, sama zagwarantować problemy. Ale jeśli ludzie w populacji ramki są systematycznie nie różnią się od ludzi w populacji ramka nie będzie zasięg nastawienie. Błąd zasięg był pierwszym z głównych wad z sondażu Literary Digest. Chcieli dowiedzieć się o wyborców-to był ich cel populacji, ale skonstruował operatu głównie z książek telefonicznych i rejestrów samochodowych, źródeł, które nadmiernie reprezentowane bogatsi Amerykanie, którzy byli bardziej skłonni do wspierania Alf Landon (przypomnijmy, że obie te technologie, które są dziś powszechne, były stosunkowo nowy w tym czasie i że Stany Zjednoczone były w samym środku Wielkiego Kryzysu).

Rysunek 3.1: błędy reprezentacji.

Rysunek 3.1: błędy reprezentacji.

Po zdefiniowaniu populacji ramki, następnym krokiem jest dla badacza, aby wybrać badanej populacji; Są to osoby, które badacz dokładają wszelkich starań, aby przeprowadzić wywiad. Jeśli próbka ma inne cechy niż populacja ramki, to możemy wprowadzić błąd próbkowania. Jest to rodzaj błędu ilościowo w granicach błędów, które zwykle towarzyszy szacunki. W przypadku fiaska Literary Digest, tam faktycznie było próbka; próbowali skontaktować wszystkim w populacji ramki. Mimo, że nie było żadnego błędu losowego, nie było oczywiście nadal błąd. To wyjaśnia, że ​​marginesy błędów, które są zwykle zgłaszane z szacunkami z badań są zwykle zwodniczo małe; nie obejmują one wszystkie źródła błędu.

Wreszcie, badacz próbuje przesłuchać wszystkich w badanej populacji. Te osoby, które są z powodzeniem pytani są nazywane respondentów. Idealnie, populacja próbki i respondenci będą dokładnie takie same, ale w praktyce nie jest brak odpowiedzi. Oznacza to, że osoby, które zostały wybrane do próby odmówić udziału. Jeśli ludzie, którzy odpowiadają różnią się od tych, którzy nie reagują, to nie może być nastawienie brak odpowiedzi. Odchylenie brak odpowiedzi był drugim głównym problemem z sondażu Literary Digest. odpowiedział tylko 24% ludzi, którzy otrzymali karty do głosowania, a okazało się, że ludzie, którzy popierali Landon były bardziej skłonne do reagowania.

Poza prostu przykładem wprowadzenia idei reprezentacji, plebiscyt Literary Digest jest często powtarzany przypowieść, przestrzegając naukowców o szkodliwości przypadkowy próbkowania. Niestety, myślę, że lekcja, że ​​wielu ludzi wyciągnąć z tej historii jest błędna. Najczęstszym Morał z tej historii jest to, że naukowcy nie mogą nauczyć się czegoś od próbek bez prawdopodobieństwa (tj próbek bez ścisłych reguł prawdopodobieństwa opartego na wyłonienie uczestników). Ale, jak pokażę w dalszej części tego rozdziału, to nie do końca prawda. Zamiast tego, myślę, że są naprawdę dwa morały tej historii; moralności, które są równie prawdziwe dzisiaj, jak były w 1936. Po pierwsze, duża ilość przypadkowo zebranych danych nie gwarantuje dobrą ocenę. Po drugie, naukowcy muszą wyjaśnić, jak ich dane zebrano podczas ich dokonywania szacunków od niego. Innymi słowy, ponieważ proces zbierania danych w ankiecie Literary Digest systematycznie przekrzywiony w stronę niektórych respondentów, badacze muszą użyć bardziej złożony proces szacowania, że niektórzy respondenci waży więcej niż inni. W dalszej części tego rozdziału, pokażę ci jedno takie ważenie Procedura post-stratyfikacji-które pozwalają podejmować lepsze szacunki z próbkami bez prawdopodobieństwa.