3.3.1 Framsetning

Framsetning er um að gera ályktanir frá svarenda þínum til markhópnum þínum.

Til þess að skilja hvers konar villur sem getur gerst þegar inferring frá svarenda í stærri íbúa, við skulum íhuga Literary Digest strá skoðanakönnun sem reyndi að spá fyrir um niðurstöðu 1936 US Presidential kosningum. Þó að það var meira en 75 árum síðan, þetta debacle hefur enn mikilvægu lexíu að kenna vísindamenn dag.

Literary Digest var vinsæll almennra vaxta tímarit, og hefst árið 1920 tóku þeir að keyra hey kannanir til að spá fyrir um niðurstöður forsetakosninga. Til að gera þessar spár og þeir myndu senda kjörseðla til fullt af fólki, og þá einfaldlega stemma upp seðlana sem voru aftur; Literary Digest greint stolti að kjörseðla þeir fengu voru hvorki "vegin, leiðrétt, né túlka." Þessi aðferð spáð rétt sigurvegari kosninga í 1920, 1924, 1928 og 1932. árið 1936, í miðri kreppunni miklu, Literary Digest sendi út kjörseðla til 10 milljónir manna, sem nöfn aðallega kom frá framkvæmdarstjóra síma og bifreið skráning gagna. Hér er hvernig þeir lýst aðferðafræði þeirra:

"Niðurbrotið er slétt gangi vél færist með skjótri nákvæmni reynslu þrjátíu ára til að draga úr giska á hörðum staðreyndum. . . .Þetta Viku 500 pennar klóra út meira en fjórðungur af milljón heimilisföng á dag. Á hverjum degi, í miklu herbergi hátt yfir mótor-ribboned Fourth Avenue, í New York, 400 starfsmenn fimur renna milljón stykki af prentuðu máli, nóg að ryðja fjörutíu borg blokkir-inn á beint umslögum [sic]. Á klukkutíma fresti, á eigin Niðurbrotið'S Post Office aðveitustöð, þrír mannfýla burðargjald metering vélar innsigluð og stimplað hvíta oblongs; hæft pósti starfsmenn hreifi þá í bulging mailsacks; flota Digest vörubíla ferð þá til að tjá Mail-lestir. . . Næsta vika, fyrsta svör frá þessum tíu milljónir mun hefja komandi fjöru á merktum kjörseðla, að vera þrefaldur-merkt, staðfest, fimm sinnum yfir leynilegar og námu. Þegar síðasta talan hefur verið totted og merkt, ef fyrri reynsla er viðmiðun, landið mun vita að innan broti af 1 prósent raunverulegt vinsæll atkvæði fjörutíu milljónir [kjósendur]. "(22. Ágúst 1936)

fetishization Niðurbrotið er stærð er þegar í stað þekkta til hvaða "stór gögn" rannsóknir í dag. Af 10 milljónum atkvæðagreiðslur dreift, voru ótrúlega 2,4 milljónir atkvæðaseðla aftur-það er um það bil 1.000 sinnum stærri en nútíma stjórnmála kannanir. Frá þessum 2,4 milljónir svarenda úrskurður var skýr: Bókmennta Digest spáð að Challenger Alf Landon var að fara að vinna bug á skylda Franklin Roosevelt. En í raun, nákvæmlega andstæða gerst. Roosevelt sigraði Landon í skriðu. Hvernig gat Literary Digest farið rangt með svo mikið af gögnum? Nútíma skilningur okkar á sýnatöku gerir villur Literary Digest er skýr og hjálpar okkur að forðast að gera svipaðar villur í framtíðinni.

Hugsa skýrt um sýnatöku þarf okkur að íhuga fjóra mismunandi hópa fólks (mynd 3.1). Fyrsti hópur af fólki er að miða íbúa; þetta er hópur sem rannsóknir skilgreinir sem íbúum áhuga. Í tilviki Literary Digest markmiðið íbúa var kjósendur í 1936 forsetakosningunum. Eftir að ákvörðun um að markhópnum, rannsóknir hliðina þarf að þróa lista af fólki sem hægt er að nota til sýnatöku. Þessi listi er kallað Sýnatökuramminn og íbúa á úrtaksrammanum er kallað ramma íbúa. Í tilviki Literary Digest ramma íbúa var 10 milljónir manna sem nöfn komu aðallega frá framkvæmdarstjóra síma og bifreið skráning gagna. Helst miða íbúa og grind íbúa yrði nákvæmlega sú sama, en í raun er þetta oft ekki raunin. Mismunur á milli markhópnum og ramma íbúa eru kallaðir umfjöllun villa. Umfjöllun villa ekki, af sjálfu sér tryggir vandamál. En, ef fólk í ramma íbúanna eru markvisst frábrugðin fólki ekki í ramma þjóðarinnar verður umfjöllun hlutdrægni. Umfjöllun villa var fyrsta af helstu galla með Literary Digest könnun. Þau vildu að læra um kjósendur-sem var þeirra markmið íbúa-en þeir smíðað sýnatöku ramma aðallega frá framkvæmdarstjóra síma og bifreið hlutaskrám, heimildum sem yfir-fulltrúa ríkari Bandaríkjamenn sem voru líklegri til að styðja Alf Landon (muna að báðum þessum tækni, sem eru algengar í dag, voru tiltölulega ný á þeim tíma og að bandaríska var í miðri kreppunni miklu).

Mynd 3.1: Fulltrúar villur.

Mynd 3.1: Fulltrúar villur.

Eftir að skilgreina ramma íbúa, næsta skref er að rannsóknir til að velja sýnishorn íbúa; þetta eru menn sem rannsakandinn mun reyna að viðtal. Ef sýnið hefur mismunandi einkenni en grindar þjóðarinnar, þá getum við kynna sýnatöku villa. Þetta er eins konar villa mæld í skekkjumörk sem venjulega fylgir mat. Í tilviki Literary Digest misheppnað tiltæki, það er í raun var ekkert sýni; þeir reyndu að hafa samband við alla í rammanum þjóðarinnar. Jafnvel þó að það var engin sýnatöku villa, það var augljóslega enn villa. Þetta skýrir að framlegð af villum sem eru yfirleitt greint með áætlanir úr könnunum eru yfirleitt villandi lítill; þeir eru ekki allar heimildir af villu.

Að lokum, rannsóknir reynir að viðtal alla í úrtakinu þjóðarinnar. Þeir menn, sem eru með góðum árangri rætt eru kallaðir svarenda. Fullkomlega, sýnið íbúa og svarenda myndu vera nákvæmlega sama, en í reynd er ekki svar. Það er, fólk sem eru valdir í úrtakinu neita að taka þátt. Ef fólk sem svara eru frábrugðin þeim sem svara ekki, þá er hægt vera non-svörun hlutdrægni. Non-svar hlutdrægni var annað helsta vandamálið við Literary Digest könnun. Aðeins 24% af þeim sem fengu atkvæðagreiðslu brugðist, og það kom í ljós að fólk sem studd Landon voru líklegri til að bregðast við.

Beyond bara að vera dæmi til að kynna hugmyndir framsetning, sem Literary Digest könnun er oft-endurtekna dæmisaga, minningu vísindamenn um hættur af haphazard sýnatöku. Því miður, ég held að lærdómurinn sem margir draga úr þessari sögu er rangt einn. Algengustu Boðskapur sögunnar er að vísindamenn geta ekki lært neitt frá sýnum ekki líkur (þ.e. sýni án strangra líkur byggir reglur um val á þátttakendum). En, eins og ég mun sýna síðar í þessum kafla, það er ekki alveg rétt. Þess í stað, held ég að það eru í raun tveir siðferði til þessa sögu; siðferði sem eru eins og sannur í dag eins og þeir voru árið 1936. Fyrst, mikið magn af viljanakenndum safnað gögnum verður ekki tryggja góðan mat. Í öðru lagi, vísindamenn þurfa að gera grein fyrir hvernig gögn þeirra var safnað þegar þeir eru að gera áætlanir af því. Með öðrum orðum, vegna þess að gagnasöfnun ferli í Literary Digest könnun var markvisst skekkt í átt sumum svarenda, vísindamenn þurfa að nota flóknari mati aðferð að lóð sumir svarenda meira en aðrir. Síðar í þessum kafla, skal ég sýna þér eitt slíkt vægi aðferð-post-lagskipting-sem getur gert þér kleift að gera betri áætlanir með sýnishornum ekki líkur.