3.3.1 Cynrychiolaeth

Cynrychiolaeth yn ymwneud â ffurfio casgliadau o dy ymatebwyr at eich boblogaeth darged.

Er mwyn deall y math o wallau a all ddigwydd pan fydd casglu bod gan ymatebwyr i'r boblogaeth fwy, gadewch i ni ystyried y bleidlais gwellt Llenyddol Digest sy'n ceisio rhagfynegi canlyniad yr etholiad 1936 US Arlywyddol. Er ei bod yn fwy na 75 mlynedd yn ôl, llanast hwn yn dal i fod yn wers bwysig i addysgu ymchwilwyr heddiw.

Roedd Llenyddol Digest cylchgrawn cyffredinol-log poblogaidd, ac yn dechrau yn 1920 maent yn dechrau rhedeg polau ar antur i ragweld canlyniadau Etholiadau Arlywyddol. I wneud rhagfynegiadau hyn, byddent yn anfon pleidleisiau i lawer o bobl, ac yna dim ond cyfateb i fyny 'r pleidleisiau a ddychwelwyd; Llenyddol Digest adroddwyd yn falch bod y pleidleisiau a dderbyniwyd ganddynt yn hynny "pwysoli, wedi'i addasu, nac dehongli." Mae'r weithdrefn hon a ragwelir yn gywir yr enillydd yr etholiadau yn 1920, 1924, 1928 a 1932. yn 1936, yng nghanol y Dirwasgiad Mawr, Literary Digest anfonwyd pleidleisiau i 10 miliwn o bobl, y mae eu henwau yn dod yn bennaf o llyfrau ffôn a chofnodion cofrestru Automobile. Dyma sut y maent yn disgrifio eu methodoleg:

"Y CRYNHOAD yn llyfn-redeg peiriant yn symud gyda thrachywiredd cyflym o ddeng mlynedd ar hugain o brofiad er mwyn lleihau dyfalu i ffeithiau caled. . . .This Wythnos 500 corlannau crafu allan mwy na chwarter miliwn o gyfeiriadau bob dydd. Bob dydd, mewn ystafell fawr yn uchel uwchben stribedog ar-modur Pedwerydd Avenue, yn Efrog Newydd, 400 o weithwyr deftly llithro miliwn o ddarnau o printiedig mater-digon i baratoi'r deugain dinas blociau-i mewn i'r envelops afael [sic]. Bob awr, yn ei hun Swyddfa Bost Is-orsaf THE CRYNHOAD'S, tri chattering peiriannau mesuryddion postio selio a'i stampio y oblongs wyn; gweithwyr post medrus yn eu troi i mewn i chwyddo mailsacks; tryciau fflyd DIGEST gwibio i fynegi post-trenau. . . Yr wythnos nesaf, bydd yr atebion cyntaf o'r rhain deng miliwn o ddechrau ar y llanw sy'n dod i mewn o bleidleisiau a farciwyd, i fod triphlyg-wirio, gwirio, bum gwaith traws-ddosbarthu ac yn dod i gyfanswm. Pan fydd y ffigur diwethaf wedi ei totted a'u gwirio, os profiad yn y gorffennol yn faen prawf, bydd y wlad yn gwybod i fewn ffracsiwn 1 y cant y bleidlais boblogaidd gwirioneddol 40,000,000 [pleidleiswyr]. "(22 mis Awst, 1936),

fetishization y Crynhoad o faint ei adnabod ar unwaith i unrhyw "ddata fawr" ymchwilydd heddiw. O'r 10 miliwn o bleidleisiau a ddosbarthwyd, anhygoel 2.4 miliwn o bleidleisiau a ddychwelwyd-dyna tua 1,000 gwaith yn fwy na'r polau gwleidyddol modern. O'r rhain 2.4 miliwn o ymatebwyr y dyfarniad yn glir: ragwelir Llenyddol Digest bod y cystadleuydd Alf Landon yn mynd i drechu periglor Franklin Roosevelt. Ond, mewn gwirionedd, y gwrthwyneb union ddigwyddodd. trechu Roosevelt Landon mewn tirlithriad. Sut y gallai Llenyddol Digest mynd o'i le gyda data gymaint? Mae ein dealltwriaeth fodern o samplu yn gwneud camgymeriadau Llenyddol Digest yn eglur ac yn ein helpu i osgoi gwneud camgymeriadau tebyg yn y dyfodol.

Meddwl yn glir am samplu ei gwneud yn ofynnol i ni ystyried pedwar grŵp gwahanol o bobl (Ffigur 3.1). Mae'r grŵp cyntaf o bobl yw'r boblogaeth darged; dyma'r grŵp bod yr ymchwil yn diffinio fel poblogaeth o ddiddordeb. Yn achos Llenyddol Digest y boblogaeth targed oedd pleidleiswyr yn Arlywyddol yr Etholiad 1936. Ar ôl penderfynu ar boblogaeth darged, mae angen ymchwilydd nesaf i ddatblygu rhestr o bobl y gellir eu defnyddio ar gyfer samplu. Gelwir y rhestr hon ffrâm samplu a elwir yn y boblogaeth ar y ffrâm samplu yn y boblogaeth ffrâm. Yn achos Llenyddol Digest y boblogaeth ffrâm oedd y 10 miliwn o bobl y mae eu henwau yn dod yn bennaf o llyfrau ffôn a chofnodion cofrestru Automobile. Yn ddelfrydol, byddai'r boblogaeth darged a'r boblogaeth ffrâm fod yn union yr un fath, ond yn ymarferol mae hyn yn aml nid yw hynny'n wir. Gelwir Gwahaniaethau rhwng y boblogaeth darged a phoblogaeth ffrâm yn cael gwall sylw. Gwall Pwnc o dan sylw nid yw, ynddo'i hun yn gwarantu problemau. Ond, os yw'r bobl yn y boblogaeth ffrâm yn systematig wahanol i bobl nad ydynt yn y boblogaeth ffrâm bydd rhagfarn sylw. Gwall Cwmpas oedd y cyntaf o'r prif ddiffygion â'r bleidlais Literary Digest. Roeddent am ddysgu am bleidleiswyr-dyna oedd eu targed poblogaeth-ond maent yn adeiladu ffrâm samplu yn bennaf o llyfrau ffôn a cofrestrfeydd Automobile, ffynonellau sy'n gorgynrychioli gyfoethocach Americanwyr a oedd yn fwy tebygol o gefnogi Alf Landon (dwyn i gof bod y ddau o'r technolegau hyn, sy'n gyffredin heddiw, yn gymharol newydd ar y pryd a bod y Unol Daleithiau yn nghanol y Dirwasgiad Mawr).

Ffigur 3.1: gwallau Cynrychiolaeth.

Ffigur 3.1: gwallau Cynrychiolaeth.

Ar ôl diffinio'r boblogaeth ffrâm, y cam nesaf yw i ymchwilydd i ddewis y boblogaeth sampl; y rhain yw'r bobl y bydd yr ymchwilydd yn ceisio cyfweld. Os oes gan y sampl nodweddion gwahanol na'r boblogaeth ffrâm, yna gallwn gyflwyno gwall samplu. Mae hyn yn y math o gamgymeriad mesur yn y lwfans gwallau sydd fel arfer yn cyd-fynd amcangyfrifon. Yn achos y fiasco Llenyddol Digest, nid mewn gwirionedd oedd unrhyw sampl; maent yn ceisio cysylltu â phawb yn y boblogaeth ffrâm. Hyd yn oed er nad oedd unrhyw wall samplu, roedd yn amlwg o hyd camgymeriadau. Mae hyn yn egluro bod y ymylon o wallau sy'n cael eu hadrodd fel arfer ag amcangyfrifon o'r arolygon fel arfer yn gamarweiniol fach; nid ydynt yn cynnwys pob ffynhonnell o gamgymeriad.

Yn olaf, ymchwilydd yn ceisio cyfweld pawb yn y boblogaeth sampl. Mae'r bobl hynny sy'n cael eu cyfweld yn llwyddiannus yn cael eu galw'n ymatebwyr. Yn ddelfrydol, byddai'r boblogaeth sampl a'r ymatebwyr yn union yr un fath, ond yn ymarferol nid oes diffyg ymateb. Hynny yw, pobl sy'n cael eu dewis yn y sampl wrthod cymryd rhan. Os bydd y bobl sy'n ymateb yn wahanol i'r rhai nad ydynt yn ymateb, yna gall fod tuedd diffyg ymateb. Tuedd diffyg ymateb oedd yr ail brif broblem gyda'r bleidlais Literary Digest. Ymatebodd Dim ond 24% o'r bobl a dderbyniodd pleidlais, ac mae'n troi allan bod pobl sy'n cefnogi Landon yn fwy tebygol o ymateb.

Y tu hwnt dim ond bod yn esiampl i gyflwyno syniadau cynrychiolaeth, y bleidlais Llenyddol Digest yn ddameg fynych-dro ar ôl tro, rhybuddio ymchwilwyr am y peryglon o samplu ar hap. Yn anffodus, credaf fod y wers bod llawer o bobl yn tynnu oddi wrth y stori hon yw yr un anghywir. Mae'r moesol mwyaf cyffredin o'r stori yw na all ymchwilwyr ddysgu unrhyw beth o samplau nad ydynt yn tebygolrwydd (hy, samplau heb reolau sy'n seiliedig ar debygolrwydd-llym ar gyfer dewis cyfranogwyr). Ond, fel y byddaf yn dangos yn ddiweddarach yn y bennod hon, nid yw hynny'n hollol iawn. Yn lle hynny, yr wyf yn meddwl bod yna mewn gwirionedd dau moesau i'r stori hon; moesau sydd mor wir heddiw ag yr oeddent ym 1936. Yn gyntaf, ni fydd swm mawr o ddata a gasglwyd hap gwarantu amcangyfrif da. Yn ail, mae angen i ymchwilwyr i gyfrif am sut gasglu eu data pan fyddant yn gwneud amcangyfrifon ohono. Mewn geiriau eraill, oherwydd bod y broses o gasglu data yn y pôl Literary Digest yn gogwyddo yn systematig tuag at rhai ymatebwyr, mae angen i ymchwilwyr i ddefnyddio proses amcangyfrif mwy cymhleth y pwysau rhai ymatebwyr fwy nag eraill. Yn ddiweddarach yn y bennod hon, 'n annhymerus' yn dangos i chi un pwysiad fath drefn-ôl-haeniad-y gallwch galluogi i wneud amcangyfrifon yn well gyda samplau nad ydynt yn tebygolrwydd.