3.3.1 Figura

Rapprisintazzioni hè di circa facennu inferences da u vostru respondents to your pupulazzioni testu.

Per capisce u tipu d'errore chì pò succorsu quandu infruinzivu di i rispondenu à a populazione più grande, pensemu à l' astu di pudessi di scorsu littestariu chì hà pruvatu di predichju u risultatu di l'elezzioni presidenziale di i 1936 US. Ancu avutu più di 75 anni fa, stu debaculu stilla una lezioni impurtante per insignà i studienti oghje.

Literal Digest era una rivista populari di interessu generale, è da principiu in u 1920 hà cuminciatu a realizà l'urrenzi di stagione per predice i risultati di l'elezzioni presidenziale. Per fà sti pronteze, elaburevanu ballotti à parechje persone è da esse simplicemente quì i votate chì sò stati ritornu; Literal Digest hà avvistu chì i ballotti riciviani nè "ponderatu, ajustatu, nè intrepretatu". Questu proeutu hà previamente preveditu i vittorii di l'alizzioni in 1920, 1924, 1928 è 1932. In u 1936, in a midst of the Great Depression, Letteratura Digest mandò ballotti à 10 milioni di persone, chì i nomi vèninu principarmenti da i direttori telefonii è i registri di l'esercitu di l'automobile. Eccu cumu hà scrittu a so metodulugia:

"A màcchina spiaggia di u DIGEST traspendenu cù a preminenza veloce di trenta anni di spirimintà per riduciri a guessie à fatti fatti ... Questa settetta 500 penis scratched out più di un quartu di un millionu d'indirizzi un ghjornu. Ogni ghjornu, in una sala grandi sopra a Fourth Avenue di motor-ribboned, in New York, 400 lavori dilettentamente slide un milionu pezzi di stampata, abbastanza per allughjate quaranta cità di u blocu, in l'environu adattu [sic]. Ogni ura, in a SUSTATULA DI UFFIARIU DESTINATARI, trè salizziunati stampatori di franchi stampati è stampati i biancu persone; iperni postali qualificati sgrupparu in mutandine abbracciante; A flotta DIGEST camicava li sped li spiegà posta. . . A prime settima, e primi risposte di questi deci millioni principià a marea entrunta di ballotti marcati, per esse trè-verificatu, verificate, cinque volte e cruciali è tutali. Quandu l'ultima figura hè stata tutta è verificatu, se l'esperienza di u passatu hè un critinu, u paese hà cunnisciutu à una frazzioni di u 1% u votu populari propiu di quaranta millioni [votante] "(u 22 di Agostu 1936)

A fetishizazione di littorizazione littarizanti hè stata ricunnisciuta istantanevi à ognunu in u investigatore "big data". Danti i 10 milioni di ballotchi distribuziunate, un sorprenente 2,4 miliuni vinni ritornu, quasi appressu 1,000 volte più maiore di i pulitichi politique moderni. Da questi i 2,4 milioni di i rispondenti, u vermentu hè chjaru: Alf Landon avia da scunfighja u incumbent Franklin Roosevelt. Ma, veramente, Roosevelt vincìu a Landon in un corpu di turezza. Cumu puderà Imprezzatori di Letteratura oghje incù più dati? A nostra intelligenza moderna di u prucedimentu fa l' errori di Letteratura Digitala chjaru è aiuta à avè micca avè fattu erruri simili in u futuru.

Pensemu claramente nantu à u sampling eccu deve cunceta quattru gruppi di persone (figura 3.2). U primu gruppu hè a destinazione ; questu hè u gruppu chì l'investigatore definisce cum'è a populazione di interessu. In u caso di Literary Digest , a populazione di destinazione era votante in l'elezzione presidenziale di 1936.

Dopu a dicisionarii di una populazione urientale, un investigatore necessita di sviluppà una lista di e persone chì pò esse aduprati per a mostra. Questa lista hè chjamata freccia di mostraje è e persone chì sò chjamati a pupulazione di marcatura . Idealmentu, a populazione di destinazione è a populazione di u marcatu seria ancu u stessu, ma in pratica u solitu ùn hè micca u casu. Per esempiu, in u caso di Literary Digest , a populazione di marcusicatu era i 10 milioni di i zoni chì i nomi sò vinuti principarmenti da i direttori telefonii è i registri d'autore di l'automobile. I Differences trà a populazione di destinazione è a populazione di frames sò chjamati chjama di cobertura . Un error di Coverage ùn, per ella sola, prumove a prublemi. In ogni casu, pò esse guidati à un pianu di a cobertura chì e persone in a populazione framette sò sistematicamenti distintu di i persone in a populazione di destinazione chì ùn sò micca in a populazione framette. Questu hè, in fattu, esattamente ciò chì passava in u sughjettu di Digest Digest . I so populi in a so populazione di marcusciianu tendenu à esse prus capu di sustiniennu Alf Landon, in parte perchè eranu più ricchi (ricurdamu chì i telefoni è l'automobili erani novi u costu in u 1936). Allora, in a sonda di Letteratura Digestiva, l'error di coverageu hà permessu di preghjudizzioni.

Figura 3.2: Errore di representazione.

Figura 3.2: Errore di representazione.

Dopu à definisce a populazione di u marcu , u prossimu passu hè per un investigatore per selezziunà a populazione di mostra ; Queste sò i persone chì u ricerciatore tandu pruvà entrevista. Se u mutaculu hà parechji caratteristiche ch'è a populazione di staghjunata, u prenotazione pò intruduce l' errore di mostra . In u casu di u fiasco di Letteratura Digitale , in ogni casu, ùn ci era micca un sampling-a rivista per contactà à tutti in a populazione di caduta, è per quessa chì ùn era micca stato di mostra. Parechji circhuli tendenu à tematichi in u scupertu di sampling-questu hè tipu l'unicu modu d'errore pigghiatu da u maritu di l'errore infurmatu in i medizzioni, ma u fiasco di Scuperta Letteraria, ricorda à noi chì avemu bisognu di tutte e fonti d'errore, allattaghjani aleatorii è sistematique.

Infine, dopu à selezione una populazione di mostra, un furasteru attempu di entrevista à tutti i so membri. Quelli persone chì sò rimessu entrevista sò chjamati i rispondenti . Idealmentu, a populazione di mostra è i rispondenti seranu esiquamente u stessu, ma in a pratica ùn ci hè micca rispettu. Hè per esempiu, e persone chì sò selezziunati in l'espressione di caghjunu ùn participanu micca. Se e persone chì rispundanu sò diffirenti di quelli chì ùn rispundenu micca, ùn pò esse un intrigu rispettu . A bias nonresponse hè u sicondu prublema principali cù l'amica di Dumenicà Digest . Solu u 24% di e persone chì anu ricivutu una votante respondenu, è resultò chì a ghjente chì sustinia à Landon era più probatu de risponde.

Sippuru più solu esse un esempiu di introduverà l'idee di rapprisintazioni, l' Ecumenizazione di Dumenificazione Letteraria hè una parabola repetitiva, chì avvienenu i ricerchiaturi di i periculi di prenotazione di furia. Sfurtunatamente, pensu chì a lezziunione chì tanti pirsuni sughjèghjanu d'sta storia hè u sbagliu. A murali più cumune di a storia hè chì i circunsidenti ùn pudendu apreghjunghje micca di mudelli di non probabilitati (per esempiu, mostru senza regule riguevuli basati in probabilità per u sceglie participanti). Ma, cumu vi fighjà più tardu in stu capitulu, ùn hè micca bè. Invece, pensu chì ci sò veramente assai morali à sta storia; capite chì sò cum'è veru oghje chì ghjèranu in u 1936. Primu, una quantità maiò di i dati recurringhjulously collate no garantanu una bona estimazione. In generale, avè un gran numaru di rispondenti disminuisce a varianza di l'estimi, ma ùn hà micca necessariu reducirie a viulenza. Cù assai verità di dati, i circhudine pò a volte una stima precisa di l'ughjettu; pò esse pricisu pricatu (McFarland and McFarland 2015) . A seconda lecite principale da u fiasco di Scuperta Letteraria hè chì i circh merchante avè bisognu à contu di a manera chì u so fogliu hè stata recopilata durante l'estimazioni. In altri palori, perchè u prucessu di u prucedimentu in l' avvine di Dumenicu Digitalizi era propiu di manera sistematica di volte à parechji rispondenu, i circustruttori necessitanu d'utilizà un prucessu d'estimazioni più cumplicatu chì ponderò certi anu risposti più ca l'altri. In seguitu in stu capitulu, vi daraghju un prucessu d'aghjurnamentu, post-stratificazione, chì ponu attivà per fà estimi più prudenti da e chjucu.