Komenti më tej

Ky seksion është projektuar për t'u përdorur si një referencë, në vend që të lexohet si një tregim.

  • Hyrje (Seksioni 3.1)

Shumë prej temave në këtë kapitull janë gjithashtu jehonë në Adresat e fundit presidenciale në Shoqatën Amerikane të Hulumtim të Opinionit (AAPOR), të tilla si Dillman (2002) , Newport (2011) , Santos (2014) , dhe Link (2015) .

Për sfondin historik më shumë në lidhje me zhvillimin e kërkimit anketës, shih Smith (1976) dhe Converse (1987) . Për më shumë në idenë e tre epokave të kërkimit anketës, shih Groves (2011) dhe Dillman, Smyth, and Christian (2008) (që thyen deri tre periudha pak më ndryshe).

Një pik brenda kalimit nga i pari në epokën e dytë në kërkimin studim është Groves and Kahn (1979) , i cili bën një krahasim të detajuar kokë-to-kokë në mes të një ballë për ballë dhe studim telefonik. Brick and Tucker (2007) shikon mbrapa në zhvillimin historik të metodave të marrjes së mostrave telefonimit shifra të rastit.

Për më shumë se sa sondazh hulumtimi ka ndryshuar në të kaluarën në përgjigje të ndryshimeve në shoqëri, shih Tourangeau (2004) , Mitofsky (1989) , dhe Couper (2011) .

  • Asking vs respektuar (Seksioni 3.2)

Mësoni rreth shteteve të brendshme duke bërë pyetje mund të jetë problematike sepse nganjëherë vetë të anketuarit nuk janë të vetëdijshëm për shtetet e tyre të brendshme. Për shembull, Nisbett and Wilson (1977) kanë një letër të mrekullueshme me titull ndjellëse: "thënë më shumë se ne mund të dimë:. Raporte Verbal në proceset mendore" Në letër autorët përfunduar: "subjekte janë nganjëherë (a) dijeni e ekzistenca e një stimul që ndikuan rëndësishmja një përgjigje, (b) në dijeni të ekzistencës së reagimit, dhe (c) duke mos ditur se stimuli ka ndikuar në përgjigje. "

Për argumentet se studiuesit duhet të preferojnë sjelljen e vëzhguar për sjellje apo qëndrime të raportuar, shih Baumeister, Vohs, and Funder (2007) (psikologji) dhe Jerolmack and Khan (2014) dhe përgjigjet (Maynard 2014; Cerulo 2014; Vaisey 2014; Jerolmack and Khan 2014) (sociologji). Dallimi në mes të kërkuar dhe duke respektuar të lind në ekonomi, ku studiuesit flasin në lidhje me preferencat e përcaktuara dhe të shpallura. Për shembull, një kërkues mund të kërkojë të anketuarit nëse ata preferojnë të hahet akullore, ose duke shkuar në palestër (preferenca të përcaktuara), ose hulumtimi mund të vëzhgojnë se si shpesh njerëzit të ngrënë akullore dhe të shkojnë në palestër (preferencave të shpallura). Ka skepticizëm të thellë të llojeve të caktuara të të dhënave preferencat cekura në ekonomi (Hausman 2012) .

Një temë kryesore e këtyre debateve është se sjellja e raportuar nuk është gjithmonë i saktë. Por, sjellja e regjistruar automatikisht mund të mos jetë i saktë, nuk mund të mblidhen në një mostër të interesit, dhe nuk mund të jetë në dispozicion të studiuesve. Kështu, në disa situata, mendoj se sjellja e raportuar mund të jenë të dobishme. Më tej, një temë e dytë kryesor nga këto debate është se raportet rreth emocioneve, njohurive, pritshmëritë dhe mendimet nuk janë gjithmonë të sakta. Por, në qoftë se informacioni në lidhje me këto shtete të brendshme janë të nevojshme nga studiues-të të ndihmojë të shpjegojë disa sjellje apo si gjë të shpjegohet, atëherë duke i kërkuar mund të jetë e përshtatshme.

  • Total gabim sondazh (Seksioni 3.3)

Për trajtimet gjatësi libër në një humbje totale të anketës, shih Groves et al. (2009) ose Weisberg (2005) . Për një histori të zhvillimit të gabimit të përgjithshëm të anketës, shih Groves and Lyberg (2010) .

Në kushtet e përfaqësimit, një hyrje të madhe për çështjet e mos-përgjigjes dhe mos-përgjigje paragjykim është raporti Këshilli Kombëtar i Shkencës në mospërgjigjes në anketat Shkencave Sociale: A Axhenda Research (2013) . Një pasqyrë e dobishme është dhënë nga (Groves 2006) . Gjithashtu, gjithë çështjet e veçanta të Gazetës Zyrtare të Statistikave, opinioni publik tremujore, dhe analet e Akademisë Amerikane të Politike dhe Shkencave Sociale janë publikuar në temën e mospërgjigjes. Së fundi, ka shumë mënyra në të vërtetë shumë të ndryshme të llogaritjes së normës përgjigje; këto qasje janë përshkruar në detaje në një raport nga Shoqata Amerikane e Opinionit Publik Hulumtuesit (AAPOR) (Public Opinion Researchers} 2015) .

1936 Sondazhi Letrar Digest është studiuar në detaje (Bryson 1976; Squire 1988; Cahalan 1989; Lusinchi 2012) . Ajo është përdorur edhe si një shëmbëlltyrë për të paralajmëruar kundër mbledhjes së të dhënave rastit (Gayo-Avello 2011) . Në vitin 1936, George Gallup përdorur një formë më të sofistikuar të mostrave, dhe ishte në gjendje për të prodhuar vlerësimet më të sakta me një mostër shumë më të vogël. Suksesi i Gallup-it mbi Digest letrare ishte një moment historik në zhvillimin e hulumtimeve të anketës (Converse 1987, Ch 3; Ohmer 2006, Ch 4; Igo 2008, Ch 3) .

Në kushtet e matjes, një burim i madh i parë për dizajnimin e pyetësorëve është Bradburn, Sudman, and Wansink (2004) . Për një trajtim më të avancuar fokusuar në mënyrë të veçantë në çështjet qëndrimin, shih Schuman and Presser (1996) . Më shumë në pyetje para-testimi është në dispozicion në Presser and Blair (1994) , Presser et al. (2004) , dhe Kapitulli 8 i Groves et al. (2009) .

Trajtimi klasik, book-gjatësia e tregtisë-off-it në mes të kostove të studimit dhe gabime anketës është Groves (2004) .

  • Kush për të kërkuar (Seksioni 3.4)

Classic Trajtimi book-gjatësia e mostrave standarde të probabilitetit dhe vlerësimi janë Lohr (2009) (më hyrës) dhe Särndal, Swensson, and Wretman (2003) (më të avancuar). Një trajtim klasik book-gjatësia e metodave të pas-shtresimit dhe të ngjashme është Särndal and Lundström (2005) . Në disa mjedise të moshës dixhitale, studiuesit e di mjaft për jo-të anketuarve, e cila nuk ishte e vërtetë shpesh në të kaluarën. Forma të ndryshme të rregullimit jo-përgjigje janë të mundshme kur hulumtuesit kanë informacion në lidhje me jo-të anketuarve (Kalton and Flores-Cervantes 2003; Smith 2011) .

Studimi Xbox i Wang et al. (2015) përdor një teknikë të quajtur regresionit multilevel dhe post-stratifikimi (MRP, ndonjëherë të quajtur "Mister P") që i lejon kërkuesit për të vlerësuar celular do të thotë edhe kur ka shumë e shumë qeliza. Edhe pse ka disa debate në lidhje me cilësinë e vlerësimeve nga kjo teknikë, kjo duket si një zonë premtues për të eksploruar. Teknika është përdorur më parë në Park, Gelman, and Bafumi (2004) , dhe ka pasur përdorimi i mëvonshëm dhe debate (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) . Për më shumë mbi lidhjen midis peshave individuale dhe pesha celularë me bazë të shihni Gelman (2007) .

Për qasje të tjera ndaj sondazheve web koeficient, shih Schonlau et al. (2009) , Valliant and Dever (2011) , dhe Bethlehem (2010) .

Përputhen mostër u propozua nga Rivers (2007) . Bethlehem (2015) argumenton se performanca e përputhjes së mostrës të vërtetë do të jetë i ngjashëm me metodat e tjera të marrjes së mostrave (p.sh., të marrjes së mostrave shtresëzuar) dhe qasje të tjera rregulluese (p.sh., post-shtresimit). Për më shumë mbi panelet online, shikoni Callegaro et al. (2014) .

Ndonjëherë hulumtuesit kanë gjetur se mostrat e probabilitetit dhe mostra jo-probabilitare japin vlerësime të cilësisë të ngjashme (Ansolabehere and Schaffner 2014) , por krahasime të tjera kanë gjetur se mostrat jo-probabilitetit bëjnë keq (Malhotra and Krosnick 2007; Yeager et al. 2011) . Një arsye e mundshme për këto dallime është se mostra jo-probabilitare janë përmirësuar me kalimin e kohës. Për një pamje më pesimiste të metodave të marrjes së mostrave jo-probabilitetit të parë Task-Forcën e AAPOR në Non-probabilitetit kampionimit (Baker et al. 2013) , dhe unë të rekomandojë lexuar komentin që pason raportin përmbledhës.

Për një meta-analizë për efektin e peshimit të reduktuar paragjykimet në mostrat jo-probabilitetit, shih Tabelën 2.4 në Tourangeau, Conrad, and Couper (2013) , e cila çon autorët në përfundimin "Rregullimet duket se janë korrigjime të dobishme, por e gabueshëm. . . "

  • Si për të kërkuar (Seksioni 3.5)

Conrad and Schober (2008) siguron një vëllim të titulluar redaktuar duke parashikuar Intervistë Anketa e së ardhmes, dhe ai adreson shumë nga temat në këtë seksion. Couper (2011) trajton tema të ngjashme, dhe Schober et al. (2015) ofron një shembull të mirë se si metodat e mbledhjes së të dhënave që janë të përshtatura për një mjedis të ri mund të rezultojë në të dhënave të cilësisë më të lartë.

Për një shembull tjetër interesant i përdorimit Apps Facebook për anketat e shkencave sociale, të shihni Bail (2015) .

Për më shumë këshilla mbi marrjen e sondazheve një eksperiencë të kënaqshme dhe të vlefshme për pjesëmarrësit, të parë punën në Dizajn Metoda e përshtatura (Dillman, Smyth, and Christian 2014) .

Stone et al. (2007) ofron një trajtim gjatësi librin e vlerësimit ekologjike çastit dhe metodat e lidhura.

  • Sondazhe të lidhura me të dhëna të tjera (Seksioni 3.6)

Judson (2007) e përshkroi procesin e kombinimit të sondazheve dhe të dhënat administrative si "integrim të informacionit," diskuton disa nga avantazhet e kësaj qasjeje, dhe ofron disa shembuj.

Një tjetër mënyrë që studiuesit mund të përdorni gjurmë dixhitale dhe të dhënat administrative është Korniza e mostrës për njerëzit me karakteristika specifike. Megjithatë, hyni në këto të dhëna që do të përdoret një kornizë marrjen e mostrave mund të krijojnë pyetje në lidhje me jetën private (Beskow, Sandler, and Weinberger 2006) .

Lidhur pyetur përforcohet, kjo qasje nuk është aq e re sa mund të duket nga se si e kam përshkruar atë. Kjo qasje ka lidhje të thella me tri fusha të mëdha në statistikat-model-bazë pas stratifikimit (Little 1993) , plotësim (Rubin 2004) , dhe vlerësimi i vogël zona (Rao and Molina 2015) . Ajo është e lidhur edhe me përdorimin e variablave zëvendësuese në kërkime mjekësore (Pepe 1992) .

Përveç çështjeve etike në lidhje me qasjen e të dhënave dixhitale gjurmë, i kërkuar përforcohet mund të përdoret gjithashtu për të konkludoj tipare të ndjeshme që njerëzit nuk mund të zgjedhin për të zbuluar në një anketë (Kosinski, Stillwell, and Graepel 2013) .

Kostos dhe koha e parashikuar në Blumenstock, Cadamuro, and On (2015) më shumë i referohen kostos së ndryshueshme koston e një kosto të survey-dhe shtesë nuk përfshijnë fikse të tilla si kostoja për të pastruar dhe të përpunojë të dhënat e thirrjes. Në përgjithësi, i kërkuar përforcohet ndoshta do të ketë kosto të lartë fikse dhe kosto të ulët ndryshueshme të ngjashme me eksperimente digjitale (shih Kapitullin 4). Më shumë detaje mbi të dhënat e përdorura në Blumenstock, Cadamuro, and On (2015) letër janë në Blumenstock and Eagle (2010) dhe Blumenstock and Eagle (2012) . Qasjet nga imputuation shumëfishtë (Rubin 2004) mund të ndihmojë në kapjen e pasigurisë në vlerësimet nga pyetur përforcohet. Nëse studiuesit duke bërë amplifikuar kërkuar vetëm kujdesen për akuza agregate, në vend se tipare të nivelit individual, atëherë qasjet në King and Lu (2008) dhe Hopkins and King (2010) mund të jenë të dobishme. Për më shumë rreth metodave të të mësuarit e makinës në Blumenstock, Cadamuro, and On (2015) , shih James et al. (2013) (më shumë hyrëse) ose Hastie, Tibshirani, and Friedman (2009) (më të avancuar). Një tjetër libër popullor mësuarit makinë është Murphy (2012) .

Lidhur duke i kërkuar pasuruar, rezultatet në Ansolabehere dhe Hersh (2012) varen në dy hapa kryesorë: 1) aftësia e Catalist për të kombinuar shumë burime të ndryshëm të të dhënave për të prodhuar një mjeshtër datafile sakta dhe 2) aftësia e Catalist për të lidhur të dhënat e sondazhit të datafile saj master. Prandaj, Ansolabehere dhe Hersh kontrolloni secilin nga këto hapa me kujdes.

Për të krijuar master datafile, Catalist kombinon dhe harmonizon informacione nga burime të ndryshme, duke përfshirë: të shumta regjistrimet e votimit fotografive nga çdo shtet, të dhënat e ndryshimit Kombëtar të Gjendjes Adresa në postë, bashkë me të dhënat nga ofruesit e tjerë të papërcaktuar komerciale. Detajet gjakosur rreth asaj se si e gjithë kjo pastrimi dhe shkrirja ndodh janë përtej qëllimit të këtij libri, por ky proces, pa marrë parasysh sa të kujdesshëm, do të përhapur gabimet në burimet origjinale të të dhënave dhe do të prezantojë gabime. Edhe pse Catalist ishte i gatshëm për të diskutuar mbi përpunimin e të dhënave dhe të sigurojë disa nga të dhënat e saj të parë, ajo ishte thjesht e pamundur për studiuesit për të shqyrtuar të gjithë tubacionin dhënave Catalist. Përkundrazi, hulumtuesit ishin në një situatë ku fotografi të dhënat Catalist kishte disa të panjohur, dhe ndoshta panjohshëm, shuma e gabimit. Ky është një shqetësim serioz, sepse një kritik mund të spekulojnë se dallime të mëdha në mes të raporteve të studimit mbi CCES dhe sjelljes në Catalist dosjen e të dhënave mjeshtri janë shkaktuar nga gabimet në dosjen e të dhënave master, jo nga keqraportimin nga të anketuarit.

Ansolabehere dhe Hersh mori dy qasje të ndryshme për të adresuar shqetësimin e cilësisë së të dhënave. partia e parë, përveç krahasimit votimin vetë-raportuar të votimit në dosjen mjeshtri Catalist, studiuesit krahasuar edhe të vetë-raportuar, race, statusi i regjistrimit të votuesve (p.sh., të regjistruar ose jo të regjistruar) dhe metoda e votimit (për shembull, personalisht, në mungesë votimit, etj) të atyre vlerave që gjenden në bazat e të dhënave Catalist. Për këto katër variablave demografikë, studiuesit gjetën nivele shumë më të larta të marrëveshjes në mes të raportit studim dhe të dhënat në dosjen mjeshtri Catalist se për votim. Kështu, Catalist fotografi të dhënat mjeshtër duket të ketë informacion me cilësi të lartë për tipare të tjera se votimit, duke sugjeruar se kjo nuk është e cilësisë së dobët të përgjithshëm. Së dyti, pjesërisht duke përdorur të dhëna nga Catalist, Ansolabehere dhe Hersh zhvilluar tri masa të ndryshme të cilësisë së të dhënave të votimit të qarkut, dhe kanë gjetur se shkalla e parashikuar e mbi-raportimit të votimit ishte në thelb nuk kanë lidhje me ndonjë prej këtyre masave të cilësisë së të dhënave, një gjetje që sugjerojnë se normat e larta të mbi-raportimit nuk janë duke u nxitur nga qarqet me cilësinë e të dhënave jashtëzakonisht të ulët.

Duke pasur parasysh krijimin e kësaj skede votimit mjeshtri, burimi i dytë i gabimeve të mundshme është që lidh të dhënat e sondazhit të saj. Për shembull, në qoftë se kjo lidhje është bërë gabimisht ajo mund të çojë në një mbi-vlerësim të diferencës midis të raportuar dhe të vlefshme, sjellje votimit (Neter, Maynes, and Ramanathan 1965) . Nëse çdo njeri kishte një identifikues unik të qëndrueshme që ishte në të dy burimet e të dhënave, atëherë lidhja do të jetë i parëndësishëm. Në vendet e tjera të SHBA dhe më të madhe, megjithatë, nuk ka identifikues universal. Për më tepër, edhe nëse ka pasur të tillë një popull identifikues ndoshta do të jetë në mëdyshje për të siguruar atë për studim hulumtuesit! Kështu, Catalist kishte për të bërë lidhjen duke përdorur identifikues papërsosur, në këtë rast katër pjesë të informacionit në lidhje me çdo paditur: emri, gjinia, vitin e lindjes dhe adresën e shtëpisë. Për shembull, Catalist kishte për të vendosur nëse Homie J Simpson në CCES ishte i njëjti person si Homer Jay Simpson në dosjen e tyre të të dhënave master. Në praktikë, të ngjashëm është një proces i vështirë dhe të çrregullt, dhe, për të bërë gjërat më keq për studiuesit, Catalist konsiderohet teknikën e saj përputhen të pronarit.

Në mënyrë për të vërtetuar algoritme përputhen, ata u mbështetën në dy sfidat. Së pari, Catalist marrë pjesë në një konkurs përputhen që është drejtuar nga një i pavarur, palëve të treta: të Mitre Corporation. Mitre dhënë të gjithë pjesëmarrësve dy fotografi të zhurmshme të dhënave që do të krahasohen, dhe ekipe të ndryshme konkurruan për t'u kthyer në Mitre të përputhen mirë. Sepse vetë Mitre njihte përputhjen e duhur ata ishin në gjendje për të shënuar ekipet. Nga kompanitë që konkurruan 40, Catalist erdhi në vendin e dytë. Ky lloj i pavarur vlerësimi, një pale të tretë e teknologji të pronarit është shumë e rrallë dhe tepër të vlefshme; ajo duhet të na japin besimin se procedurat Catalist të përputhen në thelb me shtet-e-artit. Por është shtet-e-artit-mjaft e mirë? Përveç kësaj gare përputhen, Ansolabehere dhe Hersh krijuar vetë sfidën e tyre përputhen për Catalist. Nga një projekt të mëparshëm, Ansolabehere dhe Hersh kishte mbledhur të dhënat e votuesve nga Florida. Ata me kusht disa prej këtyre të dhënave me disa nga fushat e tyre redaktuar për Catalist dhe pastaj krahasuar raportet e këtyre fushave në vlerat e tyre aktuale Catalist së. Për fat të mirë, raportet Catalist ishin afër vlerave të mbajtura, duke treguar se Catalist mund të përputhen me të dhënat e pjesshme të votuesve në dosjen e tyre të të dhënave master. Këto dy sfida, një nga një palë e tretë dhe një nga Ansolabehere dhe Hersh, të na japë më shumë besim në algoritme Catalist përputhen, edhe pse ne nuk mund të shqyrtojë zbatimin e saktë të tyre veten.

Ka pasur shumë përpjekje të mëparshme për të vërtetuar votimin. Për një pasqyrë të asaj letërsisë, shih Belli et al. (1999) , Berent, Krosnick, and Lupia (2011) , Ansolabehere and Hersh (2012) , dhe Hanmer, Banks, and White (2014) .

Është e rëndësishme të theksohet se edhe pse në këtë rast hulumtuesit u inkurajuan nga cilësia e të dhënave nga Catalist, vlerësime të tjera të shitësit komerciale kanë qenë më pak entuziastë. Hulumtuesit kanë gjetur cilësinë e dobët kur të dhënat nga një sondazh në një të konsumit-skedar nga Marketing Systems Group (e cila në vetvete shkrira së bashku të dhëna nga tre ofruesit: ACXIOM, Experian, dhe InfoUSA) (Pasek et al. 2014) . Kjo është, të dhënat fotografi nuk korespondon me përgjigjet e sondazhit që hulumtuesit pritet të jetë e saktë, datafile kishte të dhëna për një numër të madh pyetjesh, dhe zhdukur model të dhënave humbur është i lidhur me vlerën e raportuar sondazhit (me fjalë të tjera se të dhënat e humbur ishte sistematike , jo të rastit).

Për më shumë mbi lidhjen rekord mes sondazheve dhe të dhënave administrative, shih Sakshaug and Kreuter (2012) dhe Schnell (2013) . Për më shumë mbi lidhjen rekord në përgjithësi, shih Dunn (1946) dhe Fellegi and Sunter (1969) (historike) dhe Larsen and Winkler (2014) (modern). Qasje të ngjashme janë zhvilluar edhe në shkenca kompjuterike nën emra të tillë si deduplication dhënave, identifikimin e shkallës, emri përputhen, zbulimin e kopjuar, dhe kopjuar zbulimin rekord (Elmagarmid, Ipeirotis, and Verykios 2007) . Ka edhe privacy ruajtjen qasjet për të regjistruar lidhje të cilat nuk kërkojnë transmetimin e personalisht identifikimin e informacionit (Schnell 2013) . Hulumtuesit në Facebook zhvilluar një procedurë për të lidhur probabilisticsly të dhënat e tyre të sjelljes së votimit (Jones et al. 2013) ; kjo lidhje është bërë për të vlerësuar një eksperiment që unë do të ju tregojë për në Kapitullin 4 (Bond et al. 2012) .

Një shembull tjetër i lidh një studim në shkallë të gjerë shoqëror në të dhënat administrative qeveritare vjen nga Shëndetësi dhe Studimit daljes në pension dhe Administrata e Sigurimit Social. Për më shumë mbi këtë studim, duke përfshirë informacion në lidhje me procedurën e pëlqimit, shih Olson (1996) dhe Olson (1999) .

Procesi i kombinuar shumë burime të të dhënave administrative në një mjeshtër datafile-proces që Catalist punonjësit, është e zakonshme në zyrat statistikore të disa qeverive kombëtare. Dy studiues nga Statistikat e Suedisë kanë shkruar një libër të detajuar mbi temën (Wallgren and Wallgren 2007) . Për një shembull i kësaj qasjeje në një qark të vetëm në Shtetet e Bashkuara (Olmstead County, Minnesota; në shtëpi të Klinikës Mayo), shih Sauver et al. (2011) . Për më shumë mbi gabimet që mund të shfaqen në të dhënat administrative, shih Groen (2012) .