Edasine kommentaar

See tõlge loodi arvuti. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

Edasine kommentaar

See osa on mõeldud kasutamiseks viitena, mitte tuleb lugeda tekstilist.

Sissejuhatus (punkt 3.1)

Paljud teemad selles peatükis on ka kordas viimastel presidendivalimistel aadressid American Association of Public Opinion Research (AAPOR), nagu Dillman (2002) , Newport (2011) , Santos (2014) ja Link (2015) .

Täpsemat ajalooline taust arengu kohta uuringu tulemustest vt Smith (1976) ja Converse (1987) . Täpsemat ideel kolm ajastute uuringu tulemustest, vaata Groves (2011) ja Dillman, Smyth, and Christian (2008) (mis lõhub kolm ajastute veidi erinevalt).

Lammutamismaht sees üleminek esimesest teise ajastu uuringu tulemustest on Groves and Kahn (1979) , mis teeb üksikasjaliku head-to-head võrdlus näost näkku ja telefoni uuring. Brick and Tucker (2007) vaatab tagasi ajaloolise arengu juhuslik kohaline numbrid proovivõtu-.

Rohkem kui uuring uuringud on muutunud viimase vastavalt muutustele ühiskonnas näha Tourangeau (2004) , Mitofsky (1989) , ja Couper (2011) .

Küsid vs jälgides (punkt 3.2)

Õppida sisemistest seisunditest küsimusi esitades võib olla problemaatiline, sest mõnikord vastajad ise ei ole teadlikud oma sisemistest seisunditest. Näiteks Nisbett and Wilson (1977) on suurepärane paber meeldejäävaid pealkiri: "ütle rohkem, kui me ei tea: suuline aruanded psüühilised protsessid." In paber järeldavad autorid: "teemad on mõnikord (a) teadlikud olemasolu ajend, mis tähtsam mõjutanud vastust, (b) olemasolust teadlikud vastuse, ja (c) teadlikud, et stimuleerivad on mõjutanud vastust. "

Argumente, et teadlased peaksid eelistavad täheldatud käitumise teatatud käitumist või hoiakuid, vaata Baumeister, Vohs, and Funder (2007) (psühholoogia) ja Jerolmack and Khan (2014) ja vastuseid (Maynard 2014; Cerulo 2014; Vaisey 2014; Jerolmack and Khan 2014) (sotsioloogia). Erinevus küsib ja jälgides tekib ka majanduses, kus teadlased räägivad märgitud ja selgus eelistusi. Näiteks võib uurija küsida vastanutest, kas nad eelistavad süüa jäätist või minna jõusaali (märgitud eelistustele) või teadustöö võiks jälgida, kui tihti inimesed söövad jäätist ja minna jõusaali (selgus eelistusi). On sügav skepsis teatavat liiki märkis eelistusi andmed majandusteaduses (Hausman 2012) .

Peamine teema nende arutelude et raporteeritud käitumine ei ole alati täpsed. Aga salvestatakse automaatselt käitumine ei pruugi olla täpne, ei tohi koguda proov huvi, ja ei pruugi olla kättesaadav teadlased. Seega, teatud olukordades, ma arvan, et raporteeritud käitumine võib olla kasulik. Lisaks teine peamine teema nende arutelude et teateid emotsioonid, teadmised, hoiakud ja arvamused ei ole alati täpsed. Aga kui informatsiooni sisemistest seisunditest on vaja teadlaste-kas aitavad selgitada mõningaid käitumist või kui asi on seletatav-siis küsitakse, võib olla asjakohane.

Kokku uuring viga (punkt 3.3)

Raamatute pikkuse ravi kohta kokku uuringu viga, vaata Groves et al. (2009) või Weisberg (2005) . Sest ajaloo areng kogu uuringu viga, vaata Groves and Lyberg (2010) .

Seoses esitus, suurepärane sissejuhatus küsimusi vastamata jätmise ja vastamata jätmise diagonaal on National Research Council aruande Vastamata jätmine ühiskonnaõpetus Küsitlused: teadusuuringute kava (2013) . Veel üks kasulik ülevaate annab (Groves 2006) . Ka kogu erinumbrite Journal of Ametliku statistika Avalik arvamus Quarterly ja Annals of American Academy of poliitika- ja sotsiaalteadused on avaldatud teemal vastamata jätmist. Lõpuks on tegelikult palju erinevaid võimalusi arvutamise ravivastus; need lähenemised on detailselt kirjeldatud aruande American Association of Public Opinion Teadlased (AAPOR) (Public Opinion Researchers} 2015) .

1936. Literary Digest Küsitlus on üksikasjalikult uuritud (Bryson 1976; Squire 1988; Cahalan 1989; Lusinchi 2012) . Samuti on kasutatud tähendamissõna hoiatab juhuslik andmete kogumist (Gayo-Avello 2011) . Aastal 1936, George Gallup kasutada keerukamaid vormis proovivõtu ja suutis toota täpsemaid hinnanguid palju väiksema valimi. Gallup edu üle Kirjanduse Digest oli verstapost arengut küsitlusuuring (Converse 1987, Ch 3; Ohmer 2006, Ch 4; Igo 2008, Ch 3) .

Seoses mõõtmine, suurepärane esimene ressurss projekteerimine küsimustikud on Bradburn, Sudman, and Wansink (2004) . Sest põhjalikum puhastus keskenduti eelkõige suhtumine küsimusi, vaadake Schuman and Presser (1996) . Veel eeltestimisest küsimused on saadaval Presser and Blair (1994) , Presser et al. (2004) , ning 8. peatükis Groves et al. (2009) .

Klassikaline, raamatu-pikkust ravi kompromiss uuringu kulud ja uuringu vead on Groves (2004) .

Kes küsida (punkt 3.4)

Klassikaline raamatu-pikkust ravi standard valimit ja hindamine on Lohr (2009) (rohkem sissejuhatav) ja Särndal, Swensson, and Wretman (2003) (rohkem arenenud). Klassikaline raamatu-pikkust ravi järelkihistamisega ja sellega seotud meetodeid on Särndal and Lundström (2005) . Mõnel digitaalajastul seaded teadlased teavad üsna natuke jätnutel, mis ei olnud sageli tõsi minevikus. Erinevad vastamata jätmise reguleerimine on võimalik, kui teadlased on informatsiooni jätnutel (Kalton and Flores-Cervantes 2003; Smith 2011) .

Xbox uuring Wang et al. (2015) kasutab tehnikat nimega mitmetasandiline regressiooni ja järelkihistamisega (MRP, mida mõnikord nimetatakse "Mister P"), mis võimaldab teadlastel hinnata rakkude tähendab ka siis, kui seal on palju, palju rakke. Kuigi on olemas teatud arutelu kvaliteedi hinnangute seda tehnikat, tundub paljulubav ala uurida. Tehnikat kasutati esmakordselt Park, Gelman, and Bafumi (2004) , ja seal on hilisema kasutamise ja arutelu (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) . Lisateavet seost individuaalsed kaalud ja rakupõhisele kaalu näha Gelman (2007) .

Teiste lähenemisviise kaalumine web uuringud, vaata Schonlau et al. (2009) , Valliant and Dever (2011) , ja Bethlehem (2010) .

Proovi sobitamise pakkus Rivers (2007) . Bethlehem (2015) väidab, et tulemuslikkuse proovi sobitamise on tegelikult sarnane teiste proovivõtu meetodeid (näiteks, kihtvalik) ja muud reguleerimine lähenemisviise (nt järelkihistamisega). Täpsemat online paneelid, vaata Callegaro et al. (2014) .

Vahel teadlased on leidnud, et valimid ja mitte-valimid anda hinnanguid sarnaste omadustega (Ansolabehere and Schaffner 2014) , kuid teised võrdlused on avastanud, et mitte-valimid teha hullem (Malhotra and Krosnick 2007; Yeager et al. 2011) . Üks võimalik põhjus neid erinevusi on see, et mitte-valimid on aja jooksul paranenud. Sest rohkem pessimistliku empiirilist proovivõtu- näha The AAPOR rakkerühma empiirilist valikut (Baker et al. 2013) , ja ma ka soovitada lugemist kommentaaris, mis järgneb kokkuvõte.

Sest meta-analüüsi mõju kaalu vähendada eelarvamusi mitte-valimid, vt tabel 2.4 Tourangeau, Conrad, and Couper (2013) , mis viib autorid sõlmida "kohandusi tundu olevat kasulik, kuid ekslik parandusi. . . "

Kuidas küsida (§ 3.5)

Conrad and Schober (2008) annab toimetanud maht pealkirjaga -Lt Survey Intervjuu of the Future, ja seda käsitletakse paljusid teemasid selles osas. Couper (2011) käsitleb sarnased teemad ja Schober et al. (2015) pakub kena näide sellest, kuidas andmete kogumise meetodeid, mis on kohandatud uue seade võib põhjustada kõrgema kvaliteediga andmed.

Sest üks huvitav näide kasutades Facebook apps sotsiaalteaduslike uuringute kohta vt Bail (2015) .

Täpsemat nõu tehes uuringuid nauditav ja väärtuslik kogemus osalejad vaadake tööd rätsepatöö Design Method (Dillman, Smyth, and Christian 2014) .

Stone et al. (2007) pakub raamat pikkuse ravi ökoloogilise hetkeline hindamine ja sellega seotud meetodeid.

Uuringud seotud muud andmed (punkt 3.6)

Judson (2007) kirjeldatud protsessi küsitluste kombineerimise ja haldus andmed "informatsiooni integratsiooni," arutleb mõned eelised seda lähenemist, ja pakub mõned näited.

Teine võimalus, et teadlased saaksid kasutada digitaalset jälgi ja administratiivsed andmed on üldkogumina inimeste erijooni. Kuid juurdepääsu nimetatud andmetele tuleb kasutada üldkogumina luua ka küsimused, mis on seotud privaatsust (Beskow, Sandler, and Weinberger 2006) .

Seoses võimendatud küsitud selline lähenemine ei ole nii uus, kui see võiks tunduda, kuidas ma olen seda kirjeldanud. Selline lähenemine on sügavad sidemed kolme suurtel aladel statistika-mudeli põhjal järelkihistamisega (Little 1993) , arvestamise (Rubin 2004) ja väikeste valdkondade hindamise (Rao and Molina 2015) . Samuti on seotud asenduskemikaalide kasutamine muutujate meditsiiniuuringute (Pepe 1992) .

Lisaks eetilistes küsimustes juurdepääsu digitaalse jälje andmeid, võimendab küsida võib kasutada ka järeldada tundlik tunnused, et inimesed ei pruugi valida ilmneb uuringu (Kosinski, Stillwell, and Graepel 2013) .

Kulusid ja aega hinnanguid Blumenstock, Cadamuro, and On (2015) viitavad pigem muutuv kulu-kulu ühe täiendava uuringu-ja ei sisalda püsikulud, nagu kulu puhastada ja töödelda kõne andmed. Üldiselt võimendatud küsib ilmselt on suured püsikulud ja madala muutuvkulud sarnane digitaalne eksperimente (vt peatükk 4). Täpsemat infot selle kohta andmeid kasutatakse Blumenstock, Cadamuro, and On (2015) paber on Blumenstock and Eagle (2010) ja Blumenstock and Eagle (2012) . Lähenemisviiside mitu imputuation (Rubin 2004) võiks aidata püüdmine ebakindlust prognooside võimendatud küsimata. Kui teadlased selle tegemine võimendatud paludes ainult hoolid kokku loeb, mitte üksikisiku tasandil tunnused, siis lähenemisviise King and Lu (2008) ja Hopkins and King (2010) võib olla kasulik. Täpsema info saamiseks masin õppe lähenemist Blumenstock, Cadamuro, and On (2015) , vaadake James et al. (2013) (rohkem sissejuhatav) või Hastie, Tibshirani, and Friedman (2009) (rohkem arenenud). Teine populaarne masin õppe õpik on Murphy (2012) .

Seoses rikastatud küsitud tulemusi Ansolabehere ja Hersh (2012) hinge kaks põhietappi: 1) võime Catalist ühendada paljude erinevate andmeallikate mille täpne kapten andmefail ja 2) võime Catalist siduda uuringu andmeid tema master andmefail. Seetõttu Ansolabehere ja Hersh vaadata kõik need etapid hoolikalt.

Et luua kapten andmefail, Catalist ühendab ja ühtlustab teavet paljudest erinevatest allikatest, sealhulgas: mitu hääletamisprotokolle pilte igast olekus andmeid Post Office National muutus Aadress registris ning andmed teistest täpsustamata kaubandusliku pakkujad. Verine üksikasjad selle kohta, kuidas kõik see puhastamine ja ühinemine juhtub väljuvad sellest raamatust, kuid see protsess, ükskõik kui hoolikalt, propageerida vigu originaal andmeallikate ja tutvustab vigu. Kuigi Catalist oli valmis arutama oma andmete töötlemise ja anda mõned oma algandmed, see oli lihtsalt võimatu teadlaste vaadata kogu Catalist andmed torujuhet. Pigem teadlased olid olukorras, kus Catalist andmefaili oli mõned tundmatud ja võibolla tundmatud, kogus viga. See on tõsine probleem, sest kriitik võib spekuleerida, et suured erinevused uuringu aruanded CCES ja käitumine Catalist master andmefaili olid tingitud vigu kapten andmefaili, mitte valeandmete vastajad.

Ansolabehere ja Hersh võttis kaks erinevat lähenemist tegelemine andmete kvaliteedi probleem. Esiteks, lisaks võrreldakse ise aru hääletamise hääletamise Catalist peatoimikule teadlased ka võrreldes ise aru poole, rassi, valijate registreerimine staatuse (nt registreeritud või registreerimata) ning hääletamise meetod (nt isiklikult puuduja hääletamissedel, jne), et need väärtused leiti Catalist andmebaasides. Nende nelja demograafiliste näitajate, leidsid teadlased palju kõrgem kokkuleppel uuringu aruanne ja andmed Catalist peatoimikule kui hääletamiseks. Seega Catalist master andmefail on ilmselt kõrge kvaliteediga teavet tunnused peale hääletamist, mis viitab sellele, et tegemist ei ole halva üldist kvaliteeti. Teiseks, osa andmeid kasutades Catalist, Ansolabehere ja Hersh töötanud kolm eri meetmete kvaliteeti maakonna hääletustulemusi ning leidsid nad, et hinnanguliselt kiirusega üle-aruandluse hääletamine oli sisuliselt ei ole seotud ühegi nendest andmekvaliteedimeetmed, kui tuvastatakse, et viitavad sellele, et kõrged üle-aruandlus ei juhitaks maakondades ebatavaliselt madal andmete kvaliteeti.

Arvestades loomine See Master hääletamise faili, teine allikas võimalike vigade lingib uuringu andmed, et ta. Näiteks, kui see seos on tehtud valesti see võib kaasa tuua ülehindamist vahe ja neid kontrollitud hääletamise (Neter, Maynes, and Ramanathan 1965) . Kui iga inimene oli stabiilne, kordumatu tunnus, mis oli nii allikatele siis seost oleks tühine. USA-s ja enamikus teistes riikides, aga ei ole olemas universaalset tunnus. Lisaks, isegi kui seal oli selline identifitseerimine inimesi oleks ilmselt kõhklevad anda see uuring teadlased! Seega Catalist pidin tegema seoste abil ebatäiuslik tunnused, antud juhul neli tükki teavet iga vastaja: nimi, sugu, sünniaasta ja kodune aadress. Näiteks Catalist tuli otsustada, kas Homie J Simpson on CCES oli sama isik Homer Jay Simpson oma master andmefaili. Praktikas sobitamine on keeruline ja segane protsess, ja teha hullem uurijatele, Catalist peetakse selle sobitamise tehnikat olla varaline.

Selleks, et kinnitada sobivad algoritmid, nad olid kaks väljakutset. Esiteks Catalist osales sobitamise konkurentsi, mis oli läbi sõltumatu kolmanda osapoole: Mitre Corporation. Mitre kui kõik osalejad kahte lärmakas andmefailide tuleb sobitada ning erinevate meeskondade võistlesid naasta Mitre parim sobitamine. Kuna Mitre ise teadis õiget sobitamise nad suutsid koguda meeskonnad. 40 ettevõtet, mis võistlesid, Catalist jäi teiseks. Selline sõltumatu kolmanda osapoole hindamise patenteeritud tehnoloogia on üsna haruldane ja väga väärtuslikud; see peaks andma meile kindlustunde, et Catalist oma sobitamise kord on sisuliselt juures state-of-the-art. Aga on state-of-the-art piisavalt hea? Lisaks sellele sobiva konkurentsi, Ansolabehere ja Hersh loonud oma sobitamise väljakutse Catalist. Varasemast projekti Ansolabehere ja Hersh oli kogunud valija kirjed Florida. Nad andsid mõned neist arvestust mõne nende valdkondade muutmata et Catalist ja seejärel võrreldakse Catalist aruanded nendes valdkondades oma tegelikke väärtusi. Õnneks Catalist aruanded olid lähedal kinnipeetud väärtusi, mis näitab, et Catalist võiks Osalise sobivuse valija arvestust peale oma master andmefaili. Need kaks väljakutset, üks kolmanda osapoole ja üks Ansolabehere ja Hersh, anna meile rohkem usaldust Catalist sobitamise algoritme, kuigi me ei saa vaadata oma täpse täitmise end.

On olnud palju varasemad katsed kinnitavad hääletamisel. Ülevaate et kirjanduses vt Belli et al. (1999) , Berent, Krosnick, and Lupia (2011) , Ansolabehere and Hersh (2012) , ja Hanmer, Banks, and White (2014) .

On oluline märkida, et kuigi sel juhul teadlased olid julgustatud kvaliteedi andmeid Catalist, teiste hinnanguid kaubandusliku müüjad on vähem entusiastlikud. Teadlased on leidnud halva kvaliteediga, kui uuringute andmeid, et tarbija-faili Marketing Systems Group (mis iseenesest kokku liita andmeid kolme pakkujad: Acxiom, Experian, ja infoUSA) (Pasek et al. 2014) . See tähendab, et andmefail ei sobi uuringu vastuseid, et teadlased arvatavasti õige, andmefail oli puudu andmed suur hulk küsimusi ja puuduvad andmed muster oli korrelatsioonis teatatud uuringu väärtuse (teisisõnu puuduvad andmed oli süstemaatiline mitte juhuslikult).

Täpsemat rekord seost uuringud ja administratiivsed andmed, vaata Sakshaug and Kreuter (2012) ja Schnell (2013) . Täpsemat rekord seose kohta üldiselt vt Dunn (1946) ja Fellegi and Sunter (1969) (ajaloolised) ja Larsen and Winkler (2014) (kaasaegse). Samasugust lähenemisviisi Samuti on välja töötatud infotehnoloogia nimede all, näiteks andmete de dubleerimise, näiteks identifitseerimise, nime sobing eksemplaris avastamise ja dubleerida rekord avastamine (Elmagarmid, Ipeirotis, and Verykios 2007) . On ka privaatsust säilitada lähenemisviise salvestada seosed, mis ei nõua edastamise isikuandmeid (Schnell 2013) . Teadlased Facebook töötatud korra probabilisticsly siduda oma andmed, et hääletamise (Jones et al. 2013) ; see seos tehti hinnata eksperimendi, et ma ütlen teile peatükis 4 (Bond et al. 2012) .

Teine näide sidudes suurte sotsiaalsete uuringu omavalitsuse arvestust pärineb Tervis ja Pensionile Survey ja sotsiaalkindlustusamet. Lisateavet selle uurimuse, sealhulgas teavet nõusoleku protseduuri kohta vt Olson (1996) ja Olson (1999) .

Protsessi ühendades paljud allikad haldus kirjed meister andmefail-protsess, mis Catalist töötajate-on levinud statistikaametite mõne riigi valitsused. Kaks teadlast Rootsi statistikaamet on kirjutatud üksikasjalikult raamatu teemal (Wallgren and Wallgren 2007) . Näitena selle lähenemise maakonnas Ameerika Ühendriigid (Olmsteadi County, Minnesota, kodu Mayo kliiniku), vaata Sauver et al. (2011) . Lisateavet vead, mis võivad esineda administratiivseid andmeid näha Groen (2012) .