Dodatne komentar

Ta del je namenjen za uporabo kot referenca, namesto da se glasi pripoved.

  • Uvod (oddelek 3.1)

Veliko teme v tem poglavju so odmevala tudi v nedavnih predsedniških naslovi na Ameriškega združenja za raziskovanje javnega mnenja (AAPOR), kot Dillman (2002) , Newport (2011) , Santos (2014) , in Link (2015) .

Za več zgodovinsko ozadje o razvoju anketne raziskave, glej Smith (1976) in Converse (1987) . Za več informacij o ideji treh obdobij raziskav raziskave, glej Groves (2011) in Dillman, Smyth, and Christian (2008) (ki razbija treh obdobij nekoliko drugače).

Maksimalno znotraj prehodu iz prvega v drugo obdobje v anketne raziskave je Groves and Kahn (1979) , ki pa podrobno head-to-head primerjavo med face-to-face in telefonsko anketo. Brick and Tucker (2007) ozira na zgodovinski razvoj random mestno metod vzorčenja klicanje.

Za več kako raziskava raziskave so v preteklosti spremenili v odziv na spremembe v družbi, glej Tourangeau (2004) , Mitofsky (1989) , in Couper (2011) .

  • Sprašuje vs. opazovanje (oddelek 3.2)

Učenje o notranjih stanj, ki jih postavljajo vprašanja je lahko problematično, saj so anketiranci sami včasih ne zavedajo svojih notranjih stanj. Na primer, Nisbett and Wilson (1977) ima čudovit papir z domiselnim naslovom: "Pripovedovanje več kot lahko vemo. Verbalna poročila o duševnih procesov" V članku so avtorji sklepajo: "predmeti so včasih (a) ne zavedajo obstoj dražljaj, ki pomembno vplivajo na odziv, (b) zavedajo obstoja odziv, in (c) nepoznavanju da je spodbuda vplivala na odziv. "

Za trditev, da naj bi raziskovalci raje opaženo obnašanje, da poroča ravnanja ali vedenja, glej Baumeister, Vohs, and Funder (2007) (psihologija) in Jerolmack and Khan (2014) in odzivov (Maynard 2014; Cerulo 2014; Vaisey 2014; Jerolmack and Khan 2014) (sociologija). Razlika med prosi in opazovanje tudi izhaja iz ekonomije, kjer so raziskovalci govorijo o navedenih in razkrila preferenc. Na primer, lahko raziskovalec vprašati anketirance, ali so raje jedo sladoled ali odidejo v telovadnico (navedene nastavitve) ali raziskave lahko opazujemo, kako pogosto ljudje jedo sladoled in iti v telovadnici (odkritih preferenc). Tam je globoko skepticizem nekaterih vrst navedenih podatkov preferenc v ekonomiji (Hausman 2012) .

Glavna tema teh razprav je, da so poročali vedenje ni vedno točna. Ampak, samodejno posnameta obnašanje ne sme biti točni, ne sme biti zbrani na vzorcu interesa, in ne smejo biti dostopni raziskovalcem. Tako je v nekaterih primerih, mislim, da lahko poročali vedenje koristno. Nadalje, druga glavna tema teh razprav je, da poročila o čustvih, znanja, pričakovanja in mnenja niso vedno točni. Toda, če jih je potrebno informacije o teh notranjih stanj raziskovalci, bodisi, da pomaga razložiti nekaj vedenje ali kot da stvar pojasniti, nato prosi lahko primerno.

  • Skupaj napaka raziskava (oddelek 3.3)

Za dolžino knjiga zdravljenja na skupne napake raziskave, glej Groves et al. (2009) ali Weisberg (2005) . Za zgodovino razvoja skupne napake raziskave, glej Groves and Lyberg (2010) .

V zvezi z zastopanjem, odličen uvod v problematiko ne odziva in ne odziva pristranskosti je poročilo Nacionalnega raziskovalnega sveta na NEODGOVOROV v Social Science Ankete: raziskovalni program (2013) . Še en koristen pregled zagotavljajo (Groves 2006) . Tudi celotna posebna vprašanja Journal of uradne statistike, Public Opinion Quarterly, in The Annals of American Academy of političnih in družbenih ved so bili objavljeni na temo neodzivnosti. Na koncu pa so dejansko veliko različnih načinov za izračun stopnje odziva; Ti pristopi so podrobno opisani v poročilu Ameriškega združenja javnega mnenja raziskovalcev (AAPOR) (Public Opinion Researchers} 2015) .

1936 Literary Digest anketa je podrobno preučiti (Bryson 1976; Squire 1988; Cahalan 1989; Lusinchi 2012) . To je bil uporabljen tudi kot parabolo opozarjajo pred naključno zbiranje podatkov (Gayo-Avello 2011) . Leta 1936 je George Gallup uporablja bolj prefinjeno obliko vzorčenja in je sposobna proizvesti natančnejše ocene z veliko manjši vzorec. Uspeh Gallup nad literarnega Digest je bil mejnik razvoj anketne raziskave (Converse 1987, Ch 3; Ohmer 2006, Ch 4; Igo 2008, Ch 3) .

V zvezi z merjenjem, odličen prvi vir za oblikovanje vprašalnikov je Bradburn, Sudman, and Wansink (2004) . Za bolj napredno zdravljenje se osredotoča predvsem na odnos vprašanja, glej Schuman and Presser (1996) . Več na vprašanja predhodno testiranje je na voljo v Presser and Blair (1994) , Presser et al. (2004) , in poglavje 8 Groves et al. (2009) .

Zdravljenje Klasični, knjig dolžina kompromis med stroški raziskovanja in napake pri pregledih je Groves (2004) .

  • Koga vprašati (oddelek 3.4)

Klasična obdelava knjig dolžina standardne verjetnostnega vzorčenja in ocenjevanja so Lohr (2009) (več uvodni) in Särndal, Swensson, and Wretman (2003) (naprednejši). Klasična obdelava knjig dolžina post-stratifikacije in podobnih metod je Särndal and Lundström (2005) . V nekaterih digitalnih okoljih starostnih, raziskovalci veš zelo malo o tujih anketirancev, ki ni bil pogosto drži v preteklosti. Različne oblike prilagoditve neodgovorov so možne, če imajo raziskovalci podatke o tujih anketirancev (Kalton and Flores-Cervantes 2003; Smith 2011) .

Študija Xbox of Wang et al. (2015) uporablja tehniko, imenovano ravneh regresija in post-stratifikacije (MRP, včasih imenovano "Gospod P"), ki omogoča raziskovalcem oceniti celica pomeni tudi takrat, ko obstaja veliko, veliko celic. Čeprav obstaja nekaj razprave o kakovosti ocen s to tehniko, se zdi, kot obetavno področje za raziskovanje. Tehnika je bil prvič uporabljen v Park, Gelman, and Bafumi (2004) , in če je bil kasnejšo uporabo in razprava (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) . Za več informacij o povezavi med posameznimi ponderji in uteži, ki temeljijo na mobilnih glej Gelman (2007) .

Za druge pristope s korekcijskimi spletnih anket, glej Schonlau et al. (2009) , Valliant and Dever (2011) , in Bethlehem (2010) .

Vzorec ujemanje ga je predlagal Rivers (2007) . Bethlehem (2015) trdi, da se bo dejansko izvajanje ujemanja vzorca podobno kot druge pristope vzorčenja (npr slojevit vzorčenja) in drugih pristopov prilagajanja (npr post-stratifikacije). Za več informacij o spletnih panelov, glej Callegaro et al. (2014) .

Včasih so raziskovalci ugotovili, da verjetnostni vzorci in non-verjetnostni vzorci dobimo ocene podobne kakovosti (Ansolabehere and Schaffner 2014) , pa tudi druge primerjave so ugotovili, da ni verjetnostni vzorci slabše (Malhotra and Krosnick 2007; Yeager et al. 2011) . Eden od možnih razlogov za te razlike je, da ni verjetnosti vzorci sčasoma izboljšali. Za bolj pesimistični glede metod vzorčenja ni verjetnosti videli delovno skupino AAPOR na Non-verjetnostno vzorčenje (Baker et al. 2013) , pa tudi jaz priporočam branje komentar, ki sledi zbirno poročilo.

Pri metaanalizi o učinku utežjo za zmanjšanje pristranskosti pri ne-verjetnosti vzorcev, glej tabelo 2.4 v Tourangeau, Conrad, and Couper (2013) , ki vodi avtorje, naj sklenejo "prilagoditve zdi, da so koristni, vendar fallible popravki. . ".

  • Kako postaviti (oddelek 3.5)

Conrad and Schober (2008) zagotavlja urejeno obseg naslovom viziranje anketi z intervjujem v prihodnosti, in obravnava številne teme v tem oddelku. Couper (2011) obravnava podobne teme in Schober et al. (2015) ponuja lep primer, kako lahko metode zbiranja podatkov, ki so prilagojene na novo okolje odražalo v višjih kakovostnih podatkov.

Za en zanimiv primer uporabe Facebook aplikacije za raziskovanja družboslovnih glej Bail (2015) .

Za več nasvetov o izdelavo Ankete prijetno in dragoceno izkušnjo za udeležence, glej delo na področju oblikovanja metode, prilagojene (Dillman, Smyth, and Christian 2014) .

Stone et al. (2007) ponuja obravnavo dolžino knjige ekološko trenutne ocene in sorodnimi metodami.

  • Raziskave, povezane z drugimi podatki (oddelek 3.6)

Judson (2007) opisal proces združevanja raziskav in administrativne podatke kot "integracijo informacij," obravnava nekatere prednosti tega pristopa, in ponuja nekaj primerov.

Drug način, da lahko raziskovalci uporabljajo digitalne sledi in administrativne podatke je vzorčni okvir za ljudi s posebnimi lastnostmi. Vendar pa je dostop do te evidence, ki se uporabljajo kot vzorčni okvir lahko ustvarite tudi vprašanja v zvezi z zasebnostjo (Beskow, Sandler, and Weinberger 2006) .

Glede ojačeno s poizvedbami, ta pristop ni tako nova, kot se morda zdi od tega, kako sem ga opisal. Ta pristop ima globoke povezave do treh velikih območij v osnovi statističnih podatkov za model, post-stratifikacije (Little 1993) , vračunavanje (Rubin 2004) , in ocena majhno območje (Rao and Molina 2015) . To je povezano tudi z uporabo nadomestnih spremenljivk v medicinske raziskave (Pepe 1992) .

Poleg etičnih vprašanj v zvezi dostop do podatkov digitalnih sledovih, bi pomnožili želenih lahko uporabljajo tudi za sklepanje občutljivih lastnosti, ki jih ljudje ne bi se odločijo, da razkrije v raziskavi (Kosinski, Stillwell, and Graepel 2013) .

Ocene stroškov in časa v Blumenstock, Cadamuro, and On (2015) se nanašajo bolj spremenljivi stroški in stroški ene dodatni pregled, in ne vključuje fiksnih stroškov, kot so stroški za čiščenje in obdelavo podatkov klicev. Na splošno bo dopolnjena želenih verjetno imajo visoke fiksne stroške in nizke variabilne stroške, ki so podobne digitalne poskusov (glej poglavje 4). Več podrobnosti o podatkih, ki se uporabljajo v Blumenstock, Cadamuro, and On (2015) papir v Blumenstock and Eagle (2010) in Blumenstock and Eagle (2012) . Pristopi multiple imputuation (Rubin 2004) bi lahko pomagal pri zajemanju negotovost pri ocenah ojačeno asking. Če pri raziskovalci pomnožili sprašuje samo skrbi agregat šteje, ne pa lastnosti posameznika na ravni, nato pa pristopi King and Lu (2008) in Hopkins and King (2010) je lahko koristna. Za več informacij o strojnega učenja pristopov v Blumenstock, Cadamuro, and On (2015) , glej James et al. (2013) (več uvodni) ali Hastie, Tibshirani, and Friedman (2009) (naprednejši). Druga priljubljena strojno učenje učbenik je Murphy (2012) .

Glede obogatenega vprašate, rezultati v Ansolabehere in Hersh (2012) Tečaj o dveh ključnih korakih: 1) sposobnost katalizator združiti številne raznolike vire podatkov za izdelavo natančne glavno datafile in 2) sposobnost katalizator za povezovanje anketnih podatkov za poveljnik datafile. Zato Ansolabehere in Hersh preveri vsako od teh korakov previdno.

Če želite ustvariti glavno datafile, Catalist združuje in usklajuje podatke iz različnih virov, vključno: več zapisov glasovalne posnetke iz vsake države, podatke iz državnega spremembe Pošte dne Naslov registru, in podatkov iz drugih nedoločenih komercialnih ponudnikov. Neprijetne podrobnosti o tem, kako vse to čiščenje in združitev zgodi, so izven področja uporabe te knjige, vendar je to proces, ne glede na to, kako previdni, bo širijo napake v prvotnih podatkovnih virov in bo napak. Čeprav je Catalist pripravljeni razpravljati njeno obdelavo podatkov in zagotavljajo nekatere njegove neobdelanih podatkov, je bilo preprosto nemogoče, da raziskovalci pregledali celotno podatkovno plinovod katalizator. Namesto tega so raziskovalci v položaju, v katerem so podatki datoteka Catalist imel neko neznano, in morda neznanem, količino napake. To je resen problem, saj lahko kritik domnevajo, da so velike razlike med poročil raziskave o CCES in obnašanje v glavno podatkovno datoteko katalizator napake povzročil v datoteki master podatkov, ne pa napačno poročanje anketiranci.

Ansolabehere in Hersh vzel dva različna pristopa k obravnavanju kakovosti podatkov zaskrbljenost. Prvič, poleg primerjave glasovanje samostojno poročali glasovanjem v glavni dokumentaciji katalizator, primerjali tudi raziskovalci sami poročajo stranka, raso, stanje registracije volivcev (na primer, registrirana ali ni registriran) in način glasovanja (npr osebno, odsotni glasovanje, itd), na tiste vrednosti, ugotovljenih pri podatkovnih bazah katalizator. V teh štirih demografskih spremenljivkah, so raziskovalci ugotovili, precej višjo raven sporazuma med poročilu raziskave in podatkov v glavni datoteki katalizator kot za glasovanje. Tako se zdi, da Catalist master datoteke s podatki, da so visoko kakovostne informacije za druge namene kot glasovanje lastnosti, kar pomeni, da ne gre za slabe celovite kakovosti. Drugič, delno z uporabo podatkov iz katalizator, Ansolabehere in Hersh razvili tri različne ukrepe kakovosti evidence volilne občine, in so ugotovili, da je bila ocenjena stopnja prekomernega poročanja o glasovanju v glavnem povezana z katero koli od teh ukrepov glede kakovosti podatkov, ugotovitev, da kažejo, da so visoke stopnje prekomernega poročanja ne s okrajih vozi z neobičajno nizke kakovosti podatkov.

Glede na nastanek tega glavnega glasovanja datoteke, drugi vir morebitne napake se povezuje evidence raziskave z njo. Na primer, če je ta povezava izvedena pravilno, da bi lahko privedlo do prekomernega oceni razlike med poročali in potrjena glasovalnem obnašanju (Neter, Maynes, and Ramanathan 1965) . Če bi vsaka oseba imela stabilno, edinstven identifikator, ki je bil v obeh virov podatkov, potem bi povezava nepomembno. V ZDA in v večini drugih držav, pa ne obstaja univerzalni identifikator. Poleg tega, tudi če bi tak identifikator ljudje verjetno bi okleval, da se zagotovi, da bodo ugotavljale raziskovalce! Tako je bilo Catalist narediti povezavo z uporabo nepopolne identifikatorjev, v tem primeru štiri informacijami o posameznih anketiranca: ime, spol, leto rojstva in domači naslov. Na primer, je bilo Catalist odločiti, če Homie J Simpson v CCES bila ista oseba kot Homer Jay Simpson v svojih matičnih podatkov spisa. V praksi, ujemanje je težko in grdo postopek, in da bi zadeve še slabše za raziskovalce, Catalist preučil njeno ujemanje tehniko, da je lastniški.

Za potrditev ujemanja algoritme, ki se sklicuje na dva izziva. Prvič, Catalist sodeloval na ujemanje konkurenco, ki jo je izvedla neodvisna, tretji osebi: na Mitre Corporation. Mitre če vsem udeležencem dve hrupne podatkovne datoteke, ki se ujemajo, in različne ekipe pomerile za vrnitev na Mitre najboljše ujemanje. Ker Mitre sam vedel pravilnega ujemanja so lahko rezultat ekipe. Od 40 podjetij, ki so se pomerili, Catalist prišel na drugo mesto. Ta vrsta neodvisnih in tretjih oseb vrednotenje lastne tehnologije je precej redka in izjemno dragoceno; to naj bi nam zaupanje, da so postopki iskanja ujemanja katalizator v bistvu na state-of-the-art. Vendar je state-of-the-art dovolj dobra? Poleg tega ujemanja konkurence, Ansolabehere in Hersh ustvarili svojo ujemanja izziv za katalizator. Od prejšnjega projekta, Ansolabehere in Hersh je zbral volivcev zapisov iz Floride. Zagotovili so nekatere od teh evidenc z nekaterimi svojih področjih oblikovani, da katalizator in nato primerjali poročila katalizator na teh področjih na njihove dejanske vrednosti. Na srečo, so poročali katalizator je blizu, zadržanih vrednot, kar pomeni, da bi lahko Catalist ujemajo z delnimi volivcev evidence na njihovo glavno podatkovno datoteko. Ta dva izziva, eno za tretje osebe in enega Ansolabehere in Hersh, da nam več zaupanja v ujemanja algoritmov katalizator, čeprav ne moremo pregledati njihovo natančno izvajanje sebe.

Tam je bilo veliko predhodni poskusi, da bi preverili glasovanje. Za pregled te literature, glej Belli et al. (1999) , Berent, Krosnick, and Lupia (2011) , Ansolabehere and Hersh (2012) , in Hanmer, Banks, and White (2014) .

Pomembno je poudariti, da čeprav je v tem primeru so raziskovalci spodbujati s kakovostjo podatkov iz katalizator, so druge ocene komercialnih ponudnikov bili manj navdušeni. Raziskovalci so ugotovili, slabe kakovosti, če podatki iz ankete do potrošnikov-datoteke iz Marketing Systems Group (kar samo po sebi združene podatke iz treh ponudnikov: Acxiom, Experian, in infoUSA) (Pasek et al. 2014) . To pomeni, da datoteka podatkov ne ujema z odgovori v anketi, ki jih raziskovalci pričakuje, da bo pravilna, datafile je manjkajoče podatke za veliko število vprašanj, in manjkajočih podatkov vzorca je bila povezana z poročali ankete vrednosti (z drugimi besedami, manjkajoče podatke je bila sistematično ne naključno).

Za več informacij o rekordnem povezave med raziskavami in drugih podatkov, glej Sakshaug and Kreuter (2012) in Schnell (2013) . Za več informacij o rekordnem povezovanja na splošno, glej Dunn (1946) in Fellegi and Sunter (1969) (zgodovinsko) in Larsen and Winkler (2014) (sodobno). Podobni pristopi so bili razviti tudi na področju računalništva pod imeni, kot so deduplication podatkov, identifikacijo primer, ime ujemanja, dvojnik odkrivanje in podvojene odkrivanje zapis (Elmagarmid, Ipeirotis, and Verykios 2007) . Obstajajo tudi zasebnost ohranjanje pristope za snemanje povezavo, ki ne zahtevajo prenos osebnih podatkih (Schnell 2013) . Raziskovalci na Facebook razvil postopek za probabilisticsly povezati svoje zapise na glasovalno obnašanje (Jones et al. 2013) ; Ta povezava je bilo storjeno, da oceni poskus, da vam bom povedal o tem v poglavju 4 (Bond et al. 2012) .

Drug primer povezovanja obsežno družbeno raziskavo do upravnih evidenc državnih prihaja iz zdravje in ankete pokojninsko in socialno varnost Administration. Za več informacij o tej študiji, vključno z informacijami o postopku soglasja glej Olson (1996) in Olson (1999) .

Proces združevanja različnih virov administrativnih evidenc v glavno datafile-proces, ki-je zaposleni katalizator pogosta v statističnih uradih nekaterih nacionalnih vlad. Dve raziskovalci iz švedskem statističnem napisal podrobno knjigo na to temo (Wallgren and Wallgren 2007) . Za primer tega pristopa v posameznem okraju, v Združenih državah Amerike (Olmstead County, Minnesota, Dom na kliniki Mayo), glej Sauver et al. (2011) . Za več informacij o napakah, ki se lahko pojavljajo v upravnih evidenc, glej Groen (2012) .