Daugiau komentarų

Tai vertimo buvo sukurtas kompiuterio. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

Daugiau komentarų

Šiame skyriuje yra skirtas būti naudojamas kaip nuoroda, o ne būti suprantama kaip aprašomoji.

Įvadas (3.1 skyrius)

Daugelis šiame skyriuje temos taip pat buvo pakartotas per pastaruosius prezidento adresus Amerikos asociacijos viešosios nuomonės tyrimų (AAPOR), pavyzdžiui, Dillman (2002) , Newport (2011) , Santos (2014) , ir Link (2015) .

Daugiau istorinės aplinkybės apie tyrimo mokslinių tyrimų plėtrą žr Smith (1976) ir Converse (1987) . Daugiau apie trijų epochų apklausos tyrimų idėja žr Groves (2011) ir Dillman, Smyth, and Christian (2008) (kuris išyra tris eras šiek tiek kitaip).

Kurių didžiausia perėjimo nuo pirmojo į antrąjį eros apklausos tyrimų viduje yra Groves and Kahn (1979) , kuris daro išsamų galvos į galvą lyginti akis į akį ir apklausa telefonu. Brick and Tucker (2007) atrodo atgal istorinės raidos atsitiktinai skaitmenų rinkimas mėginių ėmimo metodus.

Daugiau kaip apklausa tyrimai pasikeitė praeityje reaguojant į pokyčius visuomenėje, pamatyti Tourangeau (2004) , Mitofsky (1989) , ir Couper (2011) .

Klausia vs stebint (3.2 skirsnis)

Žinios apie vidaus narių klausinėti gali būti problemiškas, nes kartais patys respondentai nežino apie jų vidaus narėse. Pavyzdžiui, Nisbett and Wilson (1977) turėti nuostabų dokumentą su žadinantis pavadinimas: "Kalbėti daugiau nei mes galime žinoti:. Žodinių pranešimų apie psichikos procesus" į popieriaus autoriai sudaryti: "dalykai kartais (a) nežino iš buvimas stimulas, kad svarbiau įtakos atsakymą, (b) nežino atsakymo egzistavimą, ir (c) nežino, kad stimulas paveikė atsakymą. "

Dėl argumentų, kad mokslininkai turėtų nori pastebėtą elgesį pranešė elgesį ar požiūrį, pamatyti Baumeister, Vohs, and Funder (2007) (psichologija) ir Jerolmack and Khan (2014) ir atsakymus (Maynard 2014; Cerulo 2014; Vaisey 2014; Jerolmack and Khan 2014) (sociologija). Skirtumas tarp klausia ir stebint taip pat kyla ekonomika, kur mokslininkai kalbėti apie nurodytų ir atskleidė pageidavimus. Pavyzdžiui, mokslininkas gali paprašyti respondentų, ar jie nori valgyti ledus ar ketinate sporto (nustatytas lengvatas) arba tyrimai galėjo stebėti, kaip dažnai žmonės valgo ledus ir eiti į sporto salę (atskleidė pageidavimus). Yra giliai skepticizmas tam tikrų tipų nurodytų pageidavimus duomenų ekonomika (Hausman 2012) .

Pagrindinis tema iš šių debatų yra tai, kad skelbtas elgesys ne visada tikslūs. Bet, automatiškai įrašomi elgesys gali būti netikslūs, negali būti renkami interesų mėginyje, ir gali būti neprieinami tyrėjams. Taigi, kai kuriais atvejais, manau, kad skelbtas elgesys gali būti naudinga. Be to, antroji pagrindinė tema iš šių debatų yra tai, kad ataskaitos apie emocijų, žinių, lūkesčius ir nuomones ne visada tikslūs. Tačiau, jei informacijos apie šias vidaus narėse reikia mokslininkai-arba padėti paaiškinti kai elgesį arba kaip dalykas turi būti paaiškinta, tada klausia, gali būti tinkamas.

Viso tyrimo paklaida (3.3 skirsnis)

Dėl knyga ilgio gydymo dėl bendro tyrimo klaidos, skaitykite Groves et al. (2009) , arba Weisberg (2005) . Dėl iš viso tyrimo klaidos vystymosi istoriją, pamatyti Groves and Lyberg (2010) .

Kalbant apie atstovavimą, puikus įvadas į nereagavimo ir ne-atsako šališkumo klausimais yra Nacionalinė mokslinių tyrimų taryba ataskaita apie Neatsakymai socialinių mokslų tyrimų: mokslinių tyrimų darbotvarkė (2013) . Kita naudinga apžvalga pateikta (Groves 2006) . Be to, visa speciali klausimais Oficialiosios statistikos leidinyje, viešosios nuomonės ketvirtį, ir American Academy of politinių ir socialinių mokslų analuose buvo paskelbtas neatsakymo tema. Galiausiai, ten iš tikrųjų yra daug skirtingų būdų apskaičiavimo atsako dažnis; Šie metodai yra išsamiai aprašyti į Amerikos asociacija viešosios nuomonės tyrėjų mokslinei veiklai (AAPOR) ataskaitos (Public Opinion Researchers} 2015) .

1936 Literatūrinė Digest "apklausa buvo tiriamas detaliai (Bryson 1976; Squire 1988; Cahalan 1989; Lusinchi 2012) . Taip pat buvo naudojamas kaip palyginime įspėjantys Nesėkmę duomenų rinkimo (Gayo-Avello 2011) . 1936 George Gallup "naudojo sudėtingesnius formą mėginių ėmimo ir galėjo gaminti tikslesnius įverčius su daug mažesniu mėginyje. Gallup "sėkmė per literatūros Digest buvo įvykis iš apklausos tyrimų plėtra (Converse 1987, Ch 3; Ohmer 2006, Ch 4; Igo 2008, Ch 3) .

Kalbant apie matavimus, puikus pirmasis šaltinis projektavimo klausimynų yra Bradburn, Sudman, and Wansink (2004) . Norėdami daugiau pažangių gydymo konkrečiai orientuota į: požiūrio klausimus ieškokite Schuman and Presser (1996) . Daugiau apie išankstinio tyrimo klausimus yra prieinama Presser and Blair (1994) , Presser et al. (2004) , o 8 skyriuje Groves et al. (2009) .

Klasikinis, knyga-ilgis apdorojimas kompromisas tarp tyrimo išlaidas ir tyrimo klaidų yra Groves (2004) .

Kas paklausti (3.4 skyrius)

Klasikinis knyga ilgio gydymo standartinio tikimybinių imčių atranka ir vertinimu yra Lohr (2009) (daugiau įvadinis) ir Särndal, Swensson, and Wretman (2003) (labiau pažengusios). Klasikinis knyga ilgio gydymas po stratifikacijos ir susijusių metodų Särndal and Lundström (2005) . Kai Skaitmeninis amžius parametrus, mokslininkai žino, gana šiek tiek apie ne respondentų, kurie buvo ne dažnai tiesa praeityje. Įvairių formų be atsako reguliavimas yra įmanoma, kai tyrėjams informacijos apie ne respondentų (Kalton and Flores-Cervantes 2003; Smith 2011) .

Xbox tyrimas Wang et al. (2015) naudoja techniką, pavadintą daugiapakopis regresijos ir po stratifikacija (MRP, kartais vadinamas "Mister P"), kuri leidžia mokslininkams apskaičiuoti ląstelių reiškia net tada, kai yra daug, daug ląstelės. Nors kai kurie diskusijos apie įvertinimus iš šio metodo kokybės, atrodo perspektyvus srityje ištirti. Technika pirmą kartą buvo panaudotas Park, Gelman, and Bafumi (2004) , ir ten buvo vėlesnis naudojimas ir diskusijos (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) . Daugiau apie tarp atskirų svorio ir ląstelių pagrindu svorių ryšio pamatyti Gelman (2007) .

Dėl kitų požiūrių į svertinius interneto tyrimus, matyti Schonlau et al. (2009) , Valliant and Dever (2011) , ir Bethlehem (2010) .

Pavyzdys atitikimo pasiūlė Rivers (2007) . Bethlehem (2015) teigia, kad mėginio atitikimo spektaklis iš tikrųjų bus panašus į kitų mėginių ėmimo metodus (pvz, sluoksninės atrankos) ir kitomis valdymo metodų (pvz, po stratifikacijos). Daugiau informacijos apie interneto plokščių žr Callegaro et al. (2014) .

Kartais mokslininkai nustatė, kad tikimybinės imtys ir ne tikimybinės imtys duoti įvertinimus panašios kokybės (Ansolabehere and Schaffner 2014) , bet ir kiti palyginimai parodė, kad ne tikimybinės imtys padaryti blogiau (Malhotra and Krosnick 2007; Yeager et al. 2011) . Viena iš galimų priežasčių šių skirtumų yra tas, kad ne tikimybinės imtys pagerėjo per tam tikrą laiką. Norėdami daugiau pesimistinis atsižvelgiant ne tikimybių imčių metodus matyti, kad AAPOR Task Force ne tikimybinių imčių atranka (Baker et al. 2013) , Ir aš taip pat rekomenduojame skaityti komentarus, kad taip suvestinę ataskaitą.

Dėl duomenų metaanalizės dėl koeficiento sumažinti tendencingumą netikimybinėje mėginių klausimu žr 2.4 lentelę Tourangeau, Conrad, and Couper (2013) , kuris veda autoriams sudaryti "koregavimas atrodo naudinga, bet klysti korekcijos. , . "

Kaip užduoti (3.5 skirsnyje)

Conrad and Schober (2008) pateikia redaguotą apimtis pavadinimu Įsivaizduokite apklausos interviu ateitį, ir tai yra daugelio šiame skyriuje temomis. Couper (2011) nagrinėja panašias temas, o Schober et al. (2015) siūlo gražus pavyzdys, kaip duomenų rinkimo metodai, kurios būtų pritaikytos prie naujos aplinkoje gali sukelti aukštesnės kokybės duomenis.

Dėl dar vieno įdomaus Pavyzdžiui naudojant Facebook apps socialinių mokslų tyrimus, matyti Bail (2015) .

Daugiau patarimų dėl priėmimo apklausos pavers malonia ir vertinga patirtis dalyvių žr darbą tikslines projektavimo metodas (Dillman, Smyth, and Christian 2014) .

Stone et al. (2007) siūlo knyga ilgis gydymo ekologinės trumpalaikis vertinimo ir susijusių metodų.

Apklausos susijusios su kitais duomenimis (3.6 skyrius)

Judson (2007) apibūdino derinant tyrimus ir administracinius duomenis procesą "informacijos integracijos", aptariami kai kurie šio metodo privalumus ir siūlo keletą pavyzdžių.

Kitas būdas, kad mokslininkai gali naudoti skaitmeninius pėdsakus ir administracinių duomenų yra Ėmimo žmonių, turinčių specifinių savybių. Tačiau prieiti prie šių įrašų būti naudojama imčių sistemą taip pat galite sukurti klausimus, susijusius su privatumu (Beskow, Sandler, and Weinberger 2006) .

Dėl papildyta klausia, šis metodas nėra taip nauja kaip gali pasirodyti iš, kaip aš jį apibūdino. Šis požiūris turi gilias jungtis prie trijų didelių teritorijų statistika modelis pagrįstas po stratifikacijos (Little 1993) , trūkstamų reikšmių priskyrimas (Rubin 2004) , o nedidelio ploto apskaičiavimas (Rao and Molina 2015) . Jis taip pat susijęs su surogatinių kintamųjų medicininių tyrimų naudojimo (Pepe 1992) .

Be etinių aspektų susipažinimo skaitmeninius pėdsakus duomenis, papildyta klausia taip pat gali būti naudojamas išvesti jautrių bruožus, kad žmonės gali ne pasirinkti atskleisti apklausoje (Kosinski, Stillwell, and Graepel 2013) .

Išlaidos ir laiko sąmatos Blumenstock, Cadamuro, and On (2015) nurodo daugiau kintamojo sąnaudų vienos papildomos apklausos-ir neapima pastoviųjų sąnaudų išlaidų, kaip antai išlaidų valyti ir apdoroti skambučių duomenis. Apskritai, papildyta klausia tikriausiai turės didelius fiksuotus kaštus ir mažus kintamus kaštus, panašius į skaitmeninių eksperimentų (žr 4 skyrių). Daugiau informacijos apie naudojamų duomenų Blumenstock, Cadamuro, and On (2015) popieriaus yra Blumenstock and Eagle (2010) ir Blumenstock and Eagle (2012) . Požiūriai iš kelių imputuation (Rubin 2004) gali padėti užfiksuoti netikrumą skaičiavimais papildyta paklausti. Jei mokslininkai doing papildyta klausia rūpi tik suvestinius skaičiaus, o ne individualaus lygio bruožų, tada požiūrių King and Lu (2008) ir Hopkins and King (2010) , gali būti naudinga. Daugiau apie mašina mokymosi metodų Blumenstock, Cadamuro, and On (2015) , matyti James et al. (2013) (daugiau įvadinė) arba Hastie, Tibshirani, and Friedman (2009) (labiau pažengusios). Kitas populiarus mašina mokymo vadovėlis yra Murphy (2012) .

Dėl praturtintą klausia, taikomos Ansolabehere ir Hersh rezultatai (2012) priklausys nuo dviejų pagrindinių etapų: 1) CATALIST gebėjimas derinti daug skirtingi duomenų šaltiniai gaminti tikslią meistras datafile ir 2) CATALIST gebėjimas susieti tyrimo duomenis jos magistro datafile. Todėl Ansolabehere ir Hersh atidžiai patikrinti kiekvieną iš šių etapų.

Norėdami sukurti pagrindinį datafile, CATALIST sujungia ir harmonizuoja informaciją iš įvairių šaltinių, įskaitant: kelių balsavimo įrašų kadrų iš kiekvienos valstybės, duomenų iš pašto Nacionalinio kaita Adresas registrą, ir duomenų iš kitų nepatikslintų komercinių paslaugų teikėjams. Kalnai informacijos apie tai, kaip vyksta visa tai valymas ir sujungimas yra už šios knygos taikymo sritį, tačiau šis procesas, nesvarbu, kaip gerai, bus propaguoti klaidų pirminiuose duomenų šaltinių ir pristatys klaidų. Nors CATALIST buvo pasiruošęs aptarti savo duomenis ir teikti kai kurias jo pirminiais duomenimis, tai buvo tiesiog neįmanoma mokslininkai peržiūrėti visą CATALIST duomenų vamzdyną. Atvirkščiai, mokslininkai buvo situacija, kai CATALIST duomenų byla turėjo kai nežinoma, ir turbūt nesuvokiama suma klaidų. Tai rimta problema, nes kritikas gali spėlioti, kad dideli skirtumai tarp tyrimo ataskaitas CCES ir į CATALIST meistras duomenų failo elgesį sukėlė klaidų pagrindinio duomenų failą, o ne klaidingų respondentų.

Ansolabehere ir Hersh paėmė du skirtingus požiūrius sprendžiant duomenų kokybės susirūpinimą. Pirmiausia, be to lyginant savarankiškai pranešė balsavimo balsuojant į CATALIST pagrindinė byla, mokslininkai taip pat palygino save pranešė partija, rasė, rinkėjų registracija statusas (pvz, užregistruota arba neregistruotas) ir balsavimo metodas (pvz, asmeniškai, neatvykęs balsavimo ir tt), šių vertybių rastų CATALIST duomenų bazėse. Dėl šių keturių demografinius kintamuosius, mokslininkai nustatė, daug aukštesnio lygio susitarimu tyrimo ataskaitą ir duomenis CATALIST pagrindinė byla negu balsavimo. Taigi, CATALIST pagrindinių duomenų failas atrodo, kad aukštos kokybės informaciją, išskyrus balsavimo bruožų, tai rodo, kad jis yra ne prastos bendrą kokybę. Antra, iš dalies naudojant duomenis iš CATALIST, Ansolabehere ir Hersh sukūrė tris skirtingas priemones kokybei apskrities balsavimo įrašų, ir jie nustatė, kad apskaičiuota norma per-ataskaitų balsavimo buvo iš esmės nesusijęs su bet kuriuo iš šių duomenų kokybės priemones, išvadą, kad rodo, kad aukšti tempai per-ataskaitos nėra nebūtų galima važiuoti pagal apskritis neįprastai mažos duomenų perdavimo kokybę.

Atsižvelgiant į šio magistro balsavimo bylos sukūrimo, antrasis šaltinis galimų klaidų yra susieti tyrimo dokumentus į jį. Pavyzdžiui, jei šis ryšys yra padaryta netinkamai tai gali sukelti pervertina skirtumo tarp pranešama ir patvirtintas balsavimo elgesiu (Neter, Maynes, and Ramanathan 1965) . Jei kiekvienas žmogus turėjo stabilią, unikalų identifikatorių, kuris buvo abiejų duomenų šaltinių, tada ryšys būtų nereikšmingas. JAV ir daugelyje kitų šalių, tačiau nėra Universal Identifier. Be to, net jei ten buvo toks identifikatorius žmonės turbūt būtų nesiryžta pateikti jį apklausti tyrėjai! Taigi, CATALIST turėjo padaryti sąsają naudojant netobulus identifikatorius, šiuo atveju keturis gabalus informacijos apie kiekvieno respondento: vardas, lytis, gimimo metus ir namų adresą. Pavyzdžiui, CATALIST turėjo nuspręsti, ar Homie J Simpson per CCES buvo tas pats asmuo kaip Homer Jay Simpson savo magistro duomenų failą. Praktiškai, suderinimas yra sudėtinga ir nepatogus procesas, ir padaryti klausimais blogiau už mokslininkų, CATALIST laikomas jo atitikimo technika būti patentuota.

Kad patvirtintų atitikimo algoritmai, jie rėmėsi dviem iššūkiais. Pirma, CATALIST dalyvavo atitikimo konkurencijos, kad buvo paleisti nepriklausoma, trečiosios šalies: Mitre Corporation. MITRE pateikiami visi dalyviai dvi triukšmingų duomenų rinkmenas turi būti suderinta, o skirtingų komandų varžėsi grįžti į Mitre geriausią atitikimo. Kadangi pati MITRE žinojo teisingą atitikimo jie sugebėjo pelnyti komandas. Iš 40 įmonių, kurios varžėsi, CATALIST užėmė antrąją vietą. Ši nepriklausoma trečiosios šalies įvertinimo patentuotą technologiją natūra yra gana retas ir neįtikėtinai vertingas; jis turėtų suteikti mums pasitikėjimo, kad CATALIST pozicijos suderinimo procedūras iš esmės yra ne "state-of-the-art. Bet yra state-of-the-art pakankamai gera? Be šio atitikimo konkurencijos, Ansolabehere ir Hersh sukūrė savo atitikimo iššūkis CATALIST. Nuo ankstesnio projekto, Ansolabehere ir Hersh surinko rinkėjų įrašus iš Floridos. Jie jei kai kurie iš šių įrašų su kai kuriais iš jų laukų redacted į CATALIST ir tada palyginti CATALIST anketa ataskaitas šiose srityse pagal jų faktinį vertybes. Laimei, CATALIST ataskaitos buvo arti išskaičiuotų vertybių, nurodant, kad CATALIST gali sutapti dalinius rinkėjų įrašus į savo meistras duomenų failą. Šie du uždaviniai, vienas pagal trečiosios šalies ir vieną Ansolabehere ir Hersh, duok mums daugiau pasitikėjimo CATALIST atitikimo algoritmai, nors mes negalime peržiūrėti tiksliu jų įgyvendinimo save.

Būta daug ankstesni mėginimai tvirtinti balsavimą. Dėl tos literatūros apžvalgą žr Belli et al. (1999) , Berent, Krosnick, and Lupia (2011) , Ansolabehere and Hersh (2012) , ir Hanmer, Banks, and White (2014) .

Svarbu pažymėti, kad nors šiuo atveju tyrėjai skatinami duomenų kokybės iš CATALIST, kiti vertinimai komercinių pardavėjai buvę mažiau entuziazmo. Mokslininkai nustatė, prastos kokybės, kai duomenys iš tyrimo vartotojui failą iš prekybos Systems Group (kuri pati apjungiant duomenis iš trijų teikėjai: Acxiom, Experian, ir InfoUSA) (Pasek et al. 2014) . Tai reiškia, kad duomenų failas neatitiko apklausos atsakymus, kad mokslininkai tikimasi, bus teisinga, datafile buvo trūkstamus duomenis daug klausimų, ir trūkstamų duomenų modelis buvo susijusi su ataskaitinį tyrimo verte (kitaip tariant, trūksta duomenys buvo sistemingai , o ne atsitiktine tvarka).

Daugiau apie rekordiškai ryšį tarp tyrimų ir administracinių duomenų, matyti Sakshaug and Kreuter (2012) ir Schnell (2013) . Daugiau apie rekordiškai ryšį apskritai pamatyti Dunn (1946) ir Fellegi and Sunter (1969) (historical) ir Larsen and Winkler (2014) (modernus). Panašūs metodai, taip pat buvo sukurta kompiuterių mokslo pagal pavadinimų, kaip antai duomenų Deduplication, pavyzdžiui, identifikavimo, vardas atitikimas, dublikato aptikimo ir dubliuoti rekordinį aptikimo (Elmagarmid, Ipeirotis, and Verykios 2007) . Taip pat yra privatumas išsaugoti požiūrius įrašyti sąsajas, kurios nereikalauja, kad asmenį identifikuojančios informacijos perdavimas (Schnell 2013) . Mokslininkai Facebook sukūrė procedūrą probabilisticsly susieti savo įrašus balsavimo elgesiu (Jones et al. 2013) ; tai ryšys buvo padaryta siekiant įvertinti eksperimentą, kad aš jums papasakoti apie 4 skyriuje (Bond et al. 2012) .

Kitas susiejimas didelio masto socialinę apklausą vyriausybės administracinių įrašų pavyzdys ateina iš Sveikatos apsaugos ir pensijų tyrimo ir Socialinės apsaugos administracija. Daugiau informacijos apie šio tyrimo, įskaitant informaciją apie sutikimą tvarka žr Olson (1996) ir Olson (1999) .

Derinant įvairių šaltinių administracinių įrašų į pagrindinį datafile-proceso, kad CATALIST darbuotojai-įprastas statistikos biurų kai kurių nacionalinių vyriausybių procesas. Du mokslininkai iš Švedijos statistikos parašiau išsamų knyga šia tema (Wallgren and Wallgren 2007) . Dėl šio požiūrio kurioje nors vienoje apygardoje JAV pavyzdys (Olmstead apskritis, Minesota; namų iš Mayo klinikos), žr Sauver et al. (2011) . Daugiau apie klaidas, kurios gali atsirasti administracinių įrašų, pamatyti Groen (2012) .