további kommentár

Ez a fordítás által létrehozott egy számítógép. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

további kommentár

Ez a szakasz célja, hogy kell használni, mint a referencia, ahelyett, hogy kell értelmezni, mint egy elbeszélés.

Bevezetés (3.1)

Sok a témák ebben a fejezetben is visszhangzott az elmúlt elnöki címek az American Association of Public Opinion Research (AAPOR), mint például a Dillman (2002) , Newport (2011) , Santos (2014) , és a Link (2015) .

További történelmi háttér fejezi ki a kérdőíves kutatás, lásd Smith (1976) és a Converse (1987) . Az inkább a gondolat három korok kérdőíves kutatás, lásd Groves (2011) és Dillman, Smyth, and Christian (2008) (amely szakít a három korszakra kicsit másképp).

A csúcs belsejében átmenet az első és a második korszak felmérés kutatás Groves and Kahn (1979) , amely nem egy részletes fej-fej összehasonlítást a face-to-face és telefonos felmérés. Brick and Tucker (2007) néz vissza a történelmi fejlődés a véletlenszerű számjegyű tárcsázás mintavételi módszereket.

További hogyan kérdőíves kutatás változott az elmúlt válaszként a társadalmi változásokra, lásd Tourangeau (2004) , Mitofsky (1989) , és Couper (2011) .

Kérdezi vs. megfigyelése (3.2 fejezet)

Megismerése belső állapotok kérdéseket problémás lehet, mert néha a válaszadók maguk nincsenek tisztában a belső állapotok. Például Nisbett and Wilson (1977) egy csodálatos papírt a hangulatos címe: "beállítva több mint tudhatjuk: Szóbeli jelentések a mentális folyamatokat." A papír a szerzők: "tárgyak néha (a) nem tudott a megléte inger fontosabb befolyásolta a válasz, (b) nem tudott a létezéséről a választ, és (c) tudatában annak, hogy az inger érintette a választ. "

Mert érvek, amelyek a kutatókat inkább megfigyelhető viselkedés jelentett viselkedés vagy magatartás, lásd Baumeister, Vohs, and Funder (2007) (pszichológia) Jerolmack and Khan (2014) és a válaszok (Maynard 2014; Cerulo 2014; Vaisey 2014; Jerolmack and Khan 2014) (szociológia). A különbség kér, és megfigyeljük is felmerül a közgazdaságtan, ahol a kutatók beszélnek tüntetni, és kinyilvánított preferenciák. Például egy kutató kérheti a válaszadók, hogy azok inkább eszik fagylaltot, vagy megy a tornaterem (megadott preferenciák), illetve a kutatás is megfigyelni, hogy milyen gyakran eszik fagylaltot, és menjen az edzőterembe (kinyilvánított preferenciák). Van mély szkepticizmus bizonyos típusú megadott preferenciák adatok közgazdász (Hausman 2012) .

A fő téma ezen viták jelentett viselkedés nem mindig pontos. De, automatikusan rögzített viselkedés nem lehet pontos, nem lehet gyűjteni egy mintát az érdeklődés, és nem lehet hozzáférhető a kutatók. Így bizonyos helyzetekben, úgy gondolom, hogy jelentett viselkedés igen hasznos lehet. Továbbá egy másik fő témája e viták az, hogy tudósít az érzelmek, a tudás, az elvárások és vélemények nem mindig pontosak. De, ha információt ezekről a belső állapotokra van szükség a kutatók-sem segít megmagyarázni néhány viselkedés vagy a dolog, hogy magyarázható-majd felkérte megfelelő lehet.

Összesen felmérés hiba (3.3)

Mert a könyv hossza kezelések teljes felmérés hiba, lásd Groves et al. (2009) vagy a Weisberg (2005) . Egy fejlődésének története a teljes felmérés hiba, lásd Groves and Lyberg (2010) .

Ami a képviselet, a nagy bevezetés a kérdések nem válasz és a válasz elmaradásának torzítás a Nemzeti Kutatási Tanács jelentést Nonresponse Társadalomtudományi Felmérések: A kutatási menetrend (2013) . Egy másik hasznos áttekintést nyújt (Groves 2006) . Emellett teljes speciális kérdései a Journal hivatalos statisztikák, Közvélemény Quarterly, és az Annals of the American Academy of Politikai és Társadalomtudományi tettek közzé a témában nem választ. Végül vannak valójában sok különböző módszerek alapján a válaszadási arány; E megközelítések részletesen a jelentés az American Association of a közvélemény-kutatók (AAPOR) (Public Opinion Researchers} 2015) .

A 1936 Irodalmi Digest felmérése azt vizsgálták részletesen (Bryson 1976; Squire 1988; Cahalan 1989; Lusinchi 2012) . Azt is használják, mint egy példázatot óva rendszertelenül adatgyűjtés (Gayo-Avello 2011) . 1936-ban George Gallup használt kifinomultabb formája a mintavétel, és képes volt a pontosabb becsléseket jóval kisebb mintán. Gallup sikere az irodalom Digest mérföldkő volt a fejlődés kérdőíves kutatás (Converse 1987, Ch 3; Ohmer 2006, Ch 4; Igo 2008, Ch 3) .

Ami a mérés, a nagy első erőforrás tervezéséhez kérdőívek Bradburn, Sudman, and Wansink (2004) . Egy fejlettebb kezelés kifejezetten az attitűd kérdések, lásd Schuman and Presser (1996) . Bővebben az előzetes vizsgálatok kérdésre kapható Presser and Blair (1994) , Presser et al. (2004) , a 8. fejezet a Groves et al. (2009) .

A klasszikus, könyv hosszúságú kezelése közötti kompromisszum a felmérés költségeit és felmérési hibák Groves (2004) .

Ki kell kérni (3.4)

Klasszikus könyv hosszúságú kezelés standard valószínűségi mintavétel becslési Lohr (2009) (több bevezető) és Särndal, Swensson, and Wretman (2003) (fejlettebb). A klasszikus könyv hosszúságú kezelés utáni rétegződés és a kapcsolódó módszerek Särndal and Lundström (2005) . Egyes digitális korban beállítások kutatók tudják elég egy kicsit a nem válaszolók, ami nem volt igaz, sokszor a múltban. Különböző formái nem válasz beállítás akkor lehetséges, ha a kutatók információnk nem válaszolók (Kalton and Flores-Cervantes 2003; Smith 2011) .

Az Xbox tanulmányozása Wang et al. (2015) használja a technikát nevezik többszintű regresszió és a poszt-rétegződés (MRP, néha "Mister P"), amely lehetővé teszi a kutatók becslése cella azt jelenti, még ha sok, sok sejt. Bár van némi vita a minőségi becslések ezt a technikát, úgy tűnik, mintha egy ígéretes terület feltárására. A technikát használta először a Park, Gelman, and Bafumi (2004) , és ott már azt követő használat és vita (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) . Az inkább a kapcsolat az egyes súlyok és a sejt-alapú súlyok lásd Gelman (2007) .

Más megközelítések súlyozás internetes felmérés, lásd Schonlau et al. (2009) , Valliant and Dever (2011) , és a Bethlehem (2010) .

Minta megfelelő javasolta Rivers (2007) . Bethlehem (2015) azt állítja, hogy a teljesítmény a minta megfelelő valóban lesz hasonló a többi mintavételi módszerek (pl rétegzett mintavétel) és egyéb kiigazítási módszerek (pl utáni rétegződés). További online panelek, lásd Callegaro et al. (2014) .

Néha a kutatók azt találták, hogy valószínűségi mintákon és nem valószínűségi mintát kapunk becslések hasonló minőségű (Ansolabehere and Schaffner 2014) , de más összehasonlítások azt találták, hogy a nem valószínűségi mintákon nem rosszabb (Malhotra and Krosnick 2007; Yeager et al. 2011) . Az egyik lehetséges oka az ilyen különbség, hogy nem valószínűségi mintát idővel javultak. Egy még pesszimista nem valószínűségi mintavételi módszerek Lásd az AAPOR Task Force on Non-valószínűségi mintavétel (Baker et al. 2013) , és én is ajánlom a kommentár, amely követi az összefoglaló jelentést.

Egy meta-analízis a hatását súlyozás csökkenteni elfogultság nem valószínűségi minta, lásd 2.4 Tourangeau, Conrad, and Couper (2013) , ami a szerzők megkötésére "korrekciók úgy tűnik, hogy hasznos, de esendő korrekciókat. . ".

Hogyan kell kérni (3.5 fejezet)

Conrad and Schober (2008) ad egy szerkesztett kötetben derített fényt a felmérést a jövő, valamint foglalkoznak számos olyan téma, ebben a szakaszban. Couper (2011) foglalkozik hasonló témában, és Schober et al. (2015) kínál egy szép példája annak, hogy az adatgyűjtési módszerek, amelyek igazodnak az új beállítás a magasabb minőségű adatokat.

Egy másik érdekes példa a Facebook alkalmazások társadalomtudományi felmérések, lásd Bail (2015) .

További tanácsot, hogy felmérések élvezetes és értékes tapasztalatokat a résztvevők számára, hogy munka szabott tervezési módszer (Dillman, Smyth, and Christian 2014) .

Stone et al. (2007) kínál egy könyv hosszúságú kezelésére ökológiai pillanatnyi értékelés és kapcsolódó módszereket.

Felmérések kapcsolódó egyéb adatokat (3.6)

Judson (2007) írta le a folyamatot, amely ötvözi felmérések és közigazgatási adatok "információs integráció" bemutatja néhány előnye ennek a megközelítésnek, és néhány példát.

Egy másik módja, hogy a kutatók a digitális nyomok és adminisztratív adatok a mintavételi keret emberek sajátosságait. Azonban ezekhez rekordokat kell használni a mintavételi keret is létrehozható kapcsolatos kérdések adatvédelmi (Beskow, Sandler, and Weinberger 2006) .

Ami erősített kért, ez a megközelítés nem új, mint amilyennek tűnik ki, hogyan tudtam leírta. Ez a megközelítés a mély kapcsolatok három nagy területen a statisztika-modell alapú utólagos rétegzés (Little 1993) , beszámítás (Rubin 2004) , és a kis terület becslését (Rao and Molina 2015) . Ez is kapcsolódik a használatát helyettesítő változók az orvosi kutatás (Pepe 1992) .

Amellett, hogy az etikai kérdések kapcsán elérésével digitális nyomkövetési adatok erősített kért is fel lehetne használni arra következtetni, érzékeny tulajdonságok, hogy az emberek esetleg nem dönt, hogy felfedje egy felmérés (Kosinski, Stillwell, and Graepel 2013) .

A költség és idő becslések Blumenstock, Cadamuro, and On (2015) utalni, hogy a változó költségek a költségek egy további felmérés-és nem tartalmazzák az állandó költségek, mint például a költség a tiszta és feldolgozza a hívás adatait. Általában, erősített kért valószínűleg magas fix költségek és az alacsony változó költségek hasonló digitális kísérletek (lásd a 4. fejezetet). További részletek a felhasznált adatok Blumenstock, Cadamuro, and On (2015) papír vannak Blumenstock and Eagle (2010) és Blumenstock and Eagle (2012) . Megközelítések több imputuation (Rubin 2004) segíthet elfog a bizonytalanság becslései erősített kért. Ha a kutatók doing erősített kérdezi csak érdekel aggregált számít, nem pedig az egyes szintű tulajdonságok, majd a megközelítések King and Lu (2008) és a Hopkins and King (2010) hasznos lehet. Ha többet szeretne megtudni a gépi tanulási megközelítések Blumenstock, Cadamuro, and On (2015) , lásd James et al. (2013) (több bevezető) vagy Hastie, Tibshirani, and Friedman (2009) (fejlettebb). Egy másik népszerű gépi tanulás tankönyv Murphy (2012) .

Ami dúsított kért, az eredmények Ansolabehere és Hersh (2012) zsanér két fő lépésből áll: 1) a képessége Catalist kombinálni sok eltérő adatforrásokat, hogy készítsen egy pontos mester adatfájlt és 2) a képesség Catalist összekapcsolni a felmérés adatait a mester adatfájlt. Ezért Ansolabehere és Hersh ellenőrizze egyes lépéseket figyelmesen.

Létrehozásához a mester adatfájl, Catalist egyesíti, és harmonizál információkat különböző forrásokból, beleértve: a többszörös szavazati bejegyzések pillanatfelvételek minden állam, az adatokat a Post Office Nemzeti mail cím megváltoztatása Registry, és az adatok más meghatározhatatlan kereskedelmi szolgáltatók. A véres részleteket, hogy mindez a tisztítást és összevonása történik kívül esnek ezen könyv, de ez a folyamat, nem számít, mennyire óvatos, akkor terjednek hibák az eredeti adatforrások és bevezeti a hibákat. Bár Catalist volt hajlandó megvitatni adatfeldolgozó, és néhány nyers adatok, ez egyszerűen lehetetlen volt a kutatók számára, hogy vizsgálja felül a teljes Catalist adatok gázvezeték. Ehelyett a kutatók egy olyan helyzetben, ahol a Catalist adatállomány volt néhány ismeretlen, és talán megismerhetetlen, mennyisége hiba. Ez komoly aggodalomra ad okot, mert a kritikus lehet spekulálni, hogy a nagy különbség a vizsgálati jelentésekből a CCES és a viselkedés a Catalist mester adatfájlt okozta hibákat a törzsadatok fájlt, nem téves adatszolgáltatások a válaszadók.

Ansolabehere és Hersh vett két különböző megközelítést kezelése az adatok minőségét érintik. Először is, amellett, hogy összehasonlítjuk az önbevalláson szavazás szavaz a Catalist master file, a kutatók azt is, mint az önbevalláson párt, faj, szavazók regisztrációs állapotát (például regisztrált vagy nem regisztrált) és a szavazási módszer (pl személyesen, vételi szavazás, stb), hogy ezeket az értékeket találtak a Catalist adatbázisokban. A négy demográfiai változók, a kutatók azt találták, sokkal magasabb szintű megállapodása vizsgálati jelentést és az adatokat az Catalist master file, mint a szavazás. Így a Catalist törzsadatok fájlt, úgy tűnik, jó minőségű információ vonások eltérő szavazási, ami arra utal, hogy nem a rossz általános minőségét. Másodszor, részben származó adatok felhasználásával Catalist, Ansolabehere és Hersh kifejlesztett három különböző intézkedések minőségének megye szavazási eredmények, és úgy találták, hogy a becsült aránya túlzott jelentési szavazati lényegében független Ezen adatok minőségbiztosítási intézkedések, annak megállapítása, hogy arra utalnak, hogy a magas árak túlzott jelentési amelyeket nem hajtja megyében szokatlanul alacsony adatok minőségét.

Mivel a teremtés a mester szavazás fájlt, a másik forrás a lehetséges hibák is összeköti a nyilvántartásokat hozzá. Például, ha ez a kapcsolat a helytelenül végzett vezethet fölébecslés közötti különbség bejelentett és hitelesített szavazási magatartás (Neter, Maynes, and Ramanathan 1965) . Ha minden személynek volt stabil, egyedi azonosítóval, amely volt mind az adatforrások, majd kapcsolat lenne triviális. Az Egyesült Államokban és a legtöbb más országban azonban nincs olyan univerzális azonosító. Továbbá, még ha nem is ez az azonosító az emberek valószínűleg szívesen bocsát felmérésére a kutatók! Így Catalist kellett tennie a kapcsolatot a tökéletlen azonosítók, ebben az esetben négy darab információ minden egyes válaszadó: név, nem, születési év, és az otthoni címét. Például Catalist kellett eldöntenie, hogy az Homie J Simpson a CCES volt ugyanaz a személy, mint a Homer Jay Simpson törzsadataikat fájlt. A gyakorlatban megfelelő nehéz és piszkos folyamat, és tovább ront a helyzeten a kutatók számára, Catalist tekinthető annak megfelelő technikát kell védettnek.

Annak érdekében, hogy érvényesítse a megfelelő algoritmusok, a hivatkozott két kihívásokat. Először Catalist részt egy megfelelő versenyt futtatott egy független, harmadik fél: a Mitre Corporation. Mitre nyújtott minden résztvevő két zajos adatfájlokat illeszkedik, és a különböző csapatok versenyeztek, hogy visszatérjen a Mitre a leginkább megfelelő. Mivel Mitre maga tudta a helyes megfelelő tudtak gólt a csapat. A 40 cégek versenyeztek, Catalist jött a második helyen. Ez a fajta független, harmadik fél értékelésére szabadalmaztatott technológia meglehetősen ritka és hihetetlenül értékes; meg kell adni nekünk abban, hogy Catalist egyeztették eljárások lényegében a state-of-the-art. De a state-of-the-art elég jó? Amellett, hogy ez a megfelelő verseny, Ansolabehere és Hersh létre saját megfelelő kihívás Catalist. Egy korábbi projekt Ansolabehere és Hersh gyűjtött választói nyilvántartás Floridából. Ezek biztosították ezeket a rekordokat azok egyes területeken eltakarni a Catalist, majd összevetették Catalist jelentések ezeken a területeken a tényleges értékek. Szerencsére Catalist jelentései nagyon közel volt a visszatartott értékeket, ami azt jelzi, hogy Catalist egyezhet részleges szavazói nyilvántartást rá a mester adatfájlt. Ez a két kihívás, egy harmadik fél, egyet Ansolabehere és Hersh, hogy még több bizalmat a Catalist megfelelő algoritmusok, bár nem tudjuk ellenőrizni a pontos végrehajtását magunkat.

Számos korábbi kísérletek érvényesíteni szavazás. Áttekintését, hogy az irodalom, lásd Belli et al. (1999) , Berent, Krosnick, and Lupia (2011) , Ansolabehere and Hersh (2012) , és a Hanmer, Banks, and White (2014) .

Fontos megjegyezni, hogy bár ebben az esetben a kutatók arra ösztönözték a minősége adatok Catalist, más értékelések kereskedelmi szállítók kevésbé voltak lelkesek. A kutatók azt találták, rossz minőségű, ha az adatokat a felmérést, hogy a fogyasztó-fájlt Marketing Systems Group (amely maga összefűzve adatok három szolgáltató: Acxiom, Experian, és infoUSA) (Pasek et al. 2014) . Azaz, az adatállomány nem egyezik felmérés válaszok, hogy a kutatók várható, hogy helyes, az adatfájl is hiányzó információkat számos kérdést, és a hiányzó adatokat minta korrelált jelentett felmérés értéke (vagyis a hiányzó adatok szisztematikus, nem véletlen).

További rekord közötti kapcsolat felmérések és adminisztratív adatok, lásd Sakshaug and Kreuter (2012) és Schnell (2013) . További rekord kapcsolat általában lásd Dunn (1946) és Fellegi and Sunter (1969) (historical) és Larsen and Winkler (2014) (modern). Hasonló megközelítéseket is kifejlesztettek a számítástechnikában néven, például adatduplikáció, például azonosítás, egyezik, ismétlődő felderítése, és többszörös rekord érzékelés (Elmagarmid, Ipeirotis, and Verykios 2007) . Vannak még adatvédelmi megőrzése megközelítések felvenni kapcsolatot, amelyek nem igénylik a továbbítását, személyazonosításra alkalmas információkat (Schnell 2013) . A kutatók a Facebook kifejlesztett egy eljárást probabilisticsly összekapcsolják a rekordokat választói magatartás (Jones et al. 2013) ; Ez a kötés történt, hogy értékelje egy kísérletet, hogy én megmondom, mi a 4. fejezetben (Bond et al. 2012) .

Egy másik példa az összekötő nagyszabású szociális felmérés kormány adminisztratív nyilvántartások származik az Egészségügyi és Nyugdíj Survey és a Social Security Administration. Az inkább a tanulmányból, amely információt tartalmaz az engedélyezési eljárás, lásd Olson (1996) és Olson (1999) .

Egyesítésének folyamata sok forrás adminisztratív nyilvántartások egy master adatfájlt-a folyamatot, amely Catalist alkalmazottainkban gyakori a statisztikai hivatalok egyes nemzeti kormányok. Két kutató Svéd Statisztikai írt egy részletes könyvet a témában (Wallgren and Wallgren 2007) . Egy példa erre a megközelítésre egyetlen megye az Egyesült Államokban (Olmstead County, Minnesota, otthon a Mayo Clinic), lásd Sauver et al. (2011) . További információért a hibákat, amelyek megjelenhetnek a közigazgatási nyilvántartások, lásd Groen (2012) .