మరింత వ్యాఖ్యానం

ఈ విభాగం ఒక కధనం చదవబడుతుంది కాకుండా, ఒక సూచన వలె ఉపయోగించవచ్చు రూపొందించబడింది.

  • పరిచయం (విభాగం 3.1)

ఈ అధ్యాయం ఇతివృత్తాల కూడా వంటి పబ్లిక్ ఒపీనియన్ రీసెర్చ్ అమెరికన్ అసోసియేషన్ (AAPOR) ఇటీవల అధ్యక్ష చిరునామాలు, ప్రతిధ్వనించిన చేశారు Dillman (2002) , Newport (2011) , Santos (2014) , మరియు Link (2015) .

సర్వే పరిశోధన యొక్క అభివృద్ధి గురించి మరింత చారిత్రక నేపథ్యం కోసం, చూడండి Smith (1976) మరియు Converse (1987) . సర్వే పరిశోధన యొక్క మూడు తరాలకు చెందిన ఆలోచన మరింత కోసం, చూడండి Groves (2011) మరియు Dillman, Smyth, and Christian (2008) (కొద్దిగా భిన్నంగా మూడు తరాలకు విడిపోతుంది ఇది).

సర్వే పరిశోధన రెండవ శకం మొదటి నుండి బదిలీ లోపల ఒక శిఖరం Groves and Kahn (1979) మధ్య వివరణాత్మక తల- to- తల పోలిక చేస్తుంది, ఒక ముఖం- to- ముఖం మరియు టెలిఫోన్ సర్వే. Brick and Tucker (2007) యాదృచ్ఛిక అంకెల డయలింగ్ పరిశీలనా విధానాలు యొక్క చారిత్రిక అభివృద్ధి తిరిగి చూస్తాడు.

ఎలా సర్వే పరిశోధన మరింత సమాజంలో మార్పులకు స్పందనగా గత మారిందో కోసం, చూడండి Tourangeau (2004) , Mitofsky (1989) , మరియు Couper (2011) .

  • అడుగుతూ గమనించి వర్సెస్ (విభాగం 3.2)

కొన్నిసార్లు ప్రతివాదులు వారి అంతర్గత రాష్ట్రాలు గురించి తెలియదు ఎందుకంటే ప్రశ్నలను అడగడం ద్వారా అంతర్గత రాష్ట్రాలు గురించి తెలుసుకున్న సమస్యాత్మకంగా ఉంటుంది. ఉదాహరణకు, Nisbett and Wilson (1977) పేపర్లో రచయితలు నిర్ధారించారు: "విషయాలను కొన్నిసార్లు (ఎ) తెలియదు:" మానసిక ప్రక్రియల మీద వెర్బల్ నివేదికలు మేము తెలుసు కంటే ఎక్కువ టెల్లింగ్:. "జ్ఞాపకం టైటిల్ తో ఒక అద్భుతమైన కాగితం ముఖ్యంగా ఒక స్పందన ప్రభావితం చేసిన ఒక ఉద్దీపన ఉనికి, (బి) ప్రతిస్పందన ఉనికి, మరియు (సి) ఉద్దీపన స్పందన ప్రభావితం తెలియక తెలియదు. "

పరిశోధకులు నివేదించారు ప్రవర్తన లేదా పోకడలకు పరిశీలించిన ప్రవర్తనకు ఇష్టపడతారు ఉండాలి వాదనలు కోసం, చూడండి Baumeister, Vohs, and Funder (2007) (సైకాలజీ) మరియు Jerolmack and Khan (2014) మరియు స్పందనలు (Maynard 2014; Cerulo 2014; Vaisey 2014; Jerolmack and Khan 2014) (సోషియాలజీ). అడుగుతూ మరియు కూడా గమనించి మధ్య వ్యత్యాసం అర్థశాస్త్రం, పరిశోధకులు పేర్కొన్నారు వెల్లడించింది ప్రాధాన్యతల గురించి మాట్లాడటానికి పేరు పుడుతుంది. ఉదాహరణకు, ఒక పరిశోధకుడు వారు ఐస్ క్రీం తినడం లేదా వ్యాయామశాలలో వెళుతున్న ఇష్టపడతారు లేదో (పేర్కొంది ప్రాధాన్యతలను) ప్రతివాదులు అడగండి లేదా పరిశోధన ప్రజలు ఐస్ క్రీం తినడానికి ఎంత తరచుగా గమనించి వ్యాయామశాలలో (వెల్లడించింది ప్రాధాన్యతలను) వెళ్ళండి గలిగారు. ఆర్థికశాస్త్రం పేర్కొంది ప్రాధాన్యతలను డేటా కొన్ని రకాల లోతైన సంశయవాదం ఉంది (Hausman 2012) .

ఈ చర్చల్లో నుండి ఒక ప్రధాన థీమ్ రిపోర్టెడ్ ప్రవర్తనను ఎల్లప్పుడూ ఖచ్చితమైన కాదు అని. కానీ, స్వయంచాలకంగా నమోదు ప్రవర్తన, ఖచ్చితమైన ఉండవచ్చు ఆసక్తి నమూనా సేకరించిన కాదు, మరియు పరిశోధకులకు అందుబాటులో ఉండకపోవచ్చు. అందువలన, కొన్ని పరిస్థితులలో, నేను నివేదించారు ప్రవర్తనను ఉపయోగపడుతుంది అనుకుంటున్నాను. ఇంకా, ఈ చర్చల్లో నుంచి రెండో ప్రధాన థీమ్ భావోద్వేగాలు, జ్ఞానం, అంచనాలను, మరియు అభిప్రాయాలు గురించి నివేదికలు ఎల్లప్పుడూ కచ్చితమైన లేని ఉంది. కానీ, ఈ అంతర్గత రాష్ట్రాలు గురించి సమాచారం అవసరమైతే పరిశోధకులు-గానీ కొన్ని మాత్రమే ప్రవర్తనను వివరించక లేదా విషయం వివరించారు అప్పుడు వుంటుంది అని అడుగుతూ సముచితం సహాయం.

  • మొత్తం సర్వే లోపం (విభాగం 3.3)

మొత్తం సర్వే లోపంపై పుస్తకం పొడవు చికిత్సలు కోసం, చూడండి Groves et al. (2009) లేదా Weisberg (2005) . మొత్తం సర్వే లోపం అభివృద్ధి చరిత్ర కోసం, చూడండి Groves and Lyberg (2010) .

ఒక పరిశోధన ఎజెండా: ప్రాతినిధ్య అర్థంలో, కాని ప్రతిస్పందన మరియు కాని జవాబు వివక్ష సమస్యలపై ఒక గొప్ప పరిచయం సోషల్ సైన్స్ సర్వేల Nonresponse న నేషనల్ రీసెర్చ్ కౌన్సిల్ నివేదిక (2013) . మరొక ఉపయోగకరమైన పర్యావలోకనం అందచేసిన (Groves 2006) . అలాగే, అధికారిక గణాంకాలు జర్నల్, పబ్లిక్ ఒపీనియన్ క్వార్టర్లీ, మరియు రాజకీయ మరియు సామాజిక శాస్త్రాల అమెరికన్ అకాడమీ ఆఫ్ సెన్సెస్ యొక్క మొత్తం ప్రత్యేక సమస్యలు కాని ప్రతిస్పందన విషయం పై ప్రచురించబడిన చేశారు. చివరగా, స్పందన రేటును లెక్కించడం నిజానికి అనేక రకాలుగా ఉన్నాయి; ఈ విధానాలు పబ్లిక్ ఒపీనియన్ పరిశోధకులు అమెరికన్ అసోసియేషన్ (AAPOR) రూపొందించిన నివేదికలో వివరంగా ఉన్నాయి (Public Opinion Researchers} 2015) .

1936 లిటరరీ డైజెస్ట్ పోల్ వివరాలు అధ్యయనం చేయబడింది (Bryson 1976; Squire 1988; Cahalan 1989; Lusinchi 2012) . ఇది కూడా అస్తవ్యస్తంగా డేటా సేకరణ వ్యతిరేకంగా హెచ్చరించే ఉపమానము వాడుతున్నారు (Gayo-Avello 2011) . 1936 లో, జార్జ్ గాలప్ శాంప్లింగ్ యొక్క మరింత అధునాతనమైన రూపం ఉపయోగిస్తారు, మరియు చాలా చిన్న శాంపిల్ మరింత ఖచ్చితమైన అంచనాలు ఉత్పత్తి చేయగలిగింది. లిటరరీ డైజెస్ట్ పైగా గాలప్ యెక్క విజయంను మైలురాయిని సర్వే పరిశోధన యొక్క అభివృద్దిగా (Converse 1987, Ch 3; Ohmer 2006, Ch 4; Igo 2008, Ch 3) .

కొలత పరంగా, రూపకల్పన ప్రశ్నాపత్రాలు కోసం ఒక గొప్ప మొదటి వనరు Bradburn, Sudman, and Wansink (2004) . వైఖరి ప్రశ్నలపై ప్రత్యేకంగా దృష్టి ఒక మరింత మెరుగైన చికిత్స కోసం, చూడండి Schuman and Presser (1996) . ముందు పరీక్ష ప్రశ్నలపై ఎక్కువ అందుబాటులో ఉంది Presser and Blair (1994) , Presser et al. (2004) , మరియు చాప్టర్ 8 Groves et al. (2009) .

సర్వే ఖర్చులు మరియు సర్వే లోపాలు మధ్య రాజీ యొక్క క్లాసిక్, పుస్తక నిడివి చికిత్స Groves (2004) .

  • ఎవరు గోవా (విభాగం 3.4)

ప్రామాణిక సంభావ్యత నమూనా మరియు అంచనా యొక్క క్లాసిక్ పుస్తక నిడివి చికిత్స Lohr (2009) (మరిన్ని పరిచయ) మరియు Särndal, Swensson, and Wretman (2003) (మరిన్ని ఆధునిక). పోస్ట్ అంతస్థుల మరియు సంబంధిత పద్ధతులను క్లాసిక్ పుస్తకం నిడివి చికిత్స Särndal and Lundström (2005) . కొన్ని డిజిటల్ వయస్సు నేపధ్యాలలో, పరిశోధకులు గతంలో తరచుగా సత్యం కాని ప్రతిస్పందించిన గురించి కొంచెం తెలుసు. పరిశోధకులు కాని ప్రతివాదులు గురించి సమాచారాన్ని కలిగి ఉన్నప్పుడు స్పందన సర్దుబాటు వివిధ రూపాల్లో సాధ్యమే (Kalton and Flores-Cervantes 2003; Smith 2011) .

యొక్క Xbox అధ్యయనం Wang et al. (2015) కణ అనేక కణాలు లేనప్పుడు కూడా అర్థం అంచనా అనుమతించే బహుళస్థాయి రిగ్రెషన్ మరియు పోస్ట్-స్తరీకరణ అనే టెక్నిక్ (ఎంఆర్పి, కొన్నిసార్లు దీనిని "మిస్టర్ పి" అని) ఉపయోగిస్తుంది. ఈ పద్ధతిని అంచనాలు నాణ్యత గురించి కొంత చర్చ లేనప్పటికీ, విశ్లేషించడానికి ఒక ఆశావహ ప్రాంతంలో వంటి తెలుస్తోంది. పద్ధతి మొట్టమొదటగా వీటిని ఉపయోగించేవారు Park, Gelman, and Bafumi (2004) , మరియు తరువాత ఉపయోగం మరియు చర్చ జరుగుతూనే ఉంది (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) . వ్యక్తిగత బరువులు మరియు సెల్ ఆధారిత బరువులు మధ్య సంబంధం పై మరింత కొరకు చూడండి Gelman (2007) .

వైటింగ్ వెబ్ సర్వేలు ఇతర విధానాలు, చూడండి Schonlau et al. (2009) , Valliant and Dever (2011) , మరియు Bethlehem (2010) .

నమూనా మ్యాచింగ్ ప్రతిపాదించగా Rivers (2007) . Bethlehem (2015) నమూనాను సరిపోలే ప్రదర్శన నిజానికి ఇతర శాంప్లింగ్ విధానాలు (ఉదా అంతస్థులుగా నమూనా సేకరణ) మరియు ఇతర సర్దుబాటు విధానాలు (ఉదా, పోస్ట్ స్తరీకరణ) పోలి ఉంటుంది వాదించాడు. ఆన్లైన్ ప్యానెల్లు మరింత కోసం, చూడండి Callegaro et al. (2014) .

కొన్నిసార్లు పరిశోధకులు సంభావ్యత నమూనాలను మరియు కాని సంభావ్యత నమూనాల ఇదే నాణ్యతతో అంచనాలు అందిస్తుందని కనుగొన్నారు (Ansolabehere and Schaffner 2014) , కానీ ఇతర పోలికలు కాని సంభావ్యత నమూనాల దారుణంగా ఉందని కనుగొన్నారు (Malhotra and Krosnick 2007; Yeager et al. 2011) . ఈ తేడాలు ఒక ప్రధానమైన కారణం కాని సంభావ్యత నమూనాల కాలక్రమేణా అభివృద్ధి అని. కాని సంభావ్యత పరిశీలనా విధానాలు మరింత నిరాశావాద వీక్షణ కాని సంభావ్యత మాదిరి AAPOR టాస్క్ ఫోర్స్ చూడండి (Baker et al. 2013) , మరియు నేను కూడా సారాంశం నివేదిక ఈ క్రింది వ్యాఖ్యానం చదవడం సిఫార్సు.

కాని సంభావ్యత నమూనాల పక్షపాతం తగ్గించేందుకు వైటింగ్ యొక్క ప్రభావంపై ఒక మెటా-విశ్లేషణ, టేబుల్ 2.4 చూడండి Tourangeau, Conrad, and Couper (2013) "సర్దుబాట్లు ఉపయోగకరంగా కానీ యదార్థం దిద్దుబాట్లను అనిపించడం నిర్ధారించారు రచయితలు దారితీస్తుంది. . . "

  • గోవా ఎలా (విభాగం 3.5)

Conrad and Schober (2008) ఫ్యూచర్ యొక్క సర్వే ఇంటర్వ్యూ ఊహించుకొనుట పేరుతో సంపాదకీయం వాల్యూమ్ అందిస్తుంది, మరియు ఈ విభాగంలో ఇతివృత్తాల చిరునామాలు. Couper (2011) అదేవిధమైన కథాంశాలతో చిరునామాలను మరియు Schober et al. (2015) ఒక కొత్త సెట్టింగ్ అనుగుణంగా డేటా సేకరణ పద్ధతులు అధిక నాణ్యత డేటా చూపించవచ్చు ఎలా ఒక nice ఉదాహరణకు అందిస్తుంది.

సామాజిక శాస్త్రం సర్వేలు కోసం Facebook అనువర్తనాలను ఉపయోగించి మరొక ఆసక్తికరమైన ఉదాహరణకు, చూడండి Bail (2015) .

సర్వేలు పాల్గొనే కోసం ఒక ఆనందించే మరియు విలువైన అనుభవం మరిన్ని సలహాల కోసం, వ్యక్తీకరించబడింది డిజైన్ పద్ధతి పని చూడటానికి (Dillman, Smyth, and Christian 2014) .

Stone et al. (2007) పర్యావరణ క్షణికమైన అంచనా మరియు సంబంధిత పద్ధతులు ఒక పుస్తకం పొడవు చికిత్స అందిస్తుంది.

  • ఇతర డేటా లింక్ సర్వేలు (విభాగం 3.6)

Judson (2007) వంటి సర్వేలు మరియు అడ్మినిస్ట్రేటివ్ డేటా కలపడం ప్రక్రియ వివరించారు "సమాచారం ఇంటిగ్రేషన్," ఈ విధానాన్ని కొన్ని ప్రయోజనాలు చర్చిస్తుంది, మరియు కొన్ని ఉదాహరణలను అందిస్తోంది.

పరిశోధకులు డిజిటల్ జాడలు మరియు అడ్మినిస్ట్రేటివ్ డేటా ఉపయోగించవచ్చు మరో మార్గం నిర్దిష్ట లక్షణాలు ఉన్న ప్రజలకు నమూనాను ఫ్రేమ్. అయితే, ఈ రికార్డ్ నమూనాను ఫ్రేమ్ వాడె గోప్యతా సంబంధించిన ప్రశ్నలు సృష్టించవచ్చు యాక్సెస్ (Beskow, Sandler, and Weinberger 2006) .

విస్తరిస్తారు అడగడం సంబంధించి, ఈ విధానం అది నేను వివరించిన చేసిన ఎలా నుండి అన్పించవచ్చు గా కొత్తది. ఈ విధానం గణాంకాలు మోడల్ ఆధారిత పోస్ట్ స్తరీకరణ మూడు పెద్ద ప్రాంతాలకు సత్సంభందాలు కలిగి (Little 1993) , imputation (Rubin 2004) , మరియు చిన్న ప్రాంతంలో అంచనాలో (Rao and Molina 2015) . ఇది కూడా వైద్య పరిశోధనలో సర్రోగేట్ వేరియబుల్స్ యొక్క ఉపయోగం సంబంధించినది (Pepe 1992) .

డిజిటల్ ట్రేస్ డేటా యాక్సెస్ సంబంధించి కొన్ని నైతిక సమస్యలున్నాయి పాటు, విస్తరిస్తారు అడుగుతూ కూడా ప్రజలు ఒక సర్వేలో వెల్లడి ఎంచుకోవచ్చు ఉండకపోవచ్చని సున్నితమైన లక్షణాలన్నీ ప్రతిపాదించే వాడేవారు (Kosinski, Stillwell, and Graepel 2013) .

లో ఖర్చు మరియు సమయం అంచనాలు Blumenstock, Cadamuro, and On (2015) శుభ్రం కాల్ డేటా ప్రాసెస్ ధర వంటి వేరియబుల్ ఖర్చు-ఒక అదనపు సర్వే అండ్ చేర్చవద్దు స్థిర వ్యయాలు ఖర్చు మరింత చూడండి. సాధారణంగా, విస్తరిస్తారు అడగడం బహుశా అధిక స్థిర వ్యయాలు మరియు డిజిటల్ ప్రయోగాలు (చాప్టర్ 4 చూడండి) పోలి తక్కువ వేరియబుల్ ఖర్చులు ఉంటుంది. ఉపయోగించిన డేటా మరిన్ని వివరాలకు Blumenstock, Cadamuro, and On (2015) కాగితం ఉంటాయి Blumenstock and Eagle (2010) మరియు Blumenstock and Eagle (2012) . బహుళ imputuation నుండి విధానాలు (Rubin 2004) విస్తరిస్తారు అడుగుతూ నుండి అంచనాల్లో సంగ్రహ అనిశ్చితి సహాయపడవచ్చు. పరిశోధకులు కంకర గణనలు కాకుండా ఇండివిడ్యువల్-లెవెల్ లక్షణాలన్నీ పట్టించుకోనట్లు మాత్రమే అడుగుతున్నారు విస్తరిస్తారు చేయడం, ఆపై విధానాలు King and Lu (2008) మరియు Hopkins and King (2010) ఉపయోగపడతాయి. లో యంత్ర అభ్యాస విధానాలు గురించి మరింత Blumenstock, Cadamuro, and On (2015) , చూడండి James et al. (2013) (మరిన్ని పరిచయ) లేదా Hastie, Tibshirani, and Friedman (2009) (మరిన్ని ఆధునిక). మరో ప్రముఖ యంత్ర అభ్యాస టెక్స్ట్బుక్ ఉంది Murphy (2012) .

సమృద్ధ అడగడం సంబంధించి, Ansolabehere మరియు హెర్ష్ ఫలితాలు (2012) రెండు కీలక దశలను బందు: 1) సర్వే డేటా ఖచ్చితమైన మాస్టర్ datafile ఉత్పత్తి అనేక అసమాన డేటా మూలాల మిళితం మరియు 2) లింక్ Catalist యొక్క సామర్థ్యం Catalist సామర్థ్యంపై దాని మాస్టర్ datafile. అందువలన, Ansolabehere మరియు హెర్ష్ జాగ్రత్తగా ఈ దశలను ప్రతి తనిఖీ.

మాస్టర్ datafile సృష్టించడానికి, Catalist కలిపి సహా అనేక మూలాల నుండి సమాచారాన్ని ఐక్యపరుస్తుంది: ప్రతి రాష్ట్రం నుండి బహుళ ఓటింగ్ రికార్డులు స్నాప్షాట్లు, చిరునామా రిజిస్ట్రీలో తపాలా కార్యాలయంతో నేషనల్ మార్చండి నుండి డేటా, మరియు ఇతర పేర్కొని వ్యాపార ప్రొవైడర్లు నుండి డేటా. అన్ని ఈ శుభ్రపరచడం మరియు విలీనం జరిగినప్పుడు ఎలా గురించి నెత్తురు వివరాలను ఈ పుస్తకం యొక్క పరిధిని మించి, కానీ ఉన్నా ఎలా జాగ్రత్తగా ఈ ప్రక్రియ, అసలు డేటా మూలాల లోపాలు ప్రచారం మరియు లోపాలు ప్రవేశపెడుతుంది. Catalist దాని డేటా ప్రాసెసింగ్ చర్చించడానికి మరియు దాని ముడి డేటా కొన్ని అందించేందుకు సిద్ధమయ్యారు ఉన్నప్పటికీ, అది పరిశోధకులు మొత్తం Catalist డేటా పైప్లైన్ సమీక్షించడానికి కోసం కేవలం అసాధ్యం. అయితే, పరిశోధకులు Catalist డేటా ఫైలు కొన్ని తెలియని, మరియు బహుశా unknowable, లోపం యొక్క మొత్తాన్ని కలిగి ఉన్న ఒక పరిస్థితిలో ఉన్నారు. ఒక విమర్శకుడు కాదు ప్రతివాదులు ద్వారా misreporting ద్వారా సట్టా ఎందుకంటే CCES సర్వే నివేదికలు మరియు Catalist మాస్టర్ డేటా ఫైల్లో ప్రవర్తన మధ్య పెద్ద తేడాలు మాస్టర్ డేటా ఫైల్లో లోపాలు వలన ఆ ఈ ఒక తీవ్రమైన సమస్యగా చెప్పవచ్చు.

Ansolabehere మరియు హెర్ష్ డేటా నాణ్యతను ఆందోళన ప్రసంగిస్తూ రెండు విభిన్న విధానాలు పట్టింది. మొదటి, Catalist మాస్టర్ ఫైల్ను ఓటింగ్ స్వీయ నివేదిత ఓటింగ్ పోల్చడం అదనంగా, పరిశోధకులు కూడా పోలిస్తే స్వీయ నివేదిత పార్టీ, జాతి, ఓటరు రిజిస్ట్రేషన్ స్థితిని (ఉదా రిజిస్టర్ చేసినా చెయ్యకపోయినా నమోదైన) మరియు ఓటింగ్ పద్ధతి (ఉదా, వ్యక్తి లో, ఇతనికి బ్యాలెట్, మొదలైనవి) Catalist డేటాబేస్ లో కనిపించే ఆ విలువలకు. ఈ నాలుగు జనాభా వేరియబుల్స్, పరిశోధకులు ఓటింగ్ కన్నా Catalist మాస్టర్ ఫైల్ను సర్వే నివేదిక మరియు డేటా మధ్య ఒప్పందం చాలా ఎక్కువ స్థాయిలు దొరకలేదు. అందువలన, Catalist మాస్టర్ డేటా ఫైలు పేదలకు నాణ్యతను కాదు అని సూచిస్తూ, ఓటింగ్ కంటే ఇతర విశిష్ట లక్షణాలకు అధిక నాణ్యత సమాచారం కలిగి కనిపిస్తుంది. రెండవది, Catalist నుండి డేటా ఉపయోగించి భాగం లో, Ansolabehere మరియు హెర్ష్ కౌంటీ ఓటింగ్ రికార్డులు నాణ్యత మూడు వేర్వేరు చర్యలు ఫైండింగ్ అభివృద్ధి, మరియు వారు ఓటింగ్ ఓవర్ రిపోర్టింగ్ అంచనా రేటు ఈ డేటా నాణ్యత చర్యలు ఏ తప్పనిసరిగా సంబంధం కనుగొన్నారు, ఆ ఓవర్ రిపోర్టింగ్ అధిక రేట్లు అసాధారణ స్థాయిలో తక్కువ డేటా నాణ్యతను కలిగి ఉన్న కౌంటీలు వలన లేదు సూచిస్తున్నాయి.

ఈ మాస్టర్ ఓటింగ్ ఫైలు యొక్క సృష్టి ఇచ్చిన, సంభావ్య లోపాల రెండవ మూలము దానికి సర్వే రికార్డులు లింకింగ్ ఉంది. ఉదాహరణకు, ఈ బంధన తప్పుగా అమలు చేస్తే అది నివేదించారు మరియు చెల్లుబాటు ఓటింగ్ ప్రవర్తన మధ్య తేడా ఒక ఓవర్ అంచనా దారి తీయవచ్చు (Neter, Maynes, and Ramanathan 1965) . ప్రతి వ్యక్తి రెండు డేటా మూలాల అని స్థిరమైన ఏకైక నిర్ధారిణి కలిగి ఉంటే, అప్పుడు లింకేజ్ చిన్నవిషయం ఉంటుంది. సంయుక్త మరియు అనేక ఇతర దేశాలలో, అయితే, ఉండదు సార్వత్రిక గుర్తింపు ఉంది. అంతేకాక, ఉండేవి గుర్తింపు మంది బహుశా పరిశోధకులు సర్వే అందించగల వెనుకాడారు ఉంటుంది! పేరు, లింగం, పుట్టిన సంవత్సరం, మరియు ఇంటి చిరునామా: ఆ విధంగా, Catalist ప్రతి ప్రతివాది గురించి సమాచారాన్ని నాలుగు ముక్కలు ఈ సందర్భంలో, అసంపూర్ణ ఐడెంటిఫైయర్లు ఉపయోగించి లింకేజ్ వచ్చింది. ఉదాహరణకు, Catalist CCES లో హోమీ జె సింప్సన్ వారి మాస్టర్ డేటా ఫైలు లో హోమర్ జే సింప్సన్ వంటి వ్యక్తే ఉంటే నిర్ణయించుకోవలసి ఉంటుంది. ఆచరణలో, మ్యాచింగ్ పరిశోధకులకు విషయాలు మరింత దిగజార్చి, ఒక కష్టం మరియు గందరగోళంగా ప్రక్రియ, మరియు, Catalist యాజమాన్య ఉండాలి దాని సరిపోలే టెక్నిక్ భావిస్తారు.

మ్యాచింగ్ అల్గోరిథంలు ధ్రువీకరించడానికి క్రమంలో, వారు రెండు సవాళ్లు ఆధారపడింది. మిత్రే కార్పొరేషన్: మొదటి, Catalist స్వతంత్ర, మూడవ పార్టీ ద్వారా నడుపుతున్నారని ఒక సరిపోలే పోటీలో పాల్గొన్నారు. మిత్రే అన్ని పాల్గొనే రెండు ధ్వనించే డేటా ఫైళ్లు అందించిన సరిపోల్చబడే, మరియు వివిధ జట్లకు మిత్రే ఉత్తమ సరిపోలిక తిరిగి పోటీ పడ్డారు. మిత్రే కూడా సరైన మ్యాచింగ్ తెలుసు ఎందుకంటే వారు జట్లు స్కోరు సాధించారు. పోటీ చేసిన 40 కంపెనీల, Catalist రెండవ స్థానంలో నిలిచింది. స్వతంత్ర, యాజమాన్య సాంకేతిక మూడవ పక్ష పరిశీలిస్తూ ఈ రకమైన చాలా అరుదు మరియు చాలా విలువైనది; ఇది Catalist యొక్క మ్యాచింగ్ విధానాలు స్టేట్ ఆఫ్ ఆర్ట్ వద్ద తప్పనిసరిగా అని మాకు నమ్మకం ఇవ్వాలి. కానీ స్టేట్ ఆఫ్ ఆర్ట్ తగినంత మంచి ఉంది? ఈ సరిపోలే పోటీ పాటు, Ansolabehere మరియు హెర్ష్ Catalist వారి సొంత సరిపోలే సవాలు రూపొందించినవారు. అంతకుముందు ప్రాజెక్ట్ నుండి, Ansolabehere మరియు హెర్ష్ ఫ్లోరిడా నుండి ఓటరు రికార్డులు వసూలు చేసింది. వారు వారి రంగాలలో వారి అసలు విలువలకు ఈ రంగాలలో Catalist నివేదికలే పోల్చిన Catalist శోధించాడు మరియు అప్పుడు కొన్ని ఈ రికార్డ్ కొన్ని అందించింది. అదృష్టవశాత్తూ, Catalist నివేదికలే Catalist వారి మాస్టర్ డేటా ఫైలు పై పాక్షిక ఓటరు రికార్డులు మ్యాచ్ అని సూచిస్తూ, నిలిపి విలువలు దగ్గరలో ఉన్నాయి. ఈ రెండు సవాళ్లు, Ansolabehere మరియు హెర్ష్ ద్వారా మూడవ-పార్టీ ద్వారా ఒక మరియు ఒకటి, Catalist సరిపోలే అల్గోరిథంలు మరింత విశ్వాసం మాకు ఇవ్వాలని మేము వారి ఖచ్చితమైన అమలు సమీక్షించి కాదు అయినప్పటికీ మేమే.

ఓటింగ్ ధ్రువీకరించడానికి అనేక మునుపటి ప్రయత్నాలు జరిగాయి. ఆ సాహిత్యం అవలోకనం కొరకు, చూడుము Belli et al. (1999) , Berent, Krosnick, and Lupia (2011) , Ansolabehere and Hersh (2012) , మరియు Hanmer, Banks, and White (2014) .

ఈ సందర్భంలో పరిశోధకులు Catalist నుండి డేటా యొక్క నాణ్యత ప్రోత్సహించబడ్డాయి అయితే, వ్యాపార విక్రేతలు ఇతర అంచనాలు తక్కువ ఆసక్తిని గమనించండి ముఖ్యం. పరిశోధకులు పేద నాణ్యత కనుగొన్నారు చేసినప్పుడు మార్కెటింగ్ సిస్టమ్స్ గ్రూప్ నుండి ఒక వినియోగదారు ఫైల్ ఒక సర్వేలో డేటా (కూడా మూడు ప్రదాతల నుండి కలిసి డేటా విలీనమవుతుంది: Acxiom, ఎక్స్పీరియన్, మరియు InfoUSA) (Pasek et al. 2014) . ఆ డేటా ఫైల్ సరైన ఉంటుందని భావిస్తున్నారు పరిశోధకుల సర్వే స్పందనలు సరిపోలడం లేదు, datafile చేసింది లేదు ఒక పెద్ద ప్రశ్నల సంఖ్య, మరియు తప్పిపోయిన డేటా నమూనా కోసం సమాచారాన్ని వెల్లడించలేదు సర్వే విలువ (ఇతర పదాలు లేదు డేటా క్రమపద్ధతిన లో సహసంబంధం ఉంది , యాదృచ్ఛిక కాదు).

సర్వేలు మరియు అడ్మినిస్ట్రేటివ్ డేటా మధ్య రికార్డు లింకేజ్ మరింత కోసం, చూడండి Sakshaug and Kreuter (2012) మరియు Schnell (2013) . సాధారణంగా రికార్డు లింకేజ్ మరింత కోసం, చూడండి Dunn (1946) మరియు Fellegi and Sunter (1969) (చారిత్రక) మరియు Larsen and Winkler (2014) (ఆధునిక). ఇలాంటి విధానాలు కూడా అటువంటి డేటా నకలు తీసివేసే, ఉదాహరణకు గుర్తింపు, పేరు మ్యాచింగ్, నకిలీ గుర్తింపును పేర్లతో కంప్యూటర్ సైన్స్ లో అభివృద్ధి చేయబడ్డాయి, మరియు రికార్డు గుర్తింపును నకిలీ (Elmagarmid, Ipeirotis, and Verykios 2007) . గోప్యతా ఇది వ్యక్తిగతంగా గుర్తింపు సమాచారాన్ని ప్రసారం చేయటాన్ని అవసరం లేదు లింకేజ్ రికార్డ్ విధానాలు పరిరక్షించే కూడా ఉన్నాయి (Schnell 2013) . ఫేస్బుక్ పరిశోధకులు probabilisticsly ఓటింగ్ ప్రవర్తనకు వారి రికార్డులు లింక్ ఒక విధానం అభివృద్ధి (Jones et al. 2013) ; ఈ బంధన నేను చాప్టర్ 4 గురించి మీరు చెప్పండి చేస్తాము ఒక ప్రయోగం విశ్లేషించడానికి జరిగింది (Bond et al. 2012) .

ప్రభుత్వం అధికారిక రికార్డులు ఒక పెద్ద ఎత్తున సామాజిక సర్వే లింకింగ్ మరొక ఉదాహరణ ఆరోగ్యం మరియు రిటైర్మెంట్ సర్వే అండ్ సోషల్ సెక్యూరిటీ అడ్మినిస్ట్రేషన్ నుండి వస్తుంది. ఆ అధ్యయనం గురించి మరింత తెలుసుకోవడానికి, సమ్మతి విధానం గురించి సమాచారాన్ని సహా చూడండి Olson (1996) మరియు Olson (1999) .

Catalist కొన్ని జాతీయ ప్రభుత్వాలు గణాంక కార్యాలయాల్లో సాధారణ ఉద్యోగులు-అని ఒక మాస్టర్ datafile-ప్రక్రియలలో అధికారిక రికార్డులను అనేక మూలాల కలపడం ప్రక్రియ. గణాంకాలు స్వీడన్ నుండి రెండు పరిశోధకులు అంశంపై ఒక సమగ్ర పుస్తకం రాశారు (Wallgren and Wallgren 2007) . (ఒల్మ్స్టీడ్ కౌంటీ, మిన్నెసోటా; మేయో క్లినిక్ యొక్క స్థావరం) యునైటెడ్ స్టేట్స్ లో ఒక సింగిల్ కౌంటీలో ఈ పద్ధతికి ఒక ఉదాహరణ కోసం, చూడండి Sauver et al. (2011) . అధికారిక రికార్డులు లో కనిపించేలా లోపాలపై మరింత కోసం, చూడండి Groen (2012) .