વધુ કોમેન્ટરી

આ વિભાગ બદલે કથા વાંચી શકાય એક સંદર્ભ તરીકે ઉપયોગ કરવા માટે રચાયેલ છે.

  • પરિચય (વિભાગ 3.1)

આ પ્રકરણમાં વિષયો ઘણા પણ, જેમ કે જાહેર અભિપ્રાય સંશોધન અમેરિકન એસોસિયેશન (AAPOR) ખાતે તાજેતરના રાષ્ટ્રપતિ સરનામાંઓ, દેખાતો કરવામાં આવી છે Dillman (2002) , Newport (2011) , Santos (2014) , અને Link (2015) .

મોજણી સંશોધન વિકાસ વિશે વધુ ઐતિહાસિક પૃષ્ઠભૂમિ માટે, જુઓ Smith (1976) અને Converse (1987) . સર્વે રિસર્ચ ત્રણ યુગો ના વિચાર પર વધુ માટે, જુઓ Groves (2011) અને Dillman, Smyth, and Christian (2008) (જે સહેજ અલગ ત્રણ યુગમાં ફાટે).

સર્વે રિસર્ચ બીજા યુગ પ્રથમ સંક્રમણ અંદર એક ટોચ છે Groves and Kahn (1979) , જે વચ્ચે એક વિગતવાર વડા-થી-વડા સરખામણી કરે છે એક ચહેરો-થી-ચહેરો અને ટેલિફોન સર્વે. Brick and Tucker (2007) રેન્ડમ આંકડાના ડાયલીંગ નમૂના પદ્ધતિઓ ઐતિહાસિક વિકાસ પર પાછા જુએ છે.

વધુ કેવી રીતે સર્વે રિસર્ચ સમાજમાં ફેરફારોને પ્રતિસાદ ભૂતકાળમાં બદલાઈ ગયેલ છે માટે, જુઓ Tourangeau (2004) , Mitofsky (1989) , અને Couper (2011) .

  • નિરીક્ષણ વિ પૂછવા (વિભાગ 3.2)

પ્રશ્નો પૂછીને આંતરિક રાજ્યો વિશે શીખવી સમસ્યારૂપ બની શકે છે કારણ કે ઘણી વખત ઉત્તરદાતાઓ તેમની આંતરિક રાજ્યો પરિચિત નથી. ઉદાહરણ તરીકે, Nisbett and Wilson (1977) "કરતાં વધુ આપણે જાણીએ કહેવા:. માનસિક પ્રક્રિયાઓ પર મૌખિક અહેવાલ" પેપરમાં લેખકોએ તારણ: "વિષયો ક્યારેક (એક) અજાણ છે evocative શીર્ષક સાથે એક અદ્ભુત કાગળ ઉત્તેજના કે અગત્યનું પ્રતિભાવ પ્રભાવિત અસ્તિત્વ (ખ) પ્રતિભાવ અસ્તિત્વ, અને (સી) કે અજાણ ઉત્તેજના પ્રતિભાવ અસર થઈ છે અજાણ. "

દલીલો કે સંશોધકો અહેવાલ વર્તન અને વલણ જોવા મળ્યું વર્તન પસંદ કરીશું માટે, જુઓ Baumeister, Vohs, and Funder (2007) (મનોવિજ્ઞાન) અને Jerolmack and Khan (2014) અને જવાબો (Maynard 2014; Cerulo 2014; Vaisey 2014; Jerolmack and Khan 2014) (સમાજશાસ્ત્ર). પૂછવા અને પણ નિરીક્ષણ વચ્ચે તફાવત અર્થશાસ્ત્ર, જ્યાં સંશોધકો જણાવ્યું હતું અને જાહેર પસંદગીઓ વિશે વાત ઊભી થાય છે. ઉદાહરણ તરીકે, એક સંશોધક ઉત્તરદાતાઓ શું તેઓ આઈસ્ક્રીમ ખાવાથી અથવા (જણાવ્યું પસંદગીઓ) જિમ જવા પ્રાધાન્ય પૂછી શકે અથવા સંશોધન અવલોકન કરી શકે છે કેવી રીતે ઘણી વખત લોકો આઈસ્ક્રીમ ખાય અને જિમ (જાહેર પસંદગીઓ) પર જાઓ. અમુક અર્થશાસ્ત્ર જણાવ્યું હતું પસંદગીઓ માહિતી પ્રકારના ઊંડા નાસ્તિકતા છે (Hausman 2012) .

આ ચર્ચાઓને એક મુખ્ય થીમ કે અહેવાલ વર્તન હંમેશા ચોક્કસ નથી. પરંતુ, આપમેળે રેકોર્ડ વર્તન, ચોક્કસ હોઈ શકે નહિં રસ નમૂના પર એકત્રિત કરી શકે છે, અને સંશોધકો માટે સુલભ હોઈ શકે નહિં. આમ, કેટલીક પરિસ્થિતિ માં, મને લાગે છે કે અહેવાલ વર્તન ઉપયોગી હોઈ શકે છે. વધુમાં, આ ચર્ચાઓને એક બીજા મુખ્ય થીમ કે લાગણીઓ, જ્ઞાન, અપેક્ષાઓ, અને અભિપ્રાયો અંગે અહેવાલ હંમેશા ચોક્કસ હોતી નથી. પરંતુ, જો આ આંતરિક રાજ્યો વિશે માહિતી દ્વારા જરૂરી છે સંશોધકો-ક્યાં મદદ કરવા માટે કેટલાક વર્તણૂક સમજાવવા અથવા વસ્તુ સમજાવી-પછી પૂછવા યોગ્ય હોઈ શકે છે.

  • કુલ મોજણી ભૂલ (વિભાગ 3.3)

કુલ મોજણી ભૂલ પર પુસ્તક લંબાઈ સારવાર માટે, જુઓ Groves et al. (2009) કે Weisberg (2005) . કુલ મોજણી ભૂલ વિકાસ ઇતિહાસ માટે, જુઓ Groves and Lyberg (2010) .

એક સંશોધન એજન્ડા: પ્રતિનિધિત્વ દ્રષ્ટિએ, બિન-પ્રતિભાવ અને બિન-પ્રતિભાવ પૂર્વગ્રહ મુદ્દાઓ માટે એક મહાન પરિચય સામાજિક વિજ્ઞાન સર્વેક્ષણો Nonresponse પર નેશનલ રિસર્ચ કાઉન્સિલ અહેવાલ છે (2013) . અન્ય ઉપયોગી ઝાંખી દ્વારા પૂરી પાડવામાં આવે છે (Groves 2006) . પણ, સત્તાવાર આંકડા જર્નલ, જાહેર મંતવ્ય ત્રિમાસિક, અને રાજકીય અને સામાજિક વિજ્ઞાન અમેરિકન એકેડમી ઓફ એનલ્સ સમગ્ર ખાસ મુદ્દાઓ બિન-પ્રતિભાવ વિષય પર પ્રકાશિત કરવામાં આવી છે. છેલ્લે, ત્યાં પ્રતિભાવ દર ગણતરી ખરેખર ઘણા જુદા જુદા માર્ગો છે; આ અભિગમ જાહેર મંતવ્ય સંશોધકોએ અમેરિકન એસોસિયેશન (AAPOR) દ્વારા એક અહેવાલમાં વિગતવાર વર્ણવાયેલ છે (Public Opinion Researchers} 2015) .

1936 સાહિત્યિક ડાઈજેસ્ટ મતદાન વિગતવાર અભ્યાસ કરવામાં આવ્યો છે (Bryson 1976; Squire 1988; Cahalan 1989; Lusinchi 2012) . તે પણ એક કહેવત ફાંસી માહિતી સંગ્રહ સામે ચેતવણી તરીકે ઉપયોગ કરવામાં આવે છે (Gayo-Avello 2011) . 1936 માં, જ્યોર્જ ગેલપ નમૂના વધુ આધુનિક સ્વરૂપ વપરાય છે, અને ખૂબ નાના નમૂના સાથે વધુ ચોક્કસ અંદાજ પેદા કરવા માટે સક્ષમ હતી. સાહિત્યિક ડાઈજેસ્ટ પર ગેલપ સફળતા એક સીમાચિહ્નરૂપ સર્વે રિસર્ચ વિકાસ હતો (Converse 1987, Ch 3; Ohmer 2006, Ch 4; Igo 2008, Ch 3) .

માપ દ્રષ્ટિએ, ડિઝાઇન ો માટે એક મહાન પ્રથમ સાધન છે Bradburn, Sudman, and Wansink (2004) . વલણ પ્રશ્નો પર ખાસ ધ્યાન કેન્દ્રિત વધુ આધુનિક સારવાર માટે, જુઓ Schuman and Presser (1996) . પૂર્વ-ચકાસણી પ્રશ્નો પર વધુ ઉપલબ્ધ છે Presser and Blair (1994) , Presser et al. (2004) , અને પ્રકરણ 8 Groves et al. (2009) .

સર્વે ખર્ચ અને સર્વે ભૂલો વચ્ચે મડાગાંઠ ક્લાસિક, પુસ્તક-લંબાઈ સારવાર છે Groves (2004) .

  • કોણ પૂછી (વિભાગ 3.4)

પ્રમાણભૂત સંભાવના નમૂના અને અંદાજ ક્લાસિક પુસ્તક લંબાઈ સારવાર છે Lohr (2009) (વધુ પ્રારંભિક) અને Särndal, Swensson, and Wretman (2003) (વધુ અદ્યતન). પોસ્ટ સ્તરીકરણ અને સંબંધિત પદ્ધતિઓ એક ઉત્તમ પુસ્તક લંબાઈ સારવાર છે Särndal and Lundström (2005) . કેટલાક ડિજીટલ વય સેટિંગ્સ, સંશોધકો બિન-ઉત્તરદાતાઓ, જે ઘણી વખત ભૂતકાળમાં સાચું હતું વિશે તદ્દન થોડી ખબર. બિન-પ્રતિભાવ ગોઠવણ વિવિધ સ્વરૂપો શક્ય છે સંશોધકો બિન-ઉત્તરદાતાઓ વિશે જાણકારી હોય ત્યારે (Kalton and Flores-Cervantes 2003; Smith 2011) .

ના Xbox અભ્યાસ Wang et al. (2015) એક ટેકનિક મલ્ટિલેવલ રીગ્રેસન અને પોસ્ટ સ્તરીકરણ કહેવામાં આવે છે (એમઆરપી, ક્યારેક "મિસ્ટર પી" કહેવાય છે) કે સંશોધકો અંદાજ સેલ અર્થ એ થાય છે ત્યારે પણ ત્યાં ઘણી કોશિકાઓ છે પરવાનગી આપે છે. જોકે આ ટેકનિક અંદાજ ગુણવત્તા વિશે કેટલીક ચર્ચા છે, તે એક આશાસ્પદ વિસ્તાર અન્વેષણ જેવી લાગે છે. ટેકનિક પ્રથમ ઉપયોગ કરવામાં આવ્યો હતો Park, Gelman, and Bafumi (2004) , અને અનુગામી ઉપયોગ અને ચર્ચા કરવામાં આવી છે (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) . વ્યક્તિગત વજન અને સેલ આધારિત વજન વચ્ચે જોડાણ પર વધુ માટે જુઓ Gelman (2007) .

વજન વેબ સર્વેક્ષણો અન્ય અભિગમ માટે, જુઓ Schonlau et al. (2009) , Valliant and Dever (2011) , અને Bethlehem (2010) .

નમૂના મેચીંગ દ્વારા દરખાસ્ત કરવામાં આવી હતી Rivers (2007) . Bethlehem (2015) દલીલ કરે છે કે નમૂના બંધબેસતી કામગીરી ખરેખર અન્ય નમૂના અભિગમ (દા.ત., સ્તરબદ્ધ નમૂના) અને અન્ય ગોઠવણ અભિગમ (દા.ત., પોસ્ટ સ્તરીકરણ) માટે સમાન હશે. ઓનલાઇન પેનલ પર વધુ માટે, જુઓ Callegaro et al. (2014) .

ક્યારેક સંશોધકોએ શોધી કાઢ્યું છે કે સંભાવના નમૂનાઓ અને બિન-સંભાવના નમૂનાઓ સમાન ગુણવત્તા અંદાજ પેદા (Ansolabehere and Schaffner 2014) , પરંતુ અન્ય તુલના જાણવા મળ્યું છે કે બિન-સંભાવના નમૂનાઓ ખરાબ (Malhotra and Krosnick 2007; Yeager et al. 2011) . આ તફાવતો માટે એક સંભવ કારણ છે કે બિન-સંભાવના નમૂનાઓ સમય પર સુધારી છે. બિન-સંભાવના નમૂના પદ્ધતિઓ વધુ નિરાશાવાદી દૃશ્ય માટે જુઓ બિન-સંભાવના નમૂનાનો પર AAPOR ટાસ્ક ફોર્સ (Baker et al. 2013) , અને હું પણ કોમેન્ટરી કે સમરી રિપોર્ટ નીચે વાંચી ભલામણ કરીએ છીએ.

વજન બિન-સંભાવના નમૂનાઓમાં પૂર્વગ્રહ ઘટાડવા માટે અસર પર એક મેટા-વિશ્લેષણ માટે, ટેબલ 2.4 જોવા Tourangeau, Conrad, and Couper (2013) જે લેખકો દોરી જાય છે "તારણ ગોઠવણો ઉપયોગી પરંતુ ભૂલને પાત્ર સુધારા હોય એવું લાગતું. . . "

  • કેવી રીતે પૂછી (વિભાગ 3.5)

Conrad and Schober (2008) ફ્યુચર ઓફ સર્વે મુલાકાત envisioning શીર્ષક સંપાદિત વોલ્યુમ પૂરી પાડે છે, અને તે આ વિભાગમાં થીમ્સ ઘણા સંબોધે છે. Couper (2011) સમાન વિષયો સંબોધે છે, અને Schober et al. (2015) જેમાં ડેટા કેવી રીતે સંગ્રહ પદ્ધતિઓ છે કે જે એક નવી સેટિંગ કરવા માટે તૈયાર છે ઉચ્ચ ગુણવત્તા માહિતી પરિણમી શકે છે એક સરસ ઉદાહરણ આપે છે.

સામાજિક વિજ્ઞાન સર્વેક્ષણ માટે ફેસબુક એપ્લિકેશન્સ ઉપયોગ અન્ય રસપ્રદ ઉદાહરણ માટે, જુઓ Bail (2015) .

સર્વે સહભાગીઓ માટે એક આનંદપ્રદ અને મૂલ્યવાન અનુભવ બનાવવા પર વધુ સલાહ માટે, સમાયોજિત ડિઝાઇન પદ્ધતિ પર કામ જોઈ (Dillman, Smyth, and Christian 2014) .

Stone et al. (2007) ઇકોલોજીકલ ક્ષણિક આકારણી અને સંબંધિત પદ્ધતિઓની એક પુસ્તક લંબાઈ સારવાર આપે છે.

  • અન્ય માહિતી સાથે કડી સર્વેક્ષણો (વિભાગ 3.6)

Judson (2007) તરીકે સર્વેક્ષણો અને વહીવટી માહિતી સંયુક્ત પ્રક્રિયા વર્ણવેલ "માહિતી સંકલન," આ અભિગમ કેટલાક લાભો ચર્ચા, અને કેટલાક ઉદાહરણો આપે છે.

બીજી રીતે છે કે સંશોધકો ડિજિટલ નિશાનો અને વહીવટી માહિતી ઉપયોગ કરી શકો છો ચોક્કસ લક્ષણો સાથે લોકો માટે એક નમૂના ફ્રેમ હોય છે. જો કે, ઍક્સેસ આ રેકોર્ડ પણ ગોપનીયતા સંબંધિત પ્રશ્નો બનાવી શકો છો એક નમૂના ફ્રેમ વાપરી શકાય (Beskow, Sandler, and Weinberger 2006) .

વિસ્તરિત પૂછવા અંગે, આ અભિગમ કારણ કે તે હું કેવી રીતે તે વર્ણન કર્યું દેખાય શકે છે નવું નથી. આ અભિગમ ત્રણ મોટા આંકડા મોડેલ આધારિત પોસ્ટ સ્તરીકરણ માં વિસ્તારોમાં ઊંડો સંબંધ છે (Little 1993) , આરોપ (Rubin 2004) , અને નાના વિસ્તાર અંદાજ (Rao and Molina 2015) . તે પણ તબીબી સંશોધન સરોગેટ ચલો ઉપયોગ સાથે સંબંધિત છે (Pepe 1992) .

ડિજિટલ ટ્રેસ માહિતી ઍક્સેસ સંબંધિત નૈતિક મુદ્દાઓ ઉપરાંત, વિસ્તરિત પૂછવા પણ સંવેદનશીલ લક્ષણો છે કે જે લોકો એક સર્વેક્ષણમાં ઉઘાડી કરવા માટે પસંદ ન શકે અટકળ બાંધવી માટે વાપરી શકાય છે (Kosinski, Stillwell, and Graepel 2013) .

ખર્ચ અને સમય અંદાજ Blumenstock, Cadamuro, and On (2015) આવા ખર્ચના સાફ અને કોલ ડેટા પર પ્રક્રિયા કરવા માટે કારણ કે ચલ ખર્ચ એક વધારાના સર્વે અને નિશ્ચિત સમાવેશ થતો નથી ખર્ચ ખર્ચ કરવા માટે વધુ સંદર્ભ લો. સામાન્ય રીતે, વિસ્તરિત પૂછવા કદાચ ઊંચી નિયત ખર્ચ અને નીચા ચલ ડિજિટલ પ્રયોગો (4 પ્રકરણ જુઓ) સમાન ખર્ચ હશે. વપરાયેલ ડેટા પર વધુ વિગતો Blumenstock, Cadamuro, and On (2015) કાગળ છે Blumenstock and Eagle (2010) અને Blumenstock and Eagle (2012) . બહુવિધ imputuation ના અભિગમ (Rubin 2004) વિસ્તરિત પૂછવા અંદાજમાં કેપ્ચર અનિશ્ચિતતા મદદ કરી શકે છે. સંશોધકો માત્ર પૂછવા એકંદર ગણતરીઓ બદલે વ્યક્તિગત સ્તર લક્ષણો વિશે કાળજી વિસ્તરિત કરી હોય તો, પછી અભિગમ King and Lu (2008) અને Hopkins and King (2010) ઉપયોગી હોઈ શકે છે. મશીન લર્નિંગ અભિગમ વિશે વધુ માટે Blumenstock, Cadamuro, and On (2015) , જુઓ James et al. (2013) (વધુ પ્રારંભિક) અથવા Hastie, Tibshirani, and Friedman (2009) (વધુ અદ્યતન). અન્ય લોકપ્રિય મશીન શિક્ષણ પુસ્તક છે Murphy (2012) .

સમૃદ્ધ પૂછવા અંગે Ansolabehere અને Hersh પરિણામો (2012) બે કી પગલાંઓ પર મિજાગરું: 1) મોજણી માહિતી ચોક્કસ માસ્ટર datafile પેદા કરવા માટે ઘણા વિવિધ માહિતી સ્ત્રોત ભેગા અને 2) Catalist ક્ષમતા લિંક કરવા Catalist ક્ષમતા તેના મુખ્ય datafile. તેથી, Ansolabehere અને Hersh આ પગલાંઓ દરેક કાળજીપૂર્વક તપાસ કરો.

માસ્ટર datafile બનાવવા માટે, Catalist જોડાયેલું છે અને સહિત અનેક વિવિધ સ્રોતોમાંથી માહિતી સમન્વય: અન્ય અચોક્કસ વ્યાપારી પ્રદાતાઓ પાસેથી દરેક રાજ્ય માંથી ઘણી મતદાન રેકોર્ડ સ્નેપશોટ, પોસ્ટ ઓફિસ સરનામું રજિસ્ટ્રી નેશનલ ફેરફાર ડેટા અને માહિતી. કેવી રીતે આ બધા સફાઈ અને મર્જ થશે લોહીલુહાણ વિગતો આ પુસ્તક તક બહાર છે, પરંતુ આ પ્રક્રિયા છે, કોઈ બાબત કેવી રીતે કાળજી, મૂળ માહિતી સ્ત્રોત ભૂલો પ્રચાર કરશે અને ભૂલો રજૂ કરશે. તેમ છતાં Catalist તેની માહિતી પ્રોસેસીંગ ચર્ચા અને તેના કાચા માહિતી અમુક પૂરી પાડવા માટે તૈયાર કરવામાં આવી હતી, તે સરળ રીતે અશક્ય હતી સંશોધકો સમગ્ર Catalist માહિતી પાઇપલાઇન સમીક્ષા કરવા માટે. તેના બદલે, સંશોધકો એક પરિસ્થિતિ જ્યાં Catalist માહિતી ફાઈલ કેટલાક અજ્ઞાત, અને કદાચ unknowable, ભૂલ જથ્થો હતી હતા. આ એક ગંભીર ચિંતા છે, કારણ કે એક વિવેચક અનુમાન કરી શકે છે કે CCES પર મોજણી અહેવાલો અને Catalist માસ્ટર ડેટા ફાઇલ વર્તન વચ્ચે મોટો ભેદ છે માસ્ટર ડેટા ફાઇલ માં ભૂલો કારણે કરવામાં આવી હતી, ઉત્તરદાતાઓ દ્વારા misreporting દ્વારા નથી.

Ansolabehere અને Hersh માહિતી ગુણવત્તા ચિંતા સંબોધવા માટે બે અલગ અલગ અભિગમ લીધો હતો. પ્રથમ, Catalist માસ્ટર ફાઇલ મતદાન સ્વ અહેવાલ મતદાન સરખામણી ઉપરાંત, સંશોધકો પણ સરખામણીમાં પોતાની જાતે નોંધેલા પક્ષ, જાતિ, મતદાર નોંધણી સ્થિતિ (દા.ત., નોંધાયેલા હોય કે ન રજીસ્ટર) અને મતદાન પદ્ધતિ (દા.ત., વ્યક્તિ, બેઠાડું મતદાન, વગેરે) તે કિંમતો Catalist ડેટાબેઝ મળી. આ ચાર વસ્તી વિષયક ચલો માટે, સંશોધકો મતદાન કરતાં Catalist માસ્ટર ફાઈલમાં સર્વે રિપોર્ટ અને માહિતી વચ્ચે કરાર ખૂબ ઊંચા સ્તરો જોવા મળે છે. આમ, Catalist માસ્ટર ડેટા ફાઇલ સૂચવે છે કે તે ગરીબ એકંદર ગુણવત્તા નથી મતદાન કરતાં અન્ય લક્ષણો માટે ઉચ્ચ ગુણવત્તા માહિતી હોય તેવું લાગે છે. બીજું, Catalist ડેટાનો ઉપયોગ કરીને ભાગ, Ansolabehere અને Hersh કાઉન્ટી મતદાન રેકોર્ડ ગુણવત્તા ત્રણ અલગ અલગ પગલાં વિકસાવી છે અને તેમને જાણવા મળ્યું કે મતદાન પર રિપોર્ટિંગ અંદાજિત દર અનિવાર્યપણે આ માહિતી ગુણવત્તા પગલાં કોઈપણ બિનસંબંધિત હતી, તારણો કે સૂચવે છે કે ઓવર રિપોર્ટિંગ ઊંચા દર અસામાન્ય ઓછો ડેટા ગુણવત્તા સાથે કાઉન્ટીઓ દ્વારા ચલાવાયેલ કરવામાં આવી રહી નથી.

આ માસ્ટર મતદાન ફાઇલ બનાવટ આપેલ છે, સંભવિત ભૂલો બીજા સ્ત્રોત તે સર્વે રેકોર્ડ લિંક છે. ઉદાહરણ તરીકે, જો આ જોડાણને ખોટી રીતે કરવામાં આવે છે તે અહેવાલ અને માન્ય મતદાન વર્તન વચ્ચે તફાવત એક ઓવર અંદાજ તરફ દોરી શકે છે (Neter, Maynes, and Ramanathan 1965) . જો દરેક વ્યક્તિ એક સ્થિર, અનન્ય ઓળખકર્તા કે જે બંને માહિતી સ્ત્રોતો હતી, તો પછી જોડાણને તુચ્છ હશે. અમેરિકા અને મોટા ભાગના અન્ય દેશોમાં, જો કે, ત્યાં કોઈ સાર્વત્રિક ઓળખકર્તા છે. વધુમાં, પણ જો ત્યાં જેમ કે હતા ઓળખકર્તા લોકો કદાચ મોજણી સંશોધકો તે પૂરી પાડી ડગુમગુ હશે! નામ, લિંગ, જન્મ વર્ષ, અને ઘરનું સરનામું: આમ, Catalist અપૂર્ણ આઇડેન્ટીફાયર દરેક પ્રતિવાદી વિશે જાણકારી ચાર ટુકડાઓ મદદથી, આ કિસ્સામાં જોડાણ કરી હતી. ઉદાહરણ તરીકે, Catalist નક્કી કરવા માટે જો CCES માં Homie જે સિમ્પસન તેમના માસ્ટર ડેટા ફાઇલ માં હોમર જય સિમ્પસન તરીકે જ વ્યક્તિ હતી. વ્યવહારમાં, બંધબેસતી મુશ્કેલ અને અવ્યવસ્થિત પ્રક્રિયા છે, અને, બાબતો સંશોધકો માટે ખરાબ કરવા માટે, Catalist તેના મેચિંગ ટેકનિક ગણવામાં માલિકીનું હોય છે.

ઓર્ડર મેચિંગ ગાણિતીક નિયમો માન્ય કરવા માટે, તેઓ બે પડકારો પર આધારિત હતી. જેને મીત્રે કોર્પોરેશન: પ્રથમ, Catalist બંધબેસતી સ્પર્ધા કે એક સ્વતંત્ર, તૃતીય પક્ષ દ્વારા ચલાવવામાં આવી હતી ભાગ લીધો હતો. જેને મીત્રે બધા સહભાગીઓ બે અવાજ માહિતી ફાઈલો પૂરી પાડવામાં મેળ ખાતી કરી શકાય છે, અને અલગ અલગ ટીમો જેને મીત્રે માટે શ્રેષ્ઠ બંધબેસતી પાછા લીધો હતો. કારણ કે જેને મીત્રે પોતે યોગ્ય બંધબેસતી જાણતો હતો કે તેઓ ટીમો સ્કોર કરવા સક્ષમ હતા. 40 કંપનીઓ છે કે જે સ્પર્ધા, Catalist બીજા સ્થાને આવ્યા હતા. સ્વતંત્ર, તૃતીય પક્ષ માલિકીનું ટેકનોલોજી મૂલ્યાંકન આ પ્રકારની ખૂબ જ દુર્લભ અને અતિ મૂલ્યવાન છે; તે અમને વિશ્વાસ છે કે Catalist છે: તફાવતો કાર્યવાહી રાજ્ય ની-માટે-કલા અનિવાર્યપણે છે આપવી જોઇએ. પરંતુ રાજ્ય ની-માટે-કલા પૂરતી સારી છે? આ બંધબેસતી સ્પર્ધા ઉપરાંત, Ansolabehere અને Hersh Catalist માટે પોતાના બંધબેસતી પડકાર બનાવવામાં. પહેલાંની પ્રોજેક્ટ, Ansolabehere અને Hersh ફ્લોરિડાના મતદાર રેકોર્ડ એકત્ર કર્યા હતા. તેઓ તેમના ક્ષેત્રો Catalist માટે redacted અને પછી તેમના વાસ્તવિક કિંમતો આ ક્ષેત્રોમાં Catalist અહેવાલો સરખામણીમાં કેટલાક સાથે આ રેકોર્ડ કેટલાક પૂરી પાડી હતી. સદનસીબે, Catalist અહેવાલો પોતાના કાબુમાં રાખી કિંમતો નજીક હતા, જે દર્શાવે છે કે Catalist તેમના માસ્ટર ડેટા ફાઇલ પર આંશિક મતદાર રેકોર્ડ સાથે મેળ કરી શકે છે. આ બે પડકારો, તૃતીય પક્ષ દ્વારા એક અને એક Ansolabehere અને Hersh દ્વારા, અમને તેમના ચોક્કસ અમલ જાતને સમીક્ષા કરી શકો છો તેમ છતાં Catalist બંધબેસતી ગાણિતીક નિયમો વધુ વિશ્વાસ આપે છે.

ત્યાં મતદાન માન્ય કરવા ઘણા અગાઉના પ્રયાસો કરવામાં આવ્યા છે. કે સાહિત્ય એક ઝાંખી માટે, જુઓ Belli et al. (1999) , Berent, Krosnick, and Lupia (2011) , Ansolabehere and Hersh (2012) , અને Hanmer, Banks, and White (2014) .

તે મહત્વપૂર્ણ છે કે, તેમ છતાં આ કિસ્સામાં સંશોધકો Catalist માહિતી ગુણવત્તા દ્વારા પ્રોત્સાહિત કરવામાં આવ્યા હતા, વ્યાપારી વિક્રેતાઓ અન્ય મૂલ્યાંકનના ઓછી ઉત્સાહી કરવામાં આવી છે મહત્વનું છે. સંશોધકોએ નબળી ગુણવત્તા મળી છે જ્યારે માર્કેટિંગ સિસ્ટમો ગ્રૂપ પાસેથી ગ્રાહક ફાઈલ કરવા માટે એક સર્વેક્ષણ પરથી માહિતી (જે પોતે ત્રણ પ્રદાતાઓ પાસેથી મળીને માહિતી ભળી ગયેલ છે: Acxiom, Experian, અને ઇન્ફોયુએસએ) (Pasek et al. 2014) . એટલે કે, માહિતી ફાઈલ મોજણી જવાબો છે કે સંશોધકો યોગ્ય હોઈ શકે તેવી અપેક્ષા સાથે મેળ ખાતી નથી, datafile હતી ગુમ ગુમ માહિતી પેટર્ન પ્રશ્નો મોટી સંખ્યામાં છે, અને માટે માહિતી અહેવાલ મોજણી કિંમત (સંકળાયેલો હતી અન્ય શબ્દો ખૂટે માહિતી વ્યવસ્થિત હતી રેન્ડમ નથી).

સર્વેક્ષણો અને વહીવટી માહિતી વચ્ચે રેકોર્ડ જોડાણ પર વધુ માટે, જુઓ Sakshaug and Kreuter (2012) અને Schnell (2013) . સામાન્ય રીતે રેકોર્ડ જોડાણ પર વધુ માટે, જુઓ Dunn (1946) અને Fellegi and Sunter (1969) (ઐતિહાસિક) અને Larsen and Winkler (2014) (આધુનિક). સમાન અભિગમ પણ જેમ કે ડેટા નકલ, દાખલા તરીકે ઓળખ, નામ મેચિંગ, નકલી શોધ જેવા નામો હેઠળ કોમ્પ્યુટર વિજ્ઞાન વિકસાવવામાં આવી છે, અને રેકોર્ડ શોધ નકલી (Elmagarmid, Ipeirotis, and Verykios 2007) . ત્યાં પણ ગોપનીયતા જોડાણને જે વ્યક્તિગત માહિતી ઓળખવા ટ્રાન્સમિશન જરૂર નથી રેકોર્ડ અભિગમ સાચવીને છે (Schnell 2013) . ફેસબુક ખાતે સંશોધકોએ probabilisticsly મતદાન વર્તન તેમની રેકોર્ડ લિંક કરવા માટે એક પ્રક્રિયા વિકસાવી (Jones et al. 2013) ; આ જોડાણને એક પ્રયોગ કે હું તમને પ્રકરણ 4 વિશે કહી શકશો મૂલ્યાંકન કરવામાં આવ્યું હતું (Bond et al. 2012) .

સરકાર વહીવટી રેકોર્ડ મોટા પાયે સામાજિક મોજણી લિંક અન્ય ઉદાહરણ આરોગ્ય અને નિવૃત્તિ સર્વે અને સામાજિક સુરક્ષા વહીવટ માંથી આવે છે. કે અભ્યાસ પર વધુ માટે, સંમતિ પ્રક્રિયા વિશે માહિતી સહિત, જુઓ Olson (1996) અને Olson (1999) .

એક માસ્ટર datafile પ્રક્રિયા કે Catalist કેટલીક રાષ્ટ્રીય સરકારો આંકડાકીય ઓફિસમાં સામાન્ય કર્મચારી છે કે વહીવટી રેકોર્ડ ઘણા સ્રોતોમાંથી સંયુક્ત પ્રક્રિયા. આંકડા સ્વીડન થી બે સંશોધકો વિષય પર વિગતવાર પુસ્તક લખ્યું છે (Wallgren and Wallgren 2007) . (ઓમ્સટેડ કાઉન્ટી, મિનેસોટા; મેયો ક્લિનિક ઘર) થી યુનાઇટેડ સ્ટેટસ એક કાઉન્ટીમાં આ અભિગમ એક ઉદાહરણ માટે, જુઓ Sauver et al. (2011) . ભૂલો કે વહીવટી રેકોર્ડ દેખાય કરી શકો છો પર વધુ માટે, જુઓ Groen (2012) .