पुढील भाष्य

हे भाषांतर संगणक तयार केले होते. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

पुढील भाष्य

या विभागात एक गोष्ट म्हणून वाचले पाहिजे ऐवजी, एक संदर्भ म्हणून वापर करण्यासाठी केली आहे.

परिचय (विभाग 3.1)

जसे सार्वजनिक मत संशोधन अमेरिकन असोसिएशन (AAPOR) येथे अलीकडील राष्ट्रपतिपदाच्या पत्ते, या धडा थीम अनेक प्रतित आहेत Dillman (2002) , Newport (2011) , Santos (2014) , आणि Link (2015) .

सर्वेक्षण संशोधन विकास अधिक ऐतिहासिक पार्श्वभूमी, पहा Smith (1976) आणि Converse (1987) . सर्वेक्षण संशोधन तीन युगे कल्पना अधिक माहितीसाठी, पहा Groves (2011) आणि Dillman, Smyth, and Christian (2008) (किंचित वेगळ्या तीन युगे वर तोडल्या).

सर्वेक्षण संशोधन पहिल्या दुसरा कालखंड पासून संक्रमण आत एक शिखर आहे Groves and Kahn (1979) दरम्यान सविस्तर डोके-ते-डोके तुलना करते जे, एक चेहरा-टू-फेस आणि टेलिफोन सर्वेक्षण. Brick and Tucker (2007) यादृच्छिक अंकी डायलिंग नमूना पद्धती इतिहास परत दिसते.

कसे सर्वेक्षण संशोधन अधिक समाजात बदल प्रतिसादात गेल्या बदलला आहे, पाहू Tourangeau (2004) , Mitofsky (1989) , आणि Couper (2011) .

निरीक्षण वि विचारून (विभाग 3.2)

कधी कधी सर्वेक्षणात स्वत: त्यांच्या अंतर्गत राज्यातील जाणीव नाही कारण प्रश्न विचारून अंतर्गत राज्यांमध्ये शिकणे अनिश्चित असू शकतात. उदाहरणार्थ, Nisbett and Wilson (1977) "आम्ही माहित शकता पेक्षा अधिक सांगणे::. मानसिक प्रक्रिया कूट अहवाल" लेखक निष्कर्ष काढू कागद: "विषय कधी कधी (अ) नकळत आहेत जागृत करणारा शीर्षक एक आश्चर्यकारक कागद आहे महत्त्वाचे प्रतिसाद प्रभाव प्रोत्साहन अस्तित्व, (ब) प्रतिसाद अस्तित्व, आणि (क) नकळत प्रेरणा प्रतिसाद परिणाम झाला आहे की नकळत. "

संशोधक अहवाल वर्तन किंवा दृष्टिकोन करण्यासाठी साजरा वागणूक पसंत पाहिजे की वितर्क, पहा Baumeister, Vohs, and Funder (2007) (मानसशास्त्र) आणि Jerolmack and Khan (2014) आणि प्रतिसाद (Maynard 2014; Cerulo 2014; Vaisey 2014; Jerolmack and Khan 2014) (समाजशास्त्र). विचारून आणि निरीक्षण फरक अर्थशास्त्र, संशोधक नमूद प्रकट प्राधान्ये चर्चा जेथे उद्भवली. उदाहरणार्थ, एक संशोधक ते आइस्क्रीम खाणे किंवा जिम ला जाऊन पसंत की नाही हे (नमूद प्राधान्ये) सर्वेक्षणात विचारा किंवा संशोधन लोक आइस्क्रीम खाणे किती वेळा देखणे आणि जिम (प्रकट प्राधान्ये) जाऊ शकतात शकते. अर्थशास्त्र नमूद प्राधान्ये डेटा ठराविक प्रकारचे खोल आणि शंकांना आहे (Hausman 2012) .

या वादविवाद एक मुख्य थीम कथित वर्तन नेहमी अचूक नाही आहे. पण, आपोआप रेकॉर्ड वर्तन, अचूक असू शकत नाही व्याज एक नमुना गोळा जाऊ शकत नाही, आणि संशोधक उपलब्ध होऊ शकत नाही. त्यामुळे, काही परिस्थितीत, मी कथित वर्तन उपयोगी असू शकते, असे वाटते. तसेच, हे वादविवाद दुसऱ्यांदा मुख्य थीम भावना, ज्ञान, अपेक्षा, आणि मते अहवाल नेहमी अचूक नाही आहे. पण,-एकतर संशोधक काही वर्तन स्पष्ट करण्यात मदत करण्यासाठी या अंतर्गत राज्यांमध्ये माहिती आवश्यक असल्यास किंवा गोष्ट स्पष्ट-नंतर करणे म्हणून विचारत योग्य असू शकते.

एकूण सर्वेक्षण त्रुटी (विभाग 3.3)

एकूण सर्वेक्षण त्रुटी पुस्तक लांबी उपचार, पहा Groves et al. (2009) किंवा Weisberg (2005) . एकूण सर्वेक्षण त्रुटी विकास इतिहास, पाहू Groves and Lyberg (2010) .

एक संशोधन अजेंडा: प्रतिनिधित्व दृष्टीने, नॉन-प्रतिसाद आणि बिगर प्रतिसाद बायस मुद्दे एक उत्तम परिचय Nonresponse राष्ट्रीय संशोधन परिषद अहवालात सामाजिक विज्ञान सर्वेक्षण आहे (2013) . आणखी एक उपयुक्त विहंगावलोकन द्वारे पुरवली जाते (Groves 2006) . तसेच, अधिकृत आकडेवारी जर्नल, सार्वजनिक मत तिमाही आणि राजकीय आणि सामाजिक विज्ञान अमेरिकन ऍकॅडमी ऑफ ऐतिहासिक संपूर्ण विशेष मुद्दे नॉन-प्रतिसाद या विषयावर प्रकाशित करण्यात आले आहे. शेवटी, प्रतिसाद दर गणना प्रत्यक्षात अनेक विविध मार्ग आहेत; या पध्दती सार्वजनिक मत संशोधक अमेरिकन असोसिएशन (AAPOR) एक अहवाल तपशील वर्णन आहेत (Public Opinion Researchers} 2015) .

1936 साहित्य डायजेस्ट मतदान तपशील अभ्यास केला गेला आहे (Bryson 1976; Squire 1988; Cahalan 1989; Lusinchi 2012) . तो देखील सहजगत्या डेटा संकलन विरुद्ध बजाविणे एक गोष्ट म्हणून वापरले गेले आहे (Gayo-Avello 2011) . 1936 मध्ये, जॉर्ज गॅलुप नमूना एक अधिक अत्याधुनिक फॉर्म वापरली, आणि एक खूपच लहान नमुना अधिक अचूक अंदाज निर्माण करण्यास सक्षम होते. साहित्य डायजेस्ट प्रती गॅलुप यश एक मैलाचा दगड सर्वेक्षण संशोधन विकास (Converse 1987, Ch 3; Ohmer 2006, Ch 4; Igo 2008, Ch 3) .

मापन दृष्टीने, रचना प्रश्नावली एक उत्तम पहिल्या संसाधन आहे Bradburn, Sudman, and Wansink (2004) . वृत्ती प्रश्न विशेषत लक्ष केंद्रित अधिक प्रगत उपचार, पहा Schuman and Presser (1996) . पूर्व चाचणी प्रश्न अधिक उपलब्ध आहे Presser and Blair (1994) , Presser et al. (2004) , आणि 8 Groves et al. (2009) .

सर्वेक्षण खर्च आणि सर्वेक्षण त्रुटी दरम्यान व्यापार बंद क्लासिक, पुस्तक-लांबी उपचार आहे Groves (2004) .

कोणाला विचारावे (विभाग 3.4)

मानक शक्यता नमूना आणि अंदाज क्लासिक पुस्तक लांबी उपचार आहेत Lohr (2009) (अधिक प्रास्ताविक) आणि Särndal, Swensson, and Wretman (2003) (अधिक प्रगत). पोस्ट-साहित्य बियाणे आणि संबंधित पद्धती एक क्लासिक पुस्तक लांबी उपचार आहे Särndal and Lundström (2005) . काही डिजिटल वय, सेटिंग्ज मधील संशोधक नॉन-सर्वेक्षण नाही पूर्वी अनेकदा खरे होते, जे बद्दल थोडा माहीत आहे. संशोधक नॉन प्रतिसादकांच्या माहिती आहे तेव्हा बिगर प्रतिसाद समायोजन विविध फॉर्म शक्य आहे (Kalton and Flores-Cervantes 2003; Smith 2011) .

हे Xbox अभ्यास Wang et al. (2015) बहुस्तरीय पुन्ह आणि पोस्ट-साहित्य बियाणे नावाच्या तंत्र (एमआरपी, कधी कधी "गृहस्था पी" म्हणतात) की संशोधक अंदाज सेल अनेक, अनेक सेल तरीही याचा अर्थ परवानगी देते वापरते. हे तंत्र पासून अंदाज गुणवत्ता बद्दल काही वाद तेथे आहे, तरीही ते अन्वेषण करण्यासाठी एक आश्वासक क्षेत्र सारखे दिसते. तंत्र प्रथम वापरले होते Park, Gelman, and Bafumi (2004) , आणि त्यानंतरच्या वापर आणि वादविवाद झाली आहे (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) . वैयक्तिक वजने आणि सेल-आधारित वजन दरम्यान कनेक्शन अधिक पहा Gelman (2007) .

भार योजन वेब सर्वेक्षण इतर पध्दती, पहा Schonlau et al. (2009) , Valliant and Dever (2011) , आणि Bethlehem (2010) .

नमुना जुळणारे द्वारे प्रस्तावित होते Rivers (2007) . Bethlehem (2015) नमुना जुळणारे कामगिरी प्रत्यक्षात इतर नमूना पध्दती (उदा, थराथराने रचलेला नमूना) आणि इतर समायोजन पध्दती (उदा पोस्ट-साहित्य बियाणे) सारखे असेल की म्हणणं आहे. ऑनलाइन पटल वर अधिक माहितीसाठी, पहा Callegaro et al. (2014) .

कधी कधी संशोधक शक्यता नमुने आणि गैर-संभाव्यता नमुने समान दर्जा अंदाज उत्पन्न असे आढळले आहे (Ansolabehere and Schaffner 2014) , पण इतर भेद नॉन-संभाव्यता नमुने वाईट करू असे आढळले आहे (Malhotra and Krosnick 2007; Yeager et al. 2011) . हे मतभेद एक संभाव्य कारण नॉन-संभाव्यता नमुने वेळ प्रती सुधारित आहे की आहे. नॉन-संभाव्यता नमूना पद्धती अधिक निराशावादी दृश्य अ-संभाव्यता सॅम्पलिंग वर AAPOR टास्क फोर्स पाहू (Baker et al. 2013) , आणि मी देखील सारांश अहवाल खालील भाष्य वाचून शिफारस.

नॉन-संभाव्यता नमुन्यात कल कमी करण्यासाठी भार योजन परिणाम एक मेटा-विश्लेषण, मध्ये टेबल 2.4 पाहू Tourangeau, Conrad, and Couper (2013) "ऍडजस्ट उपयुक्त पण चुकीला पात्र दुरुस्त्या असल्याचे दिसत निष्कर्ष काढला लेखक ठरतो जे. . . "

कसे विचारू (विभाग 3.5)

Conrad and Schober (2008) भविष्यातील सर्वेक्षण मुलाखत Envisioning शीर्षक संपादित खंड उपलब्ध आहे, आणि तो या विभागातील थीम अनेक पत्ते. Couper (2011) तत्सम थीम पत्ते, आणि Schober et al. (2015) एक नवीन सेटिंग तयार केलेले डेटा संकलन पद्धती उच्च दर्जाचे डेटा होऊ शकते कसे एक छान उदाहरण देते.

सामाजिक विज्ञान सर्वेक्षण फेसबुक अनुप्रयोग वापरून आणखी एक मनोरंजक उदाहरणार्थ, पाहू Bail (2015) .

सर्वेक्षण सहभागी एक आनंददायक आणि मौल्यवान अनुभव बनवण्यासाठी अधिक सल्ला, उचित डिझाईन पद्धत काम पाहू (Dillman, Smyth, and Christian 2014) .

Stone et al. (2007) पर्यावरणीय क्षणिक मूल्यांकन आणि संबंधित पद्धती एक पुस्तक लांबी उपचार देतो.

इतर डेटा लिंक सर्वेक्षण (विभाग 3.6)

Judson (2007) म्हणून सर्वेक्षणे आणि प्रशासकीय माहिती यात प्रक्रिया वर्णन "माहिती एकात्मता," हा दृष्टिकोन काही फायदे माहिती, व काही उदाहरणे देते.

संशोधक डिजिटल मागोवा आणि प्रशासकीय डेटा वापरू शकते आणखी एक मार्ग विशिष्ट वैशिष्ट्ये असलेल्या लोकांसाठी एक नमूना फ्रेम आहे. तथापि, प्रवेश हे रेकॉर्ड नमूना फ्रेम वापरलेले गोपनीयता संबंधित प्रश्न निर्माण होऊ शकते (Beskow, Sandler, and Weinberger 2006) .

अभाव विचारत बाबींची माहिती, हा दृष्टिकोन मी वर्णन केले कसे दिसतात शकते म्हणून नाही म्हणून नवीन आहे. हा दृष्टिकोन आकडेवारी मॉडेल आधारित पोस्ट साहित्य बियाणे तीन मोठ्या भागात खोल कनेक्शन आहे (Little 1993) , दूषण (Rubin 2004) , आणि लहान क्षेत्र अंदाज (Rao and Molina 2015) . तसेच वैद्यकीय संशोधन मध्ये सक्ती चलने वापर संबंधित आहे (Pepe 1992) .

डिजिटल ट्रेस डेटा प्रवेश संबंधित नैतिक बाबी व्यतिरिक्त, अभाव विचारून लोक एका सर्वेक्षणात उघड करणे निवडू शकत नाही, यासाठी की, संवेदनशील अद्वितीय वैशिष्ट्य अनुमान करण्यासाठी वापरले जाऊ शकते (Kosinski, Stillwell, and Graepel 2013) .

खर्च आणि वेळ अंदाज Blumenstock, Cadamuro, and On (2015) अशा स्वच्छ आणि कॉल डेटा प्रक्रिया खर्च म्हणून बदलणारा खर्च-एक अतिरिक्त सर्वेक्षण आणि निश्चित समाविष्ट करू नका खर्च खर्च अधिक पहा. साधारणतया, अभाव विचारत कदाचित उच्च निश्चित खर्च आणि डिजिटल प्रयोग (धडा 4 पहा) सारखे कमी चल खर्च आहे. मध्ये वापरले डेटा अधिक माहितीसाठी Blumenstock, Cadamuro, and On (2015) कागद आहेत Blumenstock and Eagle (2010) आणि Blumenstock and Eagle (2012) . अनेक imputuation पासून जवळ (Rubin 2004) अभाव विचारून पासून अंदाजपत्रकास मध्ये कॅप्चर अनिश्चितता मदत होऊ शकेल. संशोधक फक्त एकूण संख्या, ऐवजी वैयक्तिक स्तरीय अद्वितीय वैशिष्ट्य काळजी विचारत अभाव केली आहे, तर मग दृष्टिकोण King and Lu (2008) आणि Hopkins and King (2010) उपयोगी असू शकतो. मशीन शिक्षण पध्दती याबद्दल अधिक साठी Blumenstock, Cadamuro, and On (2015) , पाहू James et al. (2013) (अधिक प्रास्ताविक) किंवा Hastie, Tibshirani, and Friedman (2009) (अधिक प्रगत). आणखी एक लोकप्रिय मशीन लर्निंग पाठ्यपुस्तक आहे Murphy (2012) .

समृद्ध विचारत बाबींची माहिती, Ansolabehere आणि Hersh परिणाम (2012) ही दोन महत्त्वाची पावले अवलंबून: 1) सर्वेक्षण डेटा अचूक मास्टर datafile निर्मिती अनेक पूर्णपणे वेगळया प्रकारचा डेटा स्रोत एकत्र आणि 2) दुवा Catalist क्षमता Catalist क्षमता त्याच्या मास्टर datafile. म्हणून, Ansolabehere आणि Hersh काळजीपूर्वक या चरणांचे प्रत्येक तपासा.

मास्टर datafile तयार करण्यासाठी, Catalist combines आणि अनेक भिन्न स्त्रोतांकडून माहिती सुसंगत: इतर, पण कुठल्या व्यावसायिक प्रदाते पासून प्रत्येक राज्यात अनेक मतदान रेकॉर्ड स्नॅपशॉट, पत्ता नोंदणी च्या पोस्ट ऑफिस राष्ट्रीय बदला डेटा, आणि डेटा. हे सर्व स्वच्छता आणि विलीन होते याबद्दल भयानक तपशील या पुस्तकात पलिकडे आहेत, पण ही प्रक्रिया कसे नाही सावधगिरी बाळगा, मूळ डेटा स्रोत त्रुटी प्रसार होईल आणि त्रुटी करेल. Catalist त्याच्या डेटा प्रोसेसिंग चर्चा आणि त्याच्या कच्चा डेटा काही प्रदान अर्जदाराच्या कुंटुबाची संपूर्ण माहिती होते तरी संशोधक संपूर्ण Catalist डेटा पाइपलाइन पुनरावलोकन करण्यासाठी, तो केवळ अशक्य होते. उलट, संशोधक एक परिस्थिती Catalist डेटा फाइल काही अज्ञात, आणि कदाचित unknowable, त्रुटी रक्कम होती जेथे होते. एक टीकाकार नाही सर्वेक्षणात करून misreporting आणि CCES सर्वेक्षण अहवाल Catalist मास्टर डेटा फाइल वर्तन दरम्यान मोठ्या फरक मास्टर डेटा फाइल त्रुटी करून झाल्याने होते तर्क शकते कारण, हे एक गंभीर चिंता आहे.

Ansolabehere आणि Hersh डेटा गुणवत्ता चिंता संबोधित करण्यासाठी दोन भिन्न पध्दती घेतला. प्रथम, स्वत: ची अहवाल मतदान Catalist मास्टर फाइलमध्ये मतदान तुलना व्यतिरिक्त, संशोधक देखील तुलनेत स्वत: ची अहवाल पक्ष, वंश, मतदार नोंदणी स्थिती (उदा, नोंदणीकृत किंवा नाही नोंदणी) आणि मतदानाची पद्धत (उदा व्यक्तिश गैरहजर मतपत्रिका, इ) Catalist डाटाबेस आढळले त्या मूल्ये. या चार डेमोग्राफिक चल साठी, संशोधक मतदान पेक्षा Catalist मास्टर फाइलमध्ये सर्वेक्षण अहवाल आणि डेटा दरम्यान करार जास्त पातळी आढळले. अशा प्रकारे, Catalist मास्टर डेटा फाइल, तो गरीब गुणवत्ता नाही, सुचवून मतदान पेक्षा इतर अद्वितीय वैशिष्ट्य उच्च दर्जाचे माहिती दिसते. दुसरी गोष्ट म्हणजे, Catalist डेटा वापरून भाग, Ansolabehere आणि Hersh कंट्री मतदान रेकॉर्ड गुणवत्ता तीन विविध उपाय विकसित केले, आणि ते आढळले मतदान प्रती अहवाल अंदाजे दर या डेटा गुणवत्ता उपाय कोणत्याही मूलत: संबंधित होते की, एक शोध की प्रती-अहवाल उच्च दर विलक्षण कमी डेटा गुणवत्ता तालुके चेंडू जात नाहीत असे सूचित.

या मास्टर मतदान फाइल निर्माण दिले, संभाव्य त्रुटी दुसरा स्रोत तो सर्वेक्षण रेकॉर्ड दुवा जोडत आहे. उदाहरणार्थ, या लिंकेज चुकीचा केले तर तो अहवाल आणि सत्यापित मतदान वर्तन फरक एक प्रती-अंदाज होऊ शकते (Neter, Maynes, and Ramanathan 1965) . प्रत्येक व्यक्ती डेटा स्रोत दोन्ही होते की एक स्थिर, युनिक आयडेंटिफायर असते, तर संबंध क्षुल्लक होईल. अमेरिका आणि बहुतेक इतर देशांमध्ये, तथापि, नाही सार्वत्रिक अभिज्ञापक आहे. शिवाय, अशा होते जरी अभिज्ञापनकर्त्याचे लोक कदाचित संशोधक सर्वेक्षण प्रदान संकोच होईल! नाव, लिंग, जन्म वर्ष आणि निवासस्थान पत्ता: अशा प्रकारे, Catalist अपूर्ण अभिज्ञापक, प्रत्येक प्रतिवादी माहिती चार तुकडे वापरून या प्रकरणात लिंकेज करावं लागलं. उदाहरणार्थ, Catalist तर CCES मध्ये Homie जॉन सिम्पसन त्यांचा मालक डेटा फाइल मध्ये होमर जय सिम्पसन समान व्यक्ती होते ठरवायचे होते. सराव, जुळणारे एक कठीण आणि गबाळ प्रक्रिया आहे, आणि संशोधक यांच्यासाठी वस्तू वाईट करण्यासाठी, Catalist मालकी असल्याचे त्याच्या जुळणारे तंत्र मानले.

जुळणारे अल्गोरिदम प्रमाणित करण्यासाठी, ते दोन आव्हाने वर relied. Mitre कॉर्पोरेशन: प्रथम, Catalist स्वतंत्र, तृतीय-पक्ष चालविण्यात होते की एक जुळणारे या स्पर्धेत भाग घेतला. Mitre सर्व सहभागी दोन गोंगाट करणारा डेटा फायली प्रदान जुळले करणे, आणि विविध संघ सर्वोत्कृष्ट जुळणी Mitre परत सहभागी झाले होते. Mitre स्वतः योग्य जुळणारे माहीत होते कारण ते संघ स्कोअर सक्षम होते. या स्पर्धांमध्ये 40 कंपन्या, Catalist दुसऱ्या स्थानावर आला. स्वतंत्र, तृतीय-पक्ष खाजगी मालकीचा तंत्रज्ञान मूल्यमापन या प्रकारची जोरदार दुर्मिळ आणि विश्वास बसणार नाही इतका मौल्यवान आहे; तो Catalist च्या जुळणारे प्रक्रीया राज्य-ऑफ-द-आर्ट मूलत: आहेत की आम्हाला आत्मविश्वास वाढला आहे. पण राज्य-ऑफ-द-आर्ट चांगला पुरेशी आहे? या जुळणारे स्पर्धा व्यतिरिक्त, Ansolabehere आणि Hersh साठी Catalist त्यांच्या स्वत: च्या जुळणारे आव्हान निर्माण केले. पूर्वीच्या प्रकल्प, Ansolabehere आणि Hersh फ्लोरिडा पासून मतदार रेकॉर्ड गोळा केली होती. शेतात Catalist करण्यासाठी संपादित आणि नंतर त्यांच्या प्रत्यक्ष मूल्ये या शेतात Catalist अहवाल तुलनेत काही या काही रेकॉर्ड्स प्रदान. सुदैवाने, Catalist अहवाल Catalist त्यांचा मालक डेटा फाइल वर आंशिक मतदार रेकॉर्ड जुळत नाही असे सूचित ठेवले मूल्ये बंद होते. या दोन आव्हाने, तृतीय-पक्ष एक आणि एक Ansolabehere आणि Hersh करून, Catalist जुळणारे अल्गोरिदम अधिक आत्मविश्वास आम्हाला देत आम्ही त्यांच्या अचूक अंमलबजावणी स्वतः पुनरावलोकन करू शकत नाही तरीही.

मतदान प्रमाणित करण्यासाठी अनेक मागील प्रयत्न केले. साहित्य विहंगावलोकन साठी, पहा Belli et al. (1999) , Berent, Krosnick, and Lupia (2011) , Ansolabehere and Hersh (2012) , आणि Hanmer, Banks, and White (2014) .

हे स्पष्ट आहे की या प्रकरणात संशोधक Catalist डेटा गुणवत्ता प्रोत्साहन देण्यात आले असले तरी, व्यावसायिक विक्रेता इतर मोजमापन कमी उत्साहपूर्ण केले आहे हे लक्षात घेणे महत्वाचे आहे. संशोधक गरीब गुणवत्ता आढळले आहेत विपणन प्रणाल्या गटात एक ग्राहक-फाइल एक सर्वेक्षण डेटा (तीन प्रदाते एकत्र डेटा विलीन आहे: Acxiom, एक्स्पेरियन आणि InfoUSA तेव्हा) तेव्हा (Pasek et al. 2014) . डेटा फाइल संशोधक योग्य असेल अशी अपेक्षा आहे की, सर्वेक्षण प्रतिसादांचा जुळत नाही, datafile गहाळ प्रश्न मोठ्या प्रमाणात आणि गहाळ डेटा नमुना डेटा अहवाल सर्वेक्षण मूल्य (दुसऱ्या शब्दांत गहाळ डेटा पद्धतशीर होते निगडित होती, आहे यादृच्छिक नाही).

सर्वेक्षण आणि प्रशासकीय डेटा दरम्यान रेकॉर्ड संबंध अधिक माहितीसाठी, पहा Sakshaug and Kreuter (2012) आणि Schnell (2013) . सर्वसाधारणपणे रेकॉर्ड संबंध अधिक माहितीसाठी, पहा Dunn (1946) आणि Fellegi and Sunter (1969) (ऐतिहासिक) आणि Larsen and Winkler (2014) (आधुनिक). समान पध्दती अशा डेटा डुप्लिकेशन, उदाहरणार्थ ओळख, नाव जुळणारे डुप्लिकेट, शोध म्हणून नावे अंतर्गत संगणक विज्ञान विकसित केले आहेत आणि रेकॉर्ड शोध नक्कल (Elmagarmid, Ipeirotis, and Verykios 2007) . देखील कोणते वैयक्तिकरित्या माहिती असते प्रसारित आवश्यकता नाही लिंकेज रेकॉर्ड पध्दती तशीच गोपनीयता आहेत (Schnell 2013) . फेसबुक येथे संशोधक probabilisticsly मतदान वर्तन त्यांचे रेकॉर्ड दुवा एक प्रक्रिया विकसित (Jones et al. 2013) ; या लिंकेज मी Chapter 4 सांगू शकाल की एक प्रयोग मूल्यमापन केले (Bond et al. 2012) .

सरकार प्रशासकीय रेकॉर्ड मोठ्या प्रमाणात सामाजिक सर्वेक्षण दुवा साधण्यास आणखी एक उदाहरण आरोग्य आणि निवृत्ती सर्वेक्षण आणि सामाजिक सुरक्षा प्रशासन येते. अभ्यास अधिक माहितीसाठी, संमती प्रक्रिया बद्दल माहिती समाविष्ट पाहू Olson (1996) आणि Olson (1999) .

Catalist काही राष्ट्रीय सरकार सांख्यिकी कार्यालयात सामान्य कर्मचारी-आहे की एक मास्टर datafile-प्रक्रियेत प्रशासकीय रेकॉर्ड अनेक स्रोत यात प्रक्रिया. सांख्यिकी स्विडन पासून दोन संशोधक विषयावर सविस्तर पुस्तक लिहिले आहे (Wallgren and Wallgren 2007) . (Olmstead काउंटी, मिनेसोटा; मेयो क्लिनिक घरी) युनायटेड स्टेट्स एका कंट्री मध्ये हा दृष्टिकोन उदाहरण पाहू, Sauver et al. (2011) . त्रुटी प्रशासकीय रेकॉर्ड मध्ये दिसून येईल असे अधिक माहितीसाठी, पहा Groen (2012) .