තවදුරටත් විස්තර විචාරය

මෙම කොටස, සැඳහුම ලෙස භාවිතා කිරීමට නිර්මාණය කර ඇති ආඛ්යානයන් ලෙස ගත කිරීමට වඩා ඇත.

  • හැඳින්වීම (වගන්තිය 3.1)

මෙම පරිච්ඡේදයේ තේමාවන් බොහෝමයක් වැනි මහජන මතය පර්යේෂණ ඇමරිකානු සංගමය (AAPOR) දී, ජනාධිපති ලිපිනයන් තුල දෝංකාර කර ඇත Dillman (2002) , Newport (2011) , Santos (2014) , සහ Link (2015) .

සමීක්ෂණය පර්යේෂණ සංවර්ධනය පිළිබඳ වැඩි ඓතිහාසික පසුබිම සඳහා, බලන්න Smith (1976) හා Converse (1987) . සමීක්ෂණය පර්යේෂණ යුග තුනක් යන අදහස ගැන තවත් විස්තර සඳහා, බලන්න Groves (2011) හා Dillman, Smyth, and Christian (2008) (තරමක් වෙනස් වූ යුග තුනක් කඩා දමන ලද).

පළමු සිට සමීක්ෂණය පර්යේෂණ දෙවන යුගය දක්වා පරිවර්තනය තුල උපරිම වේ Groves and Kahn (1979) මුහුණට මුහුණ සහ දුරකථන සමීක්ෂණය අතර සවිස්තරාත්මක කරට සාපේක්ෂව උරුම වන්නේ. Brick and Tucker (2007) අහඹු ඉලක්කම් ඇමතුම් නියැදීම් ක්රම ඓතිහාසික වර්ධනය දෙස ආපසු වගේ.

සමීක්ෂණය පර්යේෂණ සමාජය වෙනස් කිරීමට ප්රතිචාර වශයෙන් පසුගිය වෙනස් කර ඇති ආකාරය ගැන වැඩි විස්තර සඳහා බලන්න, Tourangeau (2004) , Mitofsky (1989) , සහ Couper (2011) .

  • නිරීක්ෂණය එදිරිව ඉල්ලා (වගන්තිය 3.2)

සමහර විට වගඋත්තරකරුවන් තමන් ඔවුන්ගේ අභ්යන්තර රාජ්යයන් දැනුවත් නොවන නිසා ප්රශ්න ඇසීමෙන් අභ්යන්තර රාජ්යයන් පිළිබඳ ඉගෙන ගැටලු සහගත විය හැක. උදාහරණයක් ලෙස, Nisbett and Wilson (1977) මෙම evocative ශීර්ෂය හා පුදුම කඩදාසි ඇති: "අපි දන්නේ වඩා පැවසීම:. මානසික ක්රියාවලිය මත වාචික වාර්තා" කතුවරු එසේ නිගමනය කඩදාසි දී: "විෂයයන් පිළිබඳ ඇතැම් විට (අ) නොදන්නා බව වැදගත් වන්නේ, ප්රතිචාර බලපා ඇති බව ප්රතිචාරය පැවැත්ම (ආ) නොදන්නා උත්තේජක, සහ (ඇ) උත්තේජක ප්රතිචාරය අහිතකර බලපෑම් ඇති වී තිබෙනවා බව ඔබතුමා නොදන්නවාද පැවැත්ම. "

පර්යේෂකයන් වාර්තා හැසිරීම, ආකල්ප කිරීමට හැසිරීම නිරීක්ෂණය වඩාත් කැමති කළ යුතු බව තර්ක සඳහා, බලන්න Baumeister, Vohs, and Funder (2007) (මනෝ විද්යාව) සහ Jerolmack and Khan (2014) සහ ප්රතිචාර (Maynard 2014; Cerulo 2014; Vaisey 2014; Jerolmack and Khan 2014) (සමාජ විද්යාව). ඉල්ලා සිටීමෙන් හා අතර ඇති වෙනස ද පර්යේෂකයන් ප්රකාශ වන අතර මනාප අනාවරණය ගැන කතා එහිදී ආර්ථික විද්යාව, අයකිරීමට. උදාහරණයක් ලෙස, පර්යේෂකයකු ඔවුන් අයිස් ක්රීම් අනුභව හෝ ජිම් යන්නේ (ප්රකාශිත අභිරුචි) හෝ පර්යේෂණ ජනතාව අයිස් ක්රීම් කන්න ආකාරය බොහෝ විට නිරීක්ෂණය කර ජිම් (අනාවරණය අභිරුචි) වෙත යා හැකිය කැමති දැයි ප්රතිචාර දැක්වූවන්ගෙන් කියලා අහන්න. ආර්ථික විද්යාව සඳහන් මනාප දත්ත ඇතැම් වර්ගවල ගැඹුරු සැක සහිත බව ඇත (Hausman 2012) .

මෙම විවාද සිට ප්රධාන තේමාව වාර්තා හැසිරීම හැම විටම නිවැරදි නොවන බව යි. එහෙත්, ස්වයංක්රීයව වාර්තා හැසිරීම නිවැරදි විය යුතු අතර, පොලී ක නියැදියක් එකතු කරන නොහැකි විය හැක නොහැකි වන අතර පර්යේෂකයන් ඒ සඳහා ප්රවේශවීමේ හැකියාව තිබිය නොහැකි විය හැක. මේ අනුව, යම් අවස්ථාවල, මම වාර්තා වන්නේ හැසිරීම ප්රයෝජනවත් විය හැකි බවයි. තවද, මෙම වාද විවාද සිට දෙවන ප්රධාන තේමාව අදහස් හැඟීම් ගැන වාර්තා, දැනුම, බලාපොරොත්තු, හා සෑම විටම නිවැරදි නොවන බව ය. එහෙත්, මෙම අභ්යන්තර රාජ්යයන් ගැන තොරතුරු කිහිපයක් හැසිරීම විස්තර හෝ පැහැදිලි-එවකට කිරීමට ඉල්ලා දෙයක් සුදුසු විය හැකි උපකාර කිරීමට පර්යේෂකයන්-විසින් හෝ අවශ්ය වේ නම්.

  • මුළු සමීක්ෂණය දෝෂයක් (වගන්තිය 3.3)

මුළු සමීක්ෂණය දෝෂය පොත දිග ප්රතිකාර සඳහා, බලන්න Groves et al. (2009) හෝ Weisberg (2005) . මුළු සමීක්ෂණය දෝෂයක් වර්ධනය කිරීම ඉතිහාසය සඳහා, බලන්න Groves and Lyberg (2010) .

ඒ පර්යේෂණ න්යාය පත්රය: නියෝජනය අනුව, නොවන ප්රතිචාරය හා-ප්රතිචාරය නොවන නැඹුරුව පිළිබඳ කරුණු විශාල හඳුන්වා සමාජ විද්යා සමීක්ෂණ දී Nonresponse පිළිබඳ ජාතික පර්යේෂණ සභාව වාර්තාව (2013) . තවත් ප්රයෝජනවත් දළ විශ්ලේෂණයක් මගින් ලබා (Groves 2006) . එසේම, නිල සංඛ්යා ලේඛන ජර්නල්, රාජ්ය ජනමත කාර්තුමය, සහ සමාජ විද්යා දේශපාලන ඇමරිකානු ඇකඩමිය හා පුරාවෘත්ත මුළු විශේෂ ප්රශ්න-පිළිතුරු නොවන මාතෘකාව මත පළ කර ඇත. අවසාන වශයෙන්, ප්රතිචාර අනුපාතයක් ගණනය ඇත්තටම විවිධ ක්රම පවතින බවත්; මහජන මතය පර්යේෂකයන් ඇමරිකානු සංගමය (AAPOR) විසින් වාර්තාවේ සවිස්තරාත්මකව මේ ප්රවේශ විස්තර කර ඇත (Public Opinion Researchers} 2015) .

1936 සාහිත්ය Digest ඡන්ද විස්තර අධ්යයනය කර තිබේ (Bryson 1976; Squire 1988; Cahalan 1989; Lusinchi 2012) . එය ද හිතුමතයේ දත්ත රැස් අනතුරු ඇඟවීමට උපමාවක් ලෙස භාවිතා කර ඇත (Gayo-Avello 2011) . 1936 දී, ජෝර්ජ් ගැලප් නියැදීම් වඩා විදග්ධ ආකාරයෙන් භාවිතා කරන අතර, ඉතා කුඩා සාම්පල සමග වඩා නිවැරදි ඇස්තමේන්තු නිෂ්පාදනය කිරීමට හැකි විය. සමීක්ෂණය පර්යේෂණ සංවර්ධනය සාහිත්ය Digest කට ගැලප් සාර්ථකත්වය වැදගත් සන්ධිස්ථානයක් විය (Converse 1987, Ch 3; Ohmer 2006, Ch 4; Igo 2008, Ch 3) .

මිනුම් අනුව, ප්රශ්නාවලි නිර්මාණය සඳහා විශාල පළමු සම්පතක් වන Bradburn, Sudman, and Wansink (2004) . ආකල්පය ප්රශ්න කෙරෙහි විශේෂයෙන්ම අවධානය යොමු තව තවත් දියුණු ප්රතිකාර සඳහා, බලන්න Schuman and Presser (1996) . පෙර-පරීක්ෂණ ප්රශ්න මත තවත් ලබා ගත හැක Presser and Blair (1994) , Presser et al. (2004) , සහ 8 වන පරිච්ඡේදයේ Groves et al. (2009) .

සමීක්ෂණය පිරිවැය සහ සමීක්ෂණය දෝෂ අතර වෙළෙඳ ලකුණු සම්භාව්ය, පොතක් තරම් දිග ප්රතිකාර Groves (2004) .

  • (3.4 වගන්තිය) මා කවුද

සම්මත සම්භාවිතාව නියැදීම් ක්ලැසික් පොත-දිග ප්රතිකාර හා තක්ෙසේරු වේ Lohr (2009) (වැඩි හඳුන්වාදීමේ) සහ Särndal, Swensson, and Wretman (2003) (වැඩි දියුණු). පශ්චාත්-පහත් භේද හා සම්බන්ධ ක්රම ඒ සම්භාව්ය පොත-දිග ප්රතිකාර Särndal and Lundström (2005) . සමහර ඩිජිටල් යුගයට සැකසුම් පර්යේෂකයන් නොව අතීතයේ දී බොහෝ විට සැබෑ වූ නොවන ප්රතිචාර දැක්වූ ගැන ටිකක් විතර දන්නවා. පර්යේෂකයන් නොවන ප්රතිචාර දැක්වූවන්ගෙන්-පිළිබඳ තොරතුරු ඇති වූ විට ප්රතිචාර නොවන ගැලපුම් විවිධ ආකාර හැකි (Kalton and Flores-Cervantes 2003; Smith 2011) .

වන, Xbox අධ්යයනය Wang et al. (2015) (සමහර විට "මිස්ටර් P" නමින් ද්රව්ය අවශ්යතා,) multilevel ප්රතිපායන හා පශ්චාත් පහත් භේද නමැති තාක්ෂනය තක්සේරු කිරීමට සෛල බොහෝ, බොහෝ සෛල පවතින විට පවා අදහස් පර්යේෂකයන් ඉඩ භාවිතා කරයි. මෙම තාක්ෂණය සිට ඇස්තමේන්තු ගුණාත්මකභාවය පිළිබඳ විවාදයට නොමැති වුවද, එය ගවේෂණය කිරීමට බලාපොරොත්තු ප්රදේශයේ මෙන් පෙනේ. මෙම ක්රමවේදය පළමු සඳහා භාවිතා කරන ලදී Park, Gelman, and Bafumi (2004) , හා ඉන් පසුව භාවිතා කිරීම සහ විවාදය ඇති වී තිබෙන (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) . තනි තනි බර හා සෛල මත පදනම් කිරුම් පඩි අතර ඇති සම්බන්ධය ගැන තවත් විස්තර සඳහා බලන්න Gelman (2007) .

බර වෙබ් සමීක්ෂණ සඳහා වෙනත් ප්රවේශයන් සඳහා, බලන්න Schonlau et al. (2009) , Valliant and Dever (2011) , සහ Bethlehem (2010) .

ආදර්ශ ගැලපෙන විසින් යෝජනා කරන ලදී Rivers (2007) . Bethlehem (2015) නියැදි ගැලපෙන කාර්ය සාධනය ඇත්තටම වෙනත් නියැදීම් ප්රවේශයන් (උදා, ස්ථරීභූත නියැදීම්) සහ අනෙකුත් ගැලපීම් ප්රවේශයන් (උදා: පශ්චාත්-පහත් භේද) සමාන වන බව තර්ක කරයි. සමඟ අමුත්තන් පුවරු ගැන තවත් විස්තර සඳහා, බලන්න Callegaro et al. (2014) .

සමහර විට පර්යේෂකයන් සම්භාවිතාව සාම්පල හා සම්භාවිතා නොවන සාම්පල සමාන ගුණාත්මක ඇස්තමේන්තු යටත් බව සොයා ගෙන ඇත (Ansolabehere and Schaffner 2014) , නමුත් වෙනත් සැසඳීම් සම්භාවිතාව නොවන සාම්පල වඩාත් නරක අතට කරන්න බව සොයා ගෙන ඇත (Malhotra and Krosnick 2007; Yeager et al. 2011) . මෙම වෙනස්කම් සඳහා හැකි එක් හේතුවක් සම්භාවිතාව නොවන සාම්පල කාලයත් වැඩිදියුණු වී ඇති බව ය. සම්භාවිතාව නොවන නියැදීම් ක්රම වඩා අශුභවාදී දැක්ම සඳහා නොවන සම්භාවිතාව නියැදිය ලබාගත මත මෙම AAPOR කාර්ය සාධක බලකාය බලන්න (Baker et al. 2013) , මම ද සාරාංශ වාර්තාවේ පහත සඳහන් ආකාරයට විවරණය කියවීම නිර්දේශ.

සම්භාවිතාව නොවන සාම්පල වල නැඹුරුව අඩු කිරීමට බර බලපෑම මත පාර-විශ්ලේෂණය සඳහා, ව ව 2.4 බලන්න Tourangeau, Conrad, and Couper (2013) නිගමනය කිරීමට කතුවරුන් යොමු කරන "වෙනස්කම් ප්රයෝජනවත් නමුත් ප්රමාදී නිවැරදි කිරීම් විය ඇති කරන බවක් පෙනී යයි. . . "

  • (වගන්තිය 3.5) ඇසීමට කෙසේද

Conrad and Schober (2008) ඉදිරි මිනින්දෝරු සම්මුඛ පරීක්ෂණ Envisioning නමින් විසින් සංස්කරණය කරන පරිමාව සපයයි, එය මෙම කොටසේ ඇති තේමාවන් බොහෝ ආමන්ත්රණය කරයි. Couper (2011) සමාන තේමාවන් අමතයි, සහ Schober et al. (2015) නව සැකසුම වලට ගැලපෙන ආකාරයට සකස් කරන බව දත්ත රැස් ක්රම ගුණාත්මක බව ඉහල දත්ත වලට හේතු විය හැකිය ආකාරය පිළිබඳ කදිම උදාහරණයක් සපයයි.

ෆේස්බුක් යෙදුම් සමාජ විද්යාව සමීක්ෂණ සඳහා භාවිතා තවත් වැදගත් උදාහරණයක් ලෙස, බලන්න Bail (2015) .

සඳහා සහභාගි තෘප්තිකර හා වටිනා අත්දැකීම් සමීක්ෂණ සිදු කිරීම මත වැඩි උපදෙස් සඳහා, ගැලපෙන ආකාරයට සකස් නිර්මාණ ක්රමය වැඩ බලන්න (Dillman, Smyth, and Christian 2014) .

Stone et al. (2007) පාරිසරික මොහොතකට තක්සේරු කිරීම සහ අදාළ ක්රම පොතක් දිග ප්රතිකාර ලබා දෙයි.

  • වෙනත් දත්ත සම්බන්ධ සමීක්ෂණ (වගන්තිය 3.6)

Judson (2007) මෙම ප්රවේශය සමහර වාසි සාකච්ඡා, හා උදාහරණ කිහිපයක් ඉදිරිපත් කරයි ", තොරතුරු ඒකාබද්ධ" ලෙස සමීක්ෂණ හා පරිපාලන දත්ත ඒකාබද්ධ කිරීමේ ක්රියාවලිය විස්තර කර ඇත.

පර්යේෂකයන් ඩිජිටල් අංශු මාත්ර හා පරිපාලන දත්ත භාවිතා කළ හැකි තවත් ආකාරයක් නිශ්චිත ලක්ෂණ සමග ජනතාව සඳහා නියැදි රාමුවක්. කෙසේ නමුත්, මේ වින්දනයක් භාවිතා කිරීමට මෙම වාර්තා ද පෞද්ගලිකත්වය සඳහා අදාළ ප්රශ්න නිර්මාණය කළ හැකි ප්රවේශ (Beskow, Sandler, and Weinberger 2006) .

වැඩිවී ඉල්ලමින් සම්බන්ධයෙන්, මෙම ප්රවේශය එය මම එය විස්තර කර ඇත ආකාරය සිට පෙනී ගියත් ලෙස අලුත් දෙයක් නොවේ. මෙම ප්රවේශය සංඛ්යා ලේඛන ආකෘතිය මත පදනම් පශ්චාත් පහත් භේද විශාල ප්රදේශ තුන ගැඹුරු සම්බන්ධකම් (Little 1993) , දෝෂාරෝපණ (Rubin 2004) , හා කුඩා ප්රදේශ ඇස්තමේන්තු (Rao and Molina 2015) . එය ද වෛද්ය පර්යේෂණ අන්වාදේශ විචල්යයන් භාවිතය සම්බන්ධ වේ (Pepe 1992) .

ඩිජිටල් හෝඩුවාවක් දත්ත ලබාගැනීමට සම්බන්ධයෙන් සදාචාරාත්මක කරුණු වලට අමතරව, වැඩිවී ඉල්ලමින් ද ජනතාව සමීක්ෂණයක් හෙළි කිරීමට තෝරා නොවන පිණිස සංවේදී ගති ලක්ෂණ දැක්වීමට භාවිතා කළ හැකි (Kosinski, Stillwell, and Graepel 2013) .

දී පිරිවැය සහ කාලය ඇස්තමේන්තු Blumenstock, Cadamuro, and On (2015) විචල්ය පිරිවැය, එනම් එක් අමතර පිරිවැය වැඩි යොමු සමීක්ෂණය-හා ඒ ඇමතුම දත්ත පවිත්ර කිරීම හා කටයුතු කිරීමට එම වියදම ස්ථාවර පිරිවැය ඇතුලත් වී නැත. පොදුවේ ගත් කල, වැඩිවී ඉල්ලමින් බොහෝ විට ඉහළ ස්ථාවර පිරිවැයක් සහ ඩිජිටල් පර්යේෂණ කිරීමට සමාන අඩු විචල්ය පිරිවැය (පරිච්ඡේදය 4 බලන්න) වනු ඇත. භාවිතා වන දත්ත මත වැඩි විස්තර Blumenstock, Cadamuro, and On (2015) කඩදාසි වේ Blumenstock and Eagle (2010) හා Blumenstock and Eagle (2012) . බහු imputuation සිට ප්රවේශයන් (Rubin 2004) වැඩිවී ඉල්ලමින් සිට ඇස්තමේන්තු අවිනිශ්චිත අල්ලා උදව් විය හැක. පර්යේෂකයන්, සමස්ත දිනයට වඩා එක් එක් තනි මට්ටමේ ගති ලක්ෂණ ගැන පමණක් ඉල්ලා වැඩිවී කරන්නේ නම්, එවිට එම ප්රවේශයන් King and Lu (2008) හා Hopkins and King (2010) ප්රයෝජනවත් විය හැක. දී මෙම යන්ත්රය ඉගෙනුම් ප්රවේශයන් පිළිබඳ වැඩි විස්තර දැන Blumenstock, Cadamuro, and On (2015) බලන්න James et al. (2013) (වැඩි හඳුන්වාදීමේ) හෝ Hastie, Tibshirani, and Friedman (2009) (වැඩි දියුණු). තවත් ජනප්රිය යන්ත්රය ඉගෙනුම් පෙළපොත් වේ Murphy (2012) .

පොහොසත් ඉල්ලමින් සම්බන්ධයෙන් Ansolabehere හා Hersh තුළ ප්රතිඵල (2012) ප්රධාන පියවරයන් දෙකක් මත hinge: 1) Catalist පිළිබඳ නිවැරදි ස්වාමියා datafile නිෂ්පාදනය කිරීමට බොහෝ විසම දත්ත මූලාශ්රයන් ඒකාබද්ධ කිරීමට ඇති හැකියාව සහ 2) දක්වා සමීක්ෂණ දත්ත සම්බන්ධ කිරීමට Catalist ඇති හැකියාව, තමන්ගේ ස්වාමියා datafile. ඒ නිසා, Ansolabehere හා Hersh ප්රවේශමෙන් මෙම පියවර එක් එක් පරීක්ෂා කර බලන්න.

ස්වාමියා datafile නිර්මාණය කිරීමට, Catalist ඒකාබද්ධ ඇතුළු විවිධ මූලාශ්ර වලින් තොරතුරු එකඟ: එක් එක් තත්ත්වයෙහි සිට බහු ඡන්ද වාර්තා snapshots, ලිපිනය ලේඛකාධිකාරය විසින් තැපැල් කාර්යාලයට ජාතික වෙනස් දත්ත, සහ අනෙකුත් නම් නොකල වාණිජ සේවා සපයන්නන් වෙතින් දත්ත. මේ සියල්ල පිරිසිදු කිරීම හා ඉහල යනවාත් සිදු කරන ආකාරය ගැන මෙම කෲර නැති විස්තර මේ පොතේ විෂය පථය ඉක්මවා ඇත, නමුත් මෙම ක්රියාවලිය, කෙතරම් ප්රවේශම් මුල් දත්ත මූලාශ්රයන් දෝෂ ප්රචාරය කරන අතර දෝෂ හඳුන්වා දෙනු ඇත. Catalist දත්ත සැකසීම සාකච්ඡා සහ එහි අමු දත්ත කිහිපයක් ලබා දීමට කැමති වුවත්, එය පර්යේෂකයන් සමස්ත Catalist දත්ත නල පරීශීලනය කිරීම සඳහා දැරිය නොහැකි විය. ඒ වෙනුවට, පර්යේෂකයන් Catalist දත්ත ගොනුව කිසියම් නොදන්නා, සමහර විට දැනගත නොහැකි, දෝෂ ප්රමාණය එහිදී තත්වයක් විය. විවේචකයෙක් වන Catalist ස්වාමියා දත්ත ගොනුව තුළ CCES හා හැසිරීම පිළිබඳ සමීක්ෂණ වාර්තා අතර විශාල වෙනස්කම් ස්වාමියා දත්ත ගොනුව තුළ වැරදි නිසා බව අනුමාන හැකි වූ නිසා නොවේ වගඋත්තරකරුවන් විසින් උත්සාහ දැරීමත් මෙම බරපතල කනස්සල්ල වේ.

Ansolabehere හා Hersh දත්ත ගුණාත්මක කනස්සල්ල අමතමින් කිරීමට විවිධ ප්රවේශයන් දෙකක් ගත්තා. පළමුව, Catalist ස්වාමියා ගොනුව තුල ඡන්ද ස්වයං වාර්තා ඡන්ද සංසන්දනය අමතරව, පර්යේෂකයන් ද ස්වයං-වාර්තා පක්ෂය, ජාතිය, ඡන්ද ලියාපදිංචි තත්ත්වය (උදා, ලියාපදිංචි වූ හෝ ලියාපදිංචි නොවූ) සහ ඡන්දය ප්රකාශ ක්රමය (උදා, පුද්ගලයෙකු තුළ සාපේක්ෂව නොපැමිණ ඡන්ද) ආදිය සඳහා, Catalist දත්ත සමුදායන් සොයා එම වටිනාකම්. මෙම ජන විකාශ විචල්යයන් හතර සඳහා, පර්යේෂකයන් ඡන්ද වඩා Catalist ස්වාමියා ගොනුව තුල සමීක්ෂණ වාර්තාව සහ දත්ත අතර ගිවිසුමට වඩා ඉහල මට්ටම් සොයාගෙන ඇත. මේ අනුව, Catalist ස්වාමියා දත්ත ගොනුව ඡන්දය, එය දුප්පත් සමස්ත ගුණාත්මක නොවන බව යෝජනා හැර වෙනත් ගති ලක්ෂණ සඳහා උසස් තත්ත්වයේ තොරතුරු ඇති බව පෙනී යයි. දෙවනුව, කොටසක් Catalist, Ansolabehere හා Hersh සිට දත්ත භාවිතා ප්රාන්ත ඡන්ද වාර්තා ගුණාත්මක විවිධ පියවර තුනක් සොයා සංවර්ධනය, ඔවුන් අධික ලෙස වාර්තා ඡන්දය සඳහා ඇස්තමේන්තුගත අනුපාතය මෙම දත්ත ගුණාත්මක පියවර ඕනෑම අවශ්යයෙන්ම සම්බන්ධයක් නැති බව සොයා, අසාමාන්ය ලෙස අඩු දත්ත ගුණාත්මක කෝරල විසින් අධික ලෙස වාර්තා කිරීමේ වැඩි පොලී අනුපාත දුවවනු නොවන බව යෝජනා කරමු.

මෙම ස්වාමියා ඡන්ද ගොනුව නිර්මාණය සලකන විට, විභව වැරදි දෙවන මූලාශ්රය එය සමීක්ෂණය වාර්තා සම්බන්ධ වේ. උදාහරණයක් ලෙස, මෙම සම්බන්ධතාවය, සාවද්ය සිදු වේ නම් එය අධික ලෙස ඇස්තමේන්තු වාර්තා හා වලංගු ඡන්ද හැසිරීම අතර වෙනස ක තුඩුදිය හැකි (Neter, Maynes, and Ramanathan 1965) . සෑම පුද්ගලයෙකුට දෙකම දත්ත මූලාශ්රයන් සිටින බව ස්ථාවර, අනුපම අනන්යකාරකය තිබුණා නම්, එසේ නම් සම්බන්ධතාවය නිසාම කුදු වනු ඇත. එක්සත් ජනපදය හා අනෙකුත් බොහෝ රටවල්, කෙසේ වෙතත්, කිසිදු විශ්ව අනන්යකාරකය පවතී. තවද, එහි සිටි පවා නම් එවැනි අනන්යකාරකය දෙනා බොහෝ විට පර්යේෂකයන් සමීක්ෂණ ලබා දෙන්න පසුබට වනු ඇත! නම, ස්ත්රී පුරුෂ භාවය, උපන් වසර හා නිවසේ ලිපිනය: මේ අනුව, Catalist එක් එක් වගඋත්තරකරු ගැන තොරතුරු කොටස් හතරක් මේ අවස්ථාවේ දී, අසම්පූර්ණ හඳුනා භාවිතා කර්තව් කරන්න සිදු වුණා. උදාහරණයක් ලෙස, Catalist මෙම CCES දී Homie J සිම්ප්සන් නම් තීරණය කරන්නට තම ස්වාමියා දත්ත ගොනුව තුළ හෝමර් ජේ සිම්ප්සන් ලෙස එම පුද්ගලයා විය. භාවිතයේ දී, ගැලපෙන පර්යේෂකයන් සඳහා තත්වය තවත් නරක කිරීමට දුෂ්කර හා ව්යාකූල ක්රියාවලිය, සහ,, Catalist එහි ගැලපෙන තාක්ෂණය වානිජ ලෙසයි.

ගැලපෙන ඇල්ගොරිතම තහවුරු කිරීම සඳහා, ඔවුන් අභියෝග දෙකක් මත විශ්වාසය තබයි. මෙම MITRE සංස්ථාව: පළමුව, Catalist ස්වාධීන තෙවන පාර්ශව විසින් පවත්වාගෙන ගොස් ඇති බවට ගැලපෙන තරගය සහභාගි වූහ. MITRE, සහභාගි වන සම්පාත කිරීමට ඝෝෂාකාරී දත්ත ගොනු දෙකක්, සහ විවිධ කණ්ඩායම් MITRE කිරීමට ඇති හොඳම ගැලපෙන නැවත තරග සපයන ලදී. MITRE ම නිවැරදි ගැලපෙන ඔවුන් කණ්ඩායම් හැකිවුයේ ලකුණු දැන සිටි නිසා. තරග කරන සමාගම් 40 ක්, Catalist දෙවැනි ස්ථානයට පැමිණියේ ය. හිමිකාර තාක්ෂණය ස්වාධීන, තෙවන පාර්ශවීය ඇගයීම මේ ආකාරයේ ඉතා දුර්ලභ හා ඇදහිය නොහැකි තරම් වටිනා ය; එය අපට Catalist ගේ ගැලපෙන පටිපාටි රාජ්ය නවීන ඉඳුරාම බව විශ්වාසය ලබා දිය යුතුය. එහෙත්, ප්රමාණවත් තරම් රාජ්ය නවීන හොඳ ද? මෙම ගැලපෙන තරගය අමතරව, Ansolabehere හා Hersh Catalist සඳහා තමන්ගේ ගැලපෙන අභියෝගය නිර්මාණය. මීට පෙර ව්යාපෘතිය, Ansolabehere හා Hersh ෆ්ලොරිඩා සිට ඡන්ද වාර්තා එකතු කර ඇත. ඔවුන් Catalist කිරීමට කොතරම් දුරකට සංස්කරණය ඔවුන්ගේ ක්ෂේත්ර කිහිපයක් සමග මෙම වාර්තා සමහරක් ලබා පසුව ඔවුන්ගේ සැබෑ වටිනාකම් මෙම ක්ෂේත්රයන් Catalist වාර්තාවන් සාපේක්ෂව. එහෙත් වාසනාවකට මෙන්, Catalist වාර්තාවන් Catalist තම ස්වාමියා දත්ත ගොනුව මතට අර්ධ ඡන්ද වාර්තා සම කළ හැකි බව පෙන්නුම් කරමින්, එම අගතිගාමී වටිනාකම් සමීප විය. මෙම අභියෝග දෙකක්, තෙවන පාර්ශවීය හා Ansolabehere හා Hersh විසින් එක් එක්, අපි ඔවුන්ගේ නිශ්චිත ක්රියාත්මක කිරීම අප සමාලෝචනය නොහැකි වුවත්, Catalist ගැලපෙන ඇල්ගොරිතම පිළිබඳ හොඳ විශ්වාසයක් දෙන්න.

පෙර බොහෝ ඡන්ද සාධාරණීකරණය කිරීමට ප්රයත්න දරා ඇත. සාහිත්ය කෘති පිළිබඳ දළ විශ්ලේෂණයක් සඳහා, බලන්න Belli et al. (1999) , Berent, Krosnick, and Lupia (2011) , Ansolabehere and Hersh (2012) , සහ Hanmer, Banks, and White (2014) .

එය මෙම නඩුවේ පර්යේෂකයන් Catalist දත්ත ගුණාත්මක විසින් දිරිමත් කරන නමුත්, වාණිජ වෙළෙන්දන් වෙනත් ඇගයීම් උද්යෝගිමත් බවක් ඇති බව සටහන් කිරීම වැදගත් වේ. : පර්යේෂකයන් අලෙවි පද්ධති ගෲප් (Acxiom, Experian, සහ InfoUSA ම එකට සමාගම් තුනක් දත්ත ඒකාබද්ධ වන) සිට පාරිභෝගික ගොනු කිරීම සඳහා සමීක්ෂණ දත්ත විට බාල තත්ත්වයේ සොයා ගෙන ඇත (Pasek et al. 2014) . ඒ (දත්ත ගොනු නිවැරදි වනු ඇතැයි අපේක්ෂා බව පර්යේෂකයෝ සමීක්ෂණ ප්රතිචාර නොගැලපේ, ප්රශ්න විශාල ප්රමාණයක්, සහ අතුරුදහන් දත්ත රටාව සඳහා datafile අතුරුදහන් කළ දත්ත වාර්තා සමීක්ෂණය වටිනාකම සහසම්බන්ධිත වූ, වේ වෙනත් වචනවලින් අතුරුදන් දත්ත ක්රමානුකූලව විය , අහඹු නැත).

සමීක්ෂණ හා පරිපාලන දත්ත අතර වාර්තා සම්බන්ධය ගැන තවත් විස්තර සඳහා, බලන්න Sakshaug and Kreuter (2012) හා Schnell (2013) . පොදුවේ වාර්තා සම්බන්ධය ගැන තවත් විස්තර සඳහා, බලන්න Dunn (1946) හා Fellegi and Sunter (1969) (ඓතිහාසික) සහ Larsen and Winkler (2014) (නූතන). සමාන ප්රවේශයන් ද හඳුනා ගැනීම අනුපිටපත්, එවැනි දත්ත deduplication, නිදසුනක් හඳුනා ගැනීම, නම ගැලපෙන ලෙස නම් යටතේ පරිගණක විද්යාව සංවර්ධනය සහ වාර්තා හඳුනාගැනීම අනුපිටපත් කර ඇත (Elmagarmid, Ipeirotis, and Verykios 2007) . තොරතුරු පෞද්ගලිකව හඳුනා සම්ප්රේෂණය අවශ්ය නොවන වාර්තා සම්බන්ධය පරීක්ෂා කරන ක්රම ආරක්ෂා පෞද්ගලිකත්වය ද පවතී (Schnell 2013) . ෆේස්බුක් හි පර්යේෂකයින් probabilisticsly ඡන්ද හැසිරීම ඔවුන්ගේ වාර්තා සම්බන්ධ කිරීමට ක්රියා පටිපාටියක් සංවර්ධනය (Jones et al. 2013) ; මෙම සම්බන්ධතාවය නිසාම මම පරිච්ඡේදය 4 ගැන ඔබට කියන්නම් බව අත්හදා ඇගයීමට සිදු කරන ලදී (Bond et al. 2012) .

රජයේ පරිපාලන වාර්තා කිරීමට විශාල පරිමානයේ සමාජ සමීක්ෂණය සම්බන්ධ තවත් උදාහරණයක් සෞඛ්ය හා විශ්රාම සමීක්ෂණ හා සමාජ ආරක්ෂක පරිපාලනය පැමිණෙන්නේ. කැමැත්ත පටිපාටිය පිළිබඳ තොරතුරු ඇතුළු, එම අධ්යයන ගැන තවත් විස්තර සඳහා, බලන්න Olson (1996) හා Olson (1999) .

ප්රධාන datafile වන Catalist සමහර ජාතික ආන්ඩු සංඛ්යානමය කාර්යාල පොදු සේවක-බව ක්රියාවලිය වෙත පරිපාලන වාර්තා බොහෝ ආරංචි මාර්ග ඒකාබද්ධ කිරීමේ ක්රියාවලිය. සංඛ්යාලේඛන ස්වීඩනය පර්යේෂකයන් දෙකක් මාතෘකාව පිළිබඳ සවිස්තරාත්මක පොත ලියා ඇත (Wallgren and Wallgren 2007) . ඇමරිකා එක්සත් ජනපදය (Olmstead කවුන්ටි, මිනසෝටා, එම මායෝ සායනය ගෙදර) තනි රෙට් මෙම ප්රවේශය සඳහා උදාහරණයක් ලෙස, බලන්න Sauver et al. (2011) . පරිපාලන වාර්තා පෙනී හැකි බව දෝෂ ගැන තවත් විස්තර සඳහා, බලන්න Groen (2012) .