3.6.2 පොහොසත් ඉල්ලමින්

එය ව්යාකූල විය හැකි වුවත්, වු ඉල්ලමින් බලවත් විය හැක.

ඩිජිටල් හෝඩුවාවක් දත්ත incompleteness සමඟ කටයුතු කිරීම සඳහා වෙනත් ප්රවේශයක් මම පොහොසත් ඉල්ලමින් කතා කරන්නම් කරන ක්රියාවලියක්, සමීක්ෂණ දත්ත සමඟ එය සෘජුවම පොහොසත් කිරීමට ය. වු ඉල්ලමින් එක් උදාහරණයක් පිළිබඳව අධ්යයනය කිරීමයි Burke and Kraut (2014) මම කලින් පරිච්ඡේදය (වගන්තිය 3.2) දී, ෆේස්බුක් අනොන්ය ලෙස මිත්රත්වය ශක්තිය වැඩි ද යන්න ගැන විස්තර කරන,. එවැනි අවස්ථාවක දී, බර්ක් සහ Kraut ෆේස්බුක් ලඝු-සටහන දත්ත සමඟ සමීක්ෂණ දත්ත ඒකාබද්ධ.

බර්ක් සහ Kraut වැඩ කළ බව සැකසුම, කෙසේ වෙතත්, ඔවුන් පර්යේෂකයන් මුහුණ ඉල්ලා පොහොසත් කරන්නේ ලොකු ප්රශ්න දෙකක් සමග කටයුතු කිරීමට සිදු නොවන බව සැබෑවකි. පළමුව, ඇත්තටම එකට දත්ත කාණ්ඩ-වාර්තාගත සම්බන්ධතාවය නිසාම නමැති ක්රියාවලියක් සබැඳීම ද අනෙක් දී උචිත වාර්තාවක් සමඟ එක් දත්ත සමුදාය තුළ වාර්තාගත ක ගැලපෙන දුෂ්කර හා දෝෂ අවම විය දත්ත සමුදාය-හැක (අපි පහත මෙම ගැටලුව පිළිබඳ උදාහරණයක් බලන්නම් ). වු ඉල්ලමින් දෙවන ප්රධාන ප්රශ්නය පර්යේෂකයන් තක්සේරු කිරීම සඳහා ඩිජිටල් අංශු මාත්ර ගුණාත්මක නිතර අසීරු වනු ඇත බව ය. උදාහරණයක් ලෙස, සමහර විට එය එකතු කරන හරහා මෙම ක්රියාවලිය වානිජ හා Chapter 2. විස්තර වෙනත් වචන වලින් කිවහොත්, ගැටලු පිලිබඳ බොහෝ ඉහළය විය හැක, වු ඉල්ලමින් නිතර සමීක්ෂණ දෝෂ අවම සම්බන්ධ කිරිමේ නොදන්නා කළු කොටුව දත්ත ආරංචි මාර්ග ඇතුළත් වේ ගුණාත්මක. මේ ප්රශ්න දෙක හඳුන්වා ඇති මෙම කාරණා පිළිබඳව නොතකා, ස්ටීවන් Ansolabehere හා Eitan Hersh විසින් පෙන්නුම් ලෙස මෙම මූලෝපාය සමග වැදගත් පර්යේෂණ සිදු කිරීමට හැකි වේ (2012) එක්සත් ජනපදය තුළ ඡන්ද රටාවන් මත ඔවුන්ගේ පර්යේෂණ. Ansolabehere හා Hersh වර්ධනය වූ උපාය මාර්ග බොහෝ වු ඉල්ලමින් වෙනත් යෙදීම් ප්රයෝජනවත් වනු ඇත නිසා එය සමහර විස්තර මෙම අධ්යයනය හරහා යාමට වටිනවා.

මැතිවරණයේ ඡන්දය ප්රකාශ කිරීමේ ප්රතිශතය දේශපාලන විද්යාව පුළුල් පර්යේෂණ විෂය වී ඇති අතර, අතීතයේ දී, ඡන්දය ඇයි කරන පර්යේෂකයන්ට 'අවබෝධය සාමාන්යයෙන් සමීක්ෂණ දත්ත විශ්ලේෂණය මත පදනම් වී ඇත. එක්සත් ජනපදය තුල ඡන්දය, කෙසේ වෙතත්, (ඇත්තෙන්ම, ආණ්ඩුව කරන එක් එක් පුරවැසියා ඡන්ද වාර්තා නොකරන) එක් එක් පුරවැසියා ඡන්දය තිබේද ආණ්ඩුව වාර්තාවල අසාමාන්ය හැසිරීම් වේ. වසර ගණනාවක් තිස්සේ, මෙම රාජ්ය ඡන්දය වාර්තා රට පුරා විවිධ පළාත් පාලන කාර්යාල විසිරී කඩදාසි ආකෘති පත්ර, මත ලබා ගත විය. මෙම දේශපාලන විද්යාඥයන් ආසනයේ සම්පූර්ණ චිත්රයක් ඇති කිරීමට හා ඔවුන්ගේ සැබෑ ඡන්ද හැසිරීම ඡන්දය ගැන මිනිසුන් හා සමීක්ෂණ කියන දේ සංසන්දනය කිරීම සඳහා එය කළ නොහැකි දුෂ්කර, නමුත්, සිදු (Ansolabehere and Hersh 2012) .

එහෙත්, දැන් මේ ඡන්ද වාර්තා ඩිජිටල් ඇති අතර, පෞද්ගලික සමාගම් ගණනාවක් ක්රමානුකූලව එකතු සහ සියලු ඇමරිකානුවන් ඡන්දය හැසිරීම වාර්තා විස්තීර්ණ ස්වාමියා ඡන්ද ගොනු නිෂ්පාදනය කිරීමට මෙම ඡන්ද වාර්තා ඒකාබද්ධ කර ඇත. Ansolabehere හා Hersh මෙම සමාගම්-Catalist LCC-දී ආසනයේ වඩා හොඳ චිත්රයක් දියුණු කිරීම සඳහා සහයෝගය ලබාදීමට තම ස්වාමියා ඡන්ද ගොනුව භාවිතා කිරීම සඳහා එක් සමග අත්වැල් බැඳ ගත්තා. තවද, එය සමාගම විසින් එකතු සහ ශික්ෂිත ඩිජිටල් වාර්තා මත රඳා නිසා, එය වාසි ගණනාවක් සමාගම් ආධාර තොරව සහ ඇනලොග් වාර්තා භාවිත කරමින්ද සිදු කර ඇති බව පර්යේෂකයන් විසින් පෙර උත්සාහයන් වැඩි කළේය.

2 වන පරිච්ඡේදය තුළ ඩිජිටල් හෝඩුවාවක් ආරංචි මාර්ග බොහෝ මෙන්, Catalist ස්වාමියා ගොනුව, ජනගහන බොහෝ ආකල්පමය, සහ Ansolabehere හා Hersh අවශ්ය බව චර්යාත්මක තොරතුරු ඇතුළත් වුණේ නැහැ. මෙම තොරතුරු වලට අමතරව, Ansolabehere හා Hersh වාර්තා වන්නේ ඡන්ද හැසිරීම වලංගු ඡන්ද හැසිරීම (ie, එම Catalist දත්ත සමුදායේ තොරතුරු) සාපේක්ෂව වැඩි රුචිකත්වයක් වූහ. ඒ නිසා, පර්යේෂකයන් ඔවුන් සමූපකාර කොන්ග්රස් මැතිවරණ අධ්යයනය (CCES), විශාල සමාජ සමීක්ෂණය කොටසක් ලෙස අවශ්ය එම දත්ත එකතු කරන ලදී. ඊළඟට, පර්යේෂකයන් Catalist කිරීමට මෙම දත්ත ලබා දුන් අතර, Catalist පර්යේෂකයන් නැවත වලංගු ඡන්ද හැසිරීම (Catalist සිට) ඇතුළත් බව ඒකාබද්ධ දත්ත ගොනුව, ස්වයං වාර්තා ඡන්ද හැසිරීම (CCES සිට) සහ ප්රතිචාර දැක්වූවන්ගෙන් මෙම සංඛ්යා ලේඛන සහ ආකල්ප (CCES සිට ලබා දුන් ). වෙනත් වචන වලින් කිවහොත්, Ansolabehere හා Hersh සමීක්ෂණ දත්ත සමග ඡන්දය දත්ත පොහොසත්, හා එහි ප්රතිඵලයක් ඒකාබද්ධ ගොනු ඔවුන් වත් ගොනු තනි තනිව සක්රීය බව යමක් කිරීමට හැකියාව ලැබෙනවා.

සමීක්ෂණ දත්ත සමග Catalist ස්වාමියා දත්ත ගොනුව පොහොසත් වන විට, Ansolabehere හා Hersh වැදගත් නිගමන තුනක් විය. පළමුව, අධික ලෙස වාර්තා ඡන්දය උග්ර ය: නොවන ඡන්ද දායකයින් අඩක් ඡන්දය වාර්තා කර ඇත. හෝ, එය දෙස බලන තවත් ක්රමයක් කෙනෙක් ඡන්දය වාර්තා නම්, ඔවුන් ඇත්තටම ඡන්දය දුන් බව 80% අවස්ථාවක් පමණක් වේ. දෙවනුව, අධික ලෙස වාර්තා අහඹු නොවේ; අධික ලෙස වාර්තා මහජන කටයුතු යෙදී සිටින ඉහළ ආදායම්, හොඳින් උගත්, කතිකාවතක් අතර වඩාත් සුලභ වේ. වෙනත් වචන වලින් කිවහොත්, ඡන්දය ප්රකාශ කිරීමට බොහෝ දුරට ඉඩ සිටින පුද්ගලයින් ද ඡන්ද ගැන බොරු කිරීමට බොහෝ දුරට ඉඩ ඇත. තෙවන හා වඩාත් තීරණාත්මක නිසා අධික ලෙස වාර්තා ක්රමානුකූලව ස්වභාවය, ඡන්ද දායකයන් හා රාජ්ය නොවන ඡන්ද දායකයින් අතර සැබෑ වෙනස්කම් ඔවුන් හුදෙක් සමීක්ෂණ සිට පෙනී වඩා කුඩා වේ. උදාහරණයක් ලෙස, ශාස්ත්රවේදී උපාධිය සමග එම ඡන්ද වාර්තා කිරීමට 22 ගැන සියයට ඉඩ තිබේ, නමුත් සත්ය ඡන්ද 10 ක් පමණක් සියයට ඉඩ තිබේ. තවද, ඡන්දය පවතින සම්පත් මත පදනම් වූ න්යායන් සැබවින්ම ඡන්ද වඩා ඡන්ද, නව න්යායයන් තේරුම් ගැනීම හා ඡන්ද අනාවැකි පළ කිරීම සඳහා ඉල්ලා සිටී බව ආනුභවික සොයා වාර්තා කරන අනාවැකි පල දී වඩා හොඳ වේ.

එහෙත්, අපට මොන තරම් මෙම ප්රතිඵල විශ්වාස කළ යුත්තේ ඇයි? මෙම ප්රතිඵල දෝෂ නොදන්නා ප්රමාණයක් කළු-කොටුව දත්ත දෝෂ අවම සම්බන්ධ කිරිමේ මත රඳා පවතී මතක තබා ගන්න. 1) Catalist පිළිබඳ නිවැරදි ස්වාමියා datafile සහ 2 නිෂ්පාදනය කිරීමට බොහෝ විසම දත්ත මූලාශ්රයන් ඒකාබද්ධ කිරීමට ඇති හැකියාව) එහි ස්වාමියා datafile කිරීමට සමීක්ෂණ දත්ත සම්බන්ධ කිරීමට Catalist ඇති හැකියාව: වඩාත් විශේෂිකරණය ප්රතිඵල ප්රධාන පියවරයන් දෙකක් මත hinge. මෙම පියවර එක් එක් තරමක් දුෂ්කර වන අතර, එක්කෝ පියවර දෝෂ වැරදි නිගමනවලට පර්යේෂකයන් මඟ පාදනු ඇත. කෙසේ වෙතත්, එය බොහෝ විට පරිමානයේ දී, මේ ප්රශ්න විසඳා සම්පත් ආයෝජනය හැකි නිසා පර්යේෂකයන්, කිසිම පුද්ගලයකු අධ්යයන පර්යේෂකයෙකු හෝ කණ්ඩායමක් ගැලපෙන හැකි බව දත්ත සැකසීම සහ ගැලපෙන දෙකම සමාගමක් ලෙස Catalist දිගටම පැවැත්ම සඳහා තීරණාත්මක වේ. පරිච්ඡේදය අවසානයේ වැඩිදුර කියවීම් දී, මම වැඩි විස්තර කෙසේද Ansolabehere හා Hersh ප්රතිඵල ගැන ලොකු විශ්වාසයක් ඇති මෙම ප්රශ්න විස්තර කරන්න. මෙම විස්තර මෙම අධ්යයනය කිරීමට නිශ්චිත වුවත්, මේ හා සමාන ගැටළු කළු කොටුව ඩිජිටල් හෝඩුවාවක් දත්ත මූලාශ්රයන් වෙත සබැඳෙයි කිරීමට බලාපොරොත්තුවන අනෙක් පර්යේෂකයන් සඳහා මතු වනු ඇත.

පර්යේෂකයන් මේ අධ්යයනය අපට ගත හැකි සාමාන්ය පාඩම් මොනවාද? පළමුව, සමීක්ෂණ දත්ත ඩිජිටල් අංශු මාත්ර පොහොසත් සිට වටිනාකමක් පවතී. දෙවනුව, මෙම ගොඩ ගසා වුවත්, වාණිජ දත්ත මූලාශ්ර "බිම සත්යය", සමහර අවස්ථාවල දී ඔවුන් ප්රයෝජනවත් විය හැකි සැලකිය යුතු නැත. ඇත්ත වශයෙන්ම, එය (ඔවුන් හැම විටම හීනව ඇත සිට) නොවේ පරම සත්යය මේ දත්ත මූලාශ්රයන් සන්සන්දනය කිරීම තමයි හොඳම දේ. ඒ වෙනුවට, එය අනිවාර්යයෙන් මෙන්ම දෝෂ ඇති අනෙකුත් ලබා ගත හැකි දත්ත මූලාශ්රයන් සන්සන්දනය වඩා හොඳ වේ.