2.3.3 අක්රිය

විශාල දත්ත මූලාශ්රවල මැනීම හැසිරීම වෙනස් කිරීමට බොහෝ සෙයින් ඉඩ තිබේ.

සමාජ පර්යේෂනයේ එක් අභියෝගයක් වන්නේ පර්යේෂකයන් විසින් ඔවුන් නිරීක්ෂණය කරනු ලබන බව දැන සිටින විට ඔවුන්ගේ හැසිරීම වෙනස් කළ හැකි බවයි. සමාජ විද්යාඥයින් මෙම ප්රතික්රියාශීලීතාවය සාමාන්යයෙන් හඳුන්වන්නේ (Webb et al. 1966) . නිදසුනක් වශයෙන්, ක්ෂේත්ර අධ්යයනවලට වඩා විද්යාගාර අධ්යයන කටයුතුවලදී වඩා ත්යාගශීලී විය හැකි බැවින් ඒවා කලින් නිරීක්ෂනය කරන බව (Levitt and List 2007a) හොඳින් දැන සිටිති. පර්යේෂකයන් බොහෝ දෙනෙක් පොරොන්දු වී ඇති විශාල දත්තවල එක් අංගයක් වන්නේ ඔවුන්ගේ දත්ත හසුකර ගන්නා බව හෝ සාමාන්යයෙන් ඔවුන්ගේ හැසිරීම තවදුරටත් වෙනස් නොවන බව මෙම දත්ත රැස්කිරීම් වලට හුරු පුරුදු වී ඇති බව හ්භාගීවනනනට සාමාන්යයෙන් නොදැනේ. එබැවින් හ්භාගීවනනනට ප්රතික්රියාවක් නොමැති බැවින්, කලින් දත්තයන් නිවැරදිව මැනිය නොහැකි හැසිරීම් අධ්යයනය කිරීමට විශාල දත්ත මූලාශ්ර භාවිතා කළ හැකිය. නිදසුනක් වශයෙන් Stephens-Davidowitz (2014) විසින් එක්සත් ජනපදයේ විවිධ ප්රදේශයන්හි වර්ගවාදී සජීවනය මැනීම සඳහා සෙවුම් එන්ජින් විමසීම්වල දී වර්ගවාදී පදවල ව්යාප්තිය භාවිතා කළේය. සමීක්ෂණ හා විශ්ලේෂණය වැනි වෙනත් ක්රම භාවිතා කිරීම අසීරු නොවන සහ විශාල (non-active) සහ විශාල (සෙවීම් දත්ත 2.3.1 බලන්න) ස්වභාවය දුෂ්කර වේ.

කෙසේ වෙතත්, නොරැකිටීම් මෙම දත්ත කෙසේ හෝමළ ජනතාවගේ හැසිරීම හෝ ආකල්ප කෙලින්ම පිළිබිඹු කරන බවට සහතික නොවේ. නිදසුනක් වශයෙන්, සම්මුඛ පරීක්ෂණයට පාදක වූ අධ්යයනයක එක් විචාරකයෙක් පැවසුවේ, "මට ගැටලුවක් නැති බව මම නොදනිමි. මම ඒවා ෆේස්බුක් මත තබා නොගන්නෙමි" (Newman et al. 2011) . වෙනත් වචන වලින් කියතොත්, සමහර විශාල දත්ත මූලාශ්ර නොකරන අයුරින් වුවද, ඔවුන් කැමති වන්නේ සමාජයට සුදුසු නොවන පක්ෂග්රාහී නොවී සිටීමයි. එමඟින් ජනතාවගේ ප්රශංසාවට ලක්වීමට ඇති ප්රවනතාවයන් වන්නේ, හොඳම ක්රමයයි. තවදුරටත්, මම පරිච්ඡේදයේ පසුව විස්තර කරමි. විශාල දත්ත මූලාශ්ර වලින් අල්ලා ගන්නා හැසිරීම සමහර අවස්ථාවලදී වේදිකාවේ අයිතිකරුවන්ගේ අරමුණු වලට බලපෑවේ, ගැටළුවක් වන ඇල්ගොරිතමය ව්යාකූලත්වයකි . අවසාන වශයෙන්, පර්යේෂණ සඳහා වාසිදායක නොවන නමුත්, ජනතාවගේ හැසිරීම හා නොදැනුවත්වම ජනතාවගේ හැසිරීම් හසුරුවීම, 6 වන පරිච්ඡේදයේ විස්තර කර ඇති ආචාර ධර්ම පිළිබඳ ගැටළු මතු කරයි.

මා විසින් විස්තර කර ඇති දේ තුන, විශාල, හැම විටම සහ අක්රියව ඇති බව, සාමාන්යයෙන්, නමුත් සෑම විටම සමාජ පර්යේෂණ සඳහා වාසිදායක නොවේ. ඊළඟට, බොහෝ දත්ත මූලාශ්රවල ඇති ගුණාංග හතක් - අසම්පූර්ණ, ප්රවේශය නැති, නිරූපණය නොකරන, ප්ලාවිත කිරීම, ඇල්ගොරිතම වශයෙන් ව්යාකූල වන, අපිරිසිදු හා සංවේදී වන අතර, සාමාන්යයෙන් නමුත්, සෑම විටම පර්යේෂණ සඳහා ගැටළු නිර්මානය කරයි.