2.4.3 ශූන්යයක් සන්නිකර්ෂණය පරීක්ෂණ

අප විසින් හෝ කළ නොහැකි අත්හදා බැලීම් අපට ආසන්න විය හැකිය. විශාල දත්ත මූලාශ්රවලින් විශේෂයෙන් ප්රයෝජනවත් වන ප්රවේශයන් දෙකක් ස්වාභාවික අත්හදා බැලීම් සහ ගැලපීම සිදු කරයි.

වැදගත් වැදගත් විද්යාත්මක හා ප්රතිපත්තිමය ප්රශ්න හේතු වී තිබේ. උදාහරණයක් ලෙස වැටුප් පිළිබඳ රැකියා පුහුණු වැඩසටහනේ බලපෑම කුමක්ද? මෙම ප්රශ්නයට පිළිතුරු දීමට උත්සහ කරන පර්යේෂකයෙක් නොවූ අය සඳහා පුහුණුවීම් සඳහා අත්සන් කළ අයගේ ආදායම සැසඳිය හැකිය. එහෙත් මෙම කණ්ඩායම් අතර වැටුප් පිළිබඳ වෙනසක් කොපමණ ප්රමාණයක් පුහුණුව නිසාද, ලියාපදිංචි වී සිටින අය සහ නොකරන අය අතර පවතින වෙනස්කම් නිසා කොපමණ ප්රමාණයක් තිබේද? මෙය දුෂ්කර ප්රශ්නයක් වන අතර, එය තවත් දත්ත සමඟ ස්වයංක්රීයව ඉවතට නොයන එකකි. වෙනත් වචනවලින් කිවහොත්, පවතින නොයෙකුත් වෙනස්කම් ගැන සැලකිලිමත් වීමක් ඔබගේ සේවකයන්ගේ ගණන කොපමණද යන්න සැලකිල්ලට ගනී.

බොහෝ අවස්ථාවන්හීදී, යම් පුහුණුවක් වැනි හේතු නිසා ඇති වන බලපෑම් තක්සේරු කිරීම සඳහා ප්රබලතම ක්රමයක් නම්, පර්යේෂකයා අහඹු ලෙස ඇතැම් පුද්ගලයින්ට අනිත් අයට නොව ප්රතිකාර සඳහා අහඹු ලෙස පාලනය කරනු ලබන සසම්භාවී පාලිත පරීක්ෂණයක් පවත්වා ගැනීමයි. මම පරික්ෂා කිරීම සඳහා 4 පරිච්ෙඡ්දයක් සඳහාම පරිත්යාග කරන්නෙමි. එබැවින් මම පර්යේෂණාත්මක දත්ත සමඟ භාවිතා කළ හැකි උපායමාර්ග දෙකක් පිළිබඳව අවධානය යොමු කරන්නෙමි. මුලින්ම උපාය මාර්ගය රඳා පවතින්නේ අහඹු ලෙස (හෝ අහඹු ලෙස) කිසියම් පුද්ගලයෙකුට අනිත් අයට නොව ප්රතිකාර කිරීම සඳහා යමක් සිදුවන බවය. දෙවන උපාය මාර්ගය රඳා නොපවතින හා නොලැබූ අය අතර පවත්නා වෙනස්කම් පිළිබඳව වගකීමකින් තොරව අත්හදා බැලීම් කරන ලද අනවශ්ය නොවන දත්තයන් මත රඳා පවතී.

ප්රබල උපකල්පන අවශ්ය වන අතර, ඒවා ප්රායෝගිකව ඇගයීමට ලක් කිරීම හා ප්රායෝගිකව බොහෝ විට උල්ලංඝනය කර ඇති බව උපකල්පනය කළ හැකිය. මෙම ප්රකාශයට මා දක්වන අනුකම්පාව නිසා, මම එය ටිකක් දුර යනවා යැයි සිතනවා. අපක්ෂපාතී දත්තවලින් විශ්වාසනීයව ගණනය කිරීම අසීරු බව සැබවින්ම සත්යයකි, නමුත් මා සිතන්නේ නැහැ අප කිසි විටෙක උත්සාහ කළ යුතු බව නොවේ. විශේෂයෙන්ම, පරීක්ෂණාත්මක බාධකයක් ඔබට අත්හදා බැලීමක් සිදු නොකළහොත්, අත්හදා බැලීම්වලින් තොරව අත්හදා බැලීම් කළ හැකිය. තවද, සසම්භාවී පාලිත පරීක්ෂණයක් නිර්මාණය කිරීම සඳහා දැනටමත් පවතින දත්ත ප්රයෝජනයට ගනිමින් ඔබට ප්රයෝජනවත් නොවන විකල්ප අත්හදා බැලීම් ඔබට ප්රයෝජනවත් වනු ඇත.

ඉදිරියට යෑමට පෙර, සමාජ පර්යේෂණයන්හි වඩාත් සංකීර්ණ මාතෘකා එකක් වන අතර, දැඩි හා හැඟීම්බර විවාදයකට තුඩුදිය හැකි බව සැලකිල්ලට ගැනීම වටී. ඉන් අනතුරුව, මම ඒ ගැන කාවැද්දීම සඳහා එක් එක් ප්රවිෂ්ටය පිළිබඳ සුභවාදී විස්තරයක් ලබා දෙනු ඇත, මම එම ප්රවිෂ්ටය භාවිතා කරන විට පැන නගින අභියෝගයන් කිහිපයක් විස්තර කරන්නෙමි. එක් එක් ප්රවේශය පිළිබඳ වැඩිදුර තොරතුරු මේ පරිච්ඡේදයේ අවසානයේ ඇති ද්රව්ය වල ඇත. ඔබේම පර්යේෂණවලදී ඔබ මෙම ප්රවේශයන් භාවිතා කිරීමට අදහස් කරන්නේ නම්, හේතු සාධක පිළිබඳ බොහෝ විශිෂ්ට පොත් එකක් කියවීමට මම නිර්දේශ කරමි. (Imbens and Rubin 2015; Pearl 2009; Morgan and Winship 2014) .

අසම්පූර්ණ නොවන දත්ත වලින් ගණනය කිරීම සඳහා එක් ප්රවේශයක් වන්නේ, සමහරුන්ට ප්රතිකාර කිරීම සඳහා අනෙකුන්ට අනෙකුන්ට ප්රතිකාර නොකළ සිද්ධියක් සොයා ගැනීමයි. මෙම අවස්ථා ස්වභාවික අත්හදා බැලීම් ලෙස හැඳින්වේ. ස්වාභාවික අත්හදා බැලීමක් පිළිබඳ පැහැදිලි උදාහරණවලින් එකක් වන්නේ, ජොෂුවා ඇන්රිස්ට්ගේ (1990) අධ්යයනයේ ප්රතිඵලයක් මත මිලිටරි සේවා බලපෑම මත ඉපැයීම් මනිනු ලැබේ. වියට්නාම් යුද්ධයේදී එක්සත් ජනපදය සිය කෙටුම්පතේ ප්රමානය වැඩි කර ගත්තේය. කුමන පුරවැසියන්ට සේවය කිරීමට තීරණය කරන ලෙස එක්සත් ජනපද ආන්ඩුව ලොතරැයියක් පවත්වන ලදී. සෑම උපන් දිනයක්ම කඩදාසි කැබැල්ලක ලියන අතර, රූප සටහන 2.7 හි දැක්වෙන පරිදි, තරුණියන්ට සේවය කිරීමට කැඳවනු ලබන නියෝගය තීරණය කිරීම සඳහා වරකට මෙම කඩදාසි තෝරා ගනු ලැබීය. කෙටුම්පත). ප්රතිඵල පදනම් කරගනිමින් සැප්තැම්බර් 14 වන දින උපත ලද පිරිමි පුද්ගලයින් ප්රථමයෙන් කැඳවූ අතර, අප්රේල් 24 වන දින උපත ලැබූ පිරිමි පුද්ගලයින් දෙවැනි ස්ථානයට පත්විය. අවසාන වශයෙන්, මෙම ලොතරැයිය තුළ දින 195 ක උපත ලද මිනිසුන්, දින 171 ක උපත ලැබූ අය නොවේ.

රූප සටහන 2.7: 1969 දෙසැම්බර 1 වන දින තෝරා ගැනීමේ සේවා කෙටුම්පත සඳහා කොන්ග්රස් සිළුමිණ ඇලෙක්සැන්ඩර් පිර්නි (R-NY) යෝෂුවා ඇන්රිස්ට් (1990) ජෝර්ජියා ඇන්රිස්ට් (1990) ඉපැයීම් මතයි. ස්වාභාවික අත්හදා බැලීම් යොදා ගනිමින් මෙය පර්යේෂණයකි. මූලාශ්රය: ඇමරිකානු තේරීම් සේවා පද්ධතිය (1969) / විකිමාධ්ය කොමන්ස්.

රූප සටහන 2.7: 1969 දෙසැම්බර 1 වන දින තෝරා ගැනීමේ සේවා කෙටුම්පත සඳහා කොන්ග්රස් සිළුමිණ ඇලෙක්සැන්ඩර් පිර්නි (R-NY) යෝෂුවා ඇන්රිස්ට් (1990) ජෝර්ජියා ඇන්රිස්ට් (1990) ඉපැයීම් මතයි. ස්වාභාවික අත්හදා බැලීම් යොදා ගනිමින් මෙය පර්යේෂණයකි. මූලාශ්රය: එක්සත් ජනපද තෝරා ගැනීමේ සේවා පද්ධතිය (1969) / විකිමාධ්ය කොමන්ස් .

එය වහාම පැහැදිලිව පෙනෙන්නට නොතිබුණත්, නෝට්ටුවකට ලොතරැයි මගින් සසම්භාවි පාලිත අත්හදා බැලීමේ පරීක්ෂණයට සමාන යමක් තිබේ: මෙම අවස්ථා දෙකේදීම, සහභාගිවන්නන් ප්රතිකාර කිරීම සඳහා අහඹු ලෙස යොදවනු ලැබේ. මෙම randomized ප්රතිකාරයේ බලපෑම අධ්යයනය කිරීම සඳහා, ඇන්ජිග්රිස් විසින් සෑම විටම විශාල දත්ත පද්ධතියක් භාවිතා කර ඇත. එක්සත් ජනපදයේ සමාජ ආරක්ෂණ පරිපාලනය, සෑම ඇමෙරිකානු ආදායමකින්ම ඉපැයීම් වලින් තොරතුරු රැස්කරනු ලබයි. රාජ්ය පරිපාලනමය වාර්තා තුළ රැස් කරන ලද ඉපැයීම් දත්ත අහඹු ලෙස තෝරා ගත් ලොතරැයිපතේ අහඹු ලෙස තෝරා ගත් පුද්ගලයා පිළිබඳ තොරතුරු ඒකාබද්ධ කිරීම මගින් ඇන්රිස්ට් නිගමනය කළේ ප්රවීණ නොවන නළුවන්ගේ උපයන ආදායමට වඩා 15% ක අඩු ආදායමක් උපයා ඇති බවයි.

මෙම උදාහරණයේ නිදසුනක් ලෙස, ඇතැම් විට සමාජ, දේශපාලන හෝ ස්වාභාවික බලවේග පර්යේෂකයන් විසින් උත්තෝලනය කළ හැකි ආකාරයකින් ප්රතිකාර ලබා දෙනු ඇත. සමහර විට මෙම ප්රතිකාර වල ප්රතිඵල සෑම විටම විශාල දත්ත මූලාශ්රයන්ගෙන් අල්ලා ගනු ලැබේ. මෙම පර්යේෂණ උපාය මාර්ගය පහත දැක්වෙන පරිදි සාරාංශ කළ හැක: \[\text{random (or as if random) variation} + \text{always-on data} = \text{natural experiment}\]

ඩිජිටල් යුගයේ මෙම උපක්රමය නිරූපනය කිරීමට, ඇලෙක්සැන්ඩර් මැස් සහ එන්රිකෝ මොරෙට්ටි (2009) විසින් ඵලදායිතාව සඳහා ඵලදායි සගයන් සමග වැඩ කිරීමේ බලපෑම තක්සේරු කිරීමට උත්සාහ කළහ. ප්රතිඵල දැකීමට පෙර, ඔබ සතුව ඇති ගැටුම්කාරී බලාපොරොත්තු ඇති බව පෙන්වා දීම වටී. එක් අතකින්, ඵලදායී සගයන් සමග වැඩ කිරීම, සේවකයාගේ මිතුරන්ගෙන් පීඩනය නිසා ඵලදායිතාවය ඉහළ නැංවීමට මඟ පාදනු ඇතැයි ඔබ අපේක්ෂා කළ හැකිය. අනික් අතට, වෙහෙස මහන්සි වී වැඩ කරන අය සමඟ සේවකයෙකුගේ රැකියාවට යෑමට හේතුවක් වනු ඇත. ඵලදායිතාව සඳහා මනා ඵලදායීතාවන් අධ්යයනය කිරීම සඳහා ඇති පැහැදිලි ම ක්රමය වන්නේ, ඵලදායිතා මට්ටම්වල සේවකයන් සමඟ මාරු කිරීමට සසම්භාවී ලෙස සසම්භාවී ලෙස පාලනය කරන ලද අත්හදා බැලීමකි. කෙසේ වෙතත්, පර්යේෂකයන්, ඕනෑම සැබෑ ව්යාපාරයක කම්කරුවන්ගේ උපලේඛනය පාලනය කරන්නේ නැත. එබැවින් සුපිරි වෙළඳසැලක අළෙවි කරන කාසියේ ස්වාභාවික අත්හදාබැලුවක් මත මැස් සහ මොරේටිට යැපෙති.

මෙම සුවිශේෂී සුපිරි වෙළඳසැලක දී, සැලසුම් කිරීම සිදු කරන ආකාරය සහ මාරු කරන ආකාරය වෙනස් වූ ආකාරය නිසා, එක් එක් මුදල්හිමියා විවිධ දිනවල විවිධාකාර සමුපකාර ඇති විය. තවදුරටත්, මෙම සුවිශේෂී සුපිරි වෙළඳසැලක, මුදල් ගණුදෙනුකරුවන් පැවරීම ඔවුන්ගේ සම වයසේ නිෂ්පාදිතය හෝ ගබඩාව කාර්යබහුල වූවක් නොවේ. වෙනත් වචන වලින් කිවහොත්, මුදල් ලොතරැයිය විසින් නියම කරනු නොලැබුණ ද, කම්කරුවන්ට සමහර විට අහඹු ලෙස ඉහල (හෝ අඩු) ඵලදායිතාවයන් සමග වැඩ කිරීමට අහඹු ලෙස කටයුතු කරන ලදී. වාසනාවකට මෙන්, මෙම සුපිරි වෙළඳසැල සෑම අවස්ථාවකදීම එක් එක් මුදල්හිමියා ස්කෑන් කරන ලද අයිතම සොයාගත් ඩිජිටල් යුගයේ චෙක්පතක් තිබුනි. මෙම චෙක්පත් ලොග දත්ත වලින් Mas සහ Moreetti නිශ්චිත, තනි පුද්ගල සහ සෑම විටම ඵලදායිතාව මැනීමට හැකි විය: තත්පරයකට ස්කෑන් කරන ලද අයිතම ගණන. මෙම කාරණා දෙක ඒකාබද්ධ කිරීම, සම්ය නිෂ්පාදන ඵලදායිතාව හා සෑම විටම නිෂ්පාදන ඵලදායිතාවයේ සෑම විටම මස් සහ මොරෙට්ටි ඇස්තමේන්තු කර ඇති පරිදි ගණකාධිකාරි සේවකයෙකුට සාමාන්යයෙන් වඩා ඵලදායී වූ 10% ක් වූ සේවක සේවිකාවන් නම්, එහි ඵලදායිතාව 1.5% . තවද, ඔවුන් වැදගත් දත්ත දෙකක් ගවේෂණය කිරීම සඳහා ඒවායේ ප්රමාණයේ හා පොහොසත්කම භාවිතා කළහ: මෙම බලපෑමේ විෂමතාව (කුමන ආකාරයේ කම්කරුවන් විශාල බලපෑමක් ඇතිද?) සහ බලපෑම පිටුපස ඇති යාන්ත්රණයන් (ඉහල ඵලදායිතාවයන් ඇතිවීමට හේතු වන්නේ ඇයි? ඉහළ ඵලදායිතාව?). අපි මෙම වැදගත් කාරණාවලට නැවත යොමු කරනු ඇත. එනම්, වැඩි වශයෙන් විස්තරාත්මකව පර්යේෂණ ගැන සාකච්ඡා කරන විට, 4 වන පරිච්ජේදයේ, ප්රතිකාර ප්රතික්රියා සහ යාන්ත්රණ විවිධත්වයයි.

මෙම අධ්යයනයන් දෙකෙන් පැහැදිලි කිරීම, වගුව 2.3 මෙම ව්යුහය ඇති අනෙකුත් අධ්යයනයන් සාරාංශ කරයි. සමහර අහඹු වෙනස්කම්වල බලපෑම නිරීක්ෂණය කිරීම සඳහා සෑම විටම දත්ත මූලාශ්රයක් භාවිතා කිරීම. ප්රායෝගිකව, පර්යේෂකයන් ස්වාභාවික අත්හදා බැලීම් සඳහා විවිධ උපාය මාර්ග දෙකක් භාවිතා කරයි. සමහර පර්යේෂකයන් හැමවිටම දත්ත මූලාශ්රයකින් පටන්ගෙන ලෝකයේ අහඹු සිදුවීම් දෙස බලන්න; අනෙක් අය ලෝකය තුළ අහඹු සිදුවීමක් ආරම්භ කර එහි බලපෑම හසුකරගන්නා දත්ත මූලාශ්ර සොයා බලයි.

වගුව 2.3: විශාල දත්ත ප්රභවයන් භාවිතා කරමින් ස්වභාවික අත්හදා බැලීම්වල නිදසුන්
සැලකිය යුතු අවධානය ස්වාභාවික අත්හදාබැලීමේ මූලාශ්රය සැමවිටම දත්ත මූලාශ්රය යොමුව
ඵලදායිතාවය මත සම මට්ටමේ බලපෑම් උපලේඛන ක්රියාවලිය පිරික්සුම් දත්ත Mas and Moretti (2009)
මිත්රත්ව ගොඩනැගීම සුළි කුණාටු ෆේස්බුක් Phan and Airoldi (2015)
හැඟීම් පැතිරවීම වැසි ෆේස්බුක් Lorenzo Coviello et al. (2014)
සම මට්ටමේ ආර්ථික හුවමාරුව භූමි කම්පාව ජංගම මුදල් දත්ත Blumenstock, Fafchamps, and Eagle (2011)
පුද්ගල පරිහරණයේ හැසිරීම 2013 එක්සත් ජනපද ආන්ඩුව වසා දැමීම පුද්ගලික මූල්ය දත්ත Baker and Yannelis (2015)
ලැටෙන්ඩර් පද්ධතිවල ආර්ථික බලපෑම විවිධ ඇමසන් වනයේ දත්ත බැලීම Sharma, Hofman, and Watts (2015)
නූපන් දරු දැරියන්ට මානසික ආතතිය 2006 ඊශ්රායලය-හිස්බුල්ලා යුද්ධය උපත් වාර්තා Torche and Shwed (2015)
විකිපීඩියාවෙහි හැසිරීම කියවීම ස්නෝඩන් හෙළිදරව් කිරීම් විකිපීඩියාවේ ලොග Penney (2016)
ව්යායාම සඳහා බාහිර බලපෑම් කාලගුණය යෝග්යතා ලුහුබැඳීම් Aral and Nicolaides (2017)

ස්වාභාවික අත්හදා බැලීම් ගැන මෙතෙක් සාකච්ඡාවට භාජනය වී ඇති වැදගත් කරුණක් මම නිෂ්ප්රභා කර ඇත. ඔබට අවශ්ය දේ සඳහා ස්වභාවධර්මය විසින් ලබා දී ඇති දෙය සමහරවිට ඉතාම දුර්වල විය හැකිය. අපි නැවත වියට්නාම කෙටුම්පත ආදර්ශයට ගන්නෙමු. මෙම අවස්ථාවෙහිදී, ඇරිස්ටිස් විසින් මිලිටරි සේවයේ බලපෑම මත ඇස්තමේන්තු කිරීම ගැන උනන්දු විය. අවාසනාවකට මෙන් හමුදා සේවයට අහඹු ලෙස පැවරී තිබුණේ නැත. එය අහඹු ලෙස පවරන ලද කෙටුම්පත් කෙරෙමින් පවතී. කෙසේ වෙතත්, කෙටුම්පත් කරන ලද සියලු දෙනා සේවය නොකළේය (විවිධාකාර නිදහස් කිරීම් පැවතුණි), සේවය කළ සෑම කෙනෙක්ම කෙටුම්පත් කරන ලදි (මිනිසුන්ට සේවය කිරීමට ස්වේච්ඡාවෙන් ඉදිරිපත් විය හැකි). කෙටුම්පත් කිරීම අහම්බෙන් පවරා ඇති නිසා, පර්යේෂකයෙකුට කෙටුම්පතේ සියලු මිනිසුන් සඳහා කෙටුම්පත් කිරීමේ බලපෑම තක්සේරු කළ හැකිය. එහෙත්, ඇන්ග්රස්ට් කෙටුම්පත සකස් කිරීමේ බලපෑම දැන ගැනීමට අවශ්ය වූයේ නැත; හමුදාවට සේවය කිරීමේ බලපෑම දැන ගැනීමට ඔහුට අවශ්ය විය. කෙසේ වෙතත් මෙම තක්සේරුව සිදු කිරීම සඳහා අතිරේක උපකල්පන හා සංකූලතා අවශ්ය වේ. පළමුව, පර්යේෂකයන් බලපා ඉපැයීම් සම්පාදනයන් කෙටුම්පත් කෙරෙමින් පවතී එකම මාර්ගය හමුදා සේවය හරහා උපකල්පනයක් බැහැර සීමා කැඳවා ඇති බව උපකල්පනය කළ යුතුය. නිදසුනක් ලෙස, කෙටියෙන් සකස් කළ පිරිමින්, වැඩ කරන සේවාවෙන් වැළකී සිටීමට හෝ සේවා යෝජකයන්ට කෙටුම්පත් කළ අයව කුලියට ගැනීමට ඉඩක් නොලැබීම නිසා මෙම උපකල්පනය වැරදි විය හැකිය. පොදුවේ, බැහැර කිරීම් සීමා කිරීම අතිශය වැදගත් උපකල්පනයක් වන අතර, එය සාමාන්යයෙන් සත්යාපනය කිරීම අසීරු ය. බැහැර කිරීම් සීමාව නිවැරදි වුවද, සියලුම මිනිසුන්ට සේවය කිරීමේ බලපෑම තක්සේරු කිරීමට තවමත් නොහැකි ය. ඒ වෙනුවට පර්යේෂකයන්ට සංවේදී ලෙස හැඳින්වෙන විශේෂිත උපකුලකයක් මත ඇගැයිය හැක්කේ පර්යේෂකයන්ට පමණි (කෙටුම්පත් කරන විට සේවයේ (Angrist, Imbens, and Rubin 1996) සේවය නොකරන විට) (Angrist, Imbens, and Rubin 1996) . කෙසේ වෙතත්, Compliers, මුල්ම ජනගහන උනන්දුව නොවීය. මෙම ලොතරැයියේ සාපේක්ෂව පිරිසිදු කාරණයකදී පවා මෙම ගැටලු පැන නැගී ඇති බව සැලකිල්ලට ගන්න. භෞතික ලොතරැයි මගින් ප්රතිකාර ලබා නොදෙන විට තවත් සංකූලතා ඇති වේ. නිදසුනක් වශයෙන්, මාස් සහ මොරෙට්ටිගේ කැෂියර් ගැන අධ්යයනය කිරීම, සමපදස්ථයන්ගේ පැවරීම සාරභූත ලෙස අහඹු ලෙස ඇති බවට උපකල්පනය මත පැන නගින අමතර ප්රශ්න. මෙම උපකල්පනය දැඩි ලෙස උල්ලංඝනය කර ඇත්නම්, එය ඔවුන්ගේ ඇස්තමේන්තු සකස් කරගත හැකිය. අවසාන වශයෙන්, ස්වාභාවික අත්හදා බැලීම් නොකළ අත්හදා බැලීම්වලින් සෑදීමේ තක්සේරුවක් සඳහා ප්රබල උපායමාර්ගයක් විය හැකිය. විශාල දත්ත මූලාශ්රයන් ස්වභාවික අත්හදා බැලීම්වල ප්රාග්ධනීකරණය කිරීමට ඇති හැකියාව වැඩි කර ගත හැකිය. කෙසේ වෙතත්, එය ඔබට අවශ්ය බව ඇස්තමේන්තුවට ස්වභාවයෙන්ම සපයනු ලැබ ඇති විශේෂයෙන් සැලකිය යුතු සහ ඇතැම් විට දැඩි උපකල්පන අවශ්ය වනු ඇත.

අනාරක්ෂිත තක්සේරු දත්ත ලබා ගැනීම ගැන මම ඔබට පැවසීමට කැමති දෙවන උපාය මාර්ගය රඳා නොපවතින සහ නොලැබූ අය අතර පවතින පූර්ව වෙනස් වෙනස්කම් ගැන වාර්තා කිරීමට උත්සාහ කිරීම තුලින් නොවන පර්යේෂණාත්මක දත්ත මත රඳා පවතී. එවැනි වෙනස්කම් ප්රවේශයන් බොහොමයක් ඇත, නමුත් මම එක් ගැලපීමක් ලෙස හැඳින්වේ. ගැළපෙන විට, පර්යේෂකයා විසින් නොවන අත්හදා බැලීම් වලින් යුක්තව පෙනෙන අයගේ යුගල නොවන අයුරින් පෙනෙන අයුරින් පෙනේ. ගැලපීමේ ක්රියාවලියේ දී, පර්යේෂකයන් ඇත්තෙන්ම කප්පාදු කිරීම ; එනම්, පැහැදිලි දර්ශනයක් නොමැති අවස්ථාවන් ඉවත දැමීම. මෙලෙස, මෙම ක්රමය වඩාත් ගැලපෙන හා ගැලපෙන ලෙස හැඳින්වෙනු ඇත. නමුත් මම සම්ප්රදායික යෙදුම සමග ගැලපෙනු ඇත.

මහා පරිමාණ නොවන පර්යේෂණ මූලාශ්රයන් සමඟ ගැලපෙන උපාය මාර්ගවල එක් උදාහරණයක් වන්නේ, ලයනල් අයනව් සහ සගයින් (2015) විසින් පාරිභෝගික හැසිරීම් පිළිබඳව පර්යේෂණ සිදු කිරීමෙනි. ඔවුන් ඊබේ මත සිදු කරන වෙන්දේසි පිළිබඳ උනන්දුවක් දැක්වූ අතර, ඔවුන්ගේ වැඩ විස්තර කිරීම සම්බන්ධයෙන් උනන්දුවක් දක්වනු ලැබුවේ, වෙන්දේසිය අවසානයේ වෙන්දේසිවල ආරම්භක මිල වෙන්දේසිය කෙරෙහි අවධානය යොමු කරනු ඇත, එනම් විකිණුම් මිල හෝ විකිණීමේ සම්භාවිතාවය.

විකිණුම් මිල පිළිබඳ ආරම්භක ප්රතිඵල ගණනය කිරීම සඳහා වඩාත්ම හිතවත් ක්රමයක් වන්නේ විවිධ ආරම්භක මිල සහිත වෙන්දේසි සඳහා අවසන් මිල ගණනය කිරීමයි. ආරම්භක මිල ගණන් යටතේ විකුණුම් මිල අනාවැකි කීමට අවශ්ය නම් මෙම ප්රවේශය යහපත් වනු ඇත. එහෙත් ඔබේ ප්රශ්නය ආරම්භක මිල පිළිබඳ බලපෑම සම්බන්ධ වන්නේ නම්, එය සාධාරණ සංසන්දනයන් මත පදනම් නොවන බැවින් මෙම ප්රවේශය ක්රියා නොකරනු ඇත. අඩු ආරම්භක මිල සහිත වෙන්දේසිවල ඉහළ ආරම්භක මිල සහිත ඒවාට වඩා බෙහෙවින් වෙනස් විය හැකිය. (උදාහරණ ලෙස, ඒවා විවිධ වර්ගයේ භාණ්ඩ සඳහා හෝ විවිධ ආකාරයේ අලෙවිකරුවන් ඇතුළත් විය හැක).

අසමමිතික නොවන දත්තයන්ගෙන් කුමන තක්සේරු කරන විට ඇතිවන ගැටළු පිළිබඳව දැනටමත් ඔබ දැනුවත්ව සිටී නම්, ඔබට නුසුදුසු ප්රවිෂ්ටය මඟ හැරිය හැකි අතර, ඔබ නිශ්චිත භාණ්ඩයක් විකුණනු ලබන ස්ථානයක්, එනම් ගොල්ෆ් ක්ලබ් - වෙන්දේසි පරාමිතීන් - එනම්, නොමිලේ ප්රවාහනය සහ සති දෙකක වෙන්දේසි කිරීම - අහඹු ලෙස වෙන් වූ ආරම්භක මිල අනුව. ප්රතිඵලයක් වශයෙන් වෙළඳ පළ ප්රතිඵල සංසන්දනය කිරීමෙන්, මෙම ක්ෂේත්රයේ අත්හදා බැලීම මඟින් විකුණුම් මිල මත මිල ආරම්භ කිරීම සඳහා ඉතා පැහැදිලි මිනුම් ඉදිරිපත් කරයි. නමුත් මෙම මිනුම් පමණක් එක් නිශ්චිත භාණ්ඩයක් හා වෙන්දේසි පරාමිතීන් සඳහා පමණක් අදාළ වේ. උදාහරණ වශයෙන් විවිධ වර්ගයේ නිෂ්පාදන සඳහා ප්රතිඵල වෙනස් විය හැක. ප්රබල න්යායක් නොමැතිව, මෙම එක් එක් අත්හදා බැලීමේ සිට ලබා ගත හැකි විය හැකි හැකි පරීක්ෂණ පරාසයක් සඳහා අතිශයින්ම අපහසු වේ. තවද, ඔබට උත්සාහ කිරීමට අවශ්ය වන සෑම විචල්යයක්ම ධාවනය කිරීමට නොහැකි වන පරිදි ක්ෂේත්ර පරීක්ෂාවන් ප්රමාණවත් තරම් මිල අධික වේ.

අවාසනාවට හා අත්හදා බැලීම්වලට පටහැනිව, ඒනාවා සහ සගයන් තුන්වෙනි ක්රමය අනුගමනය කළහ. ඔවුන්ගේ උපාය මාර්ගයේ ප්රධානතම උපක්රම වන්නේ දැනටමත් සිදුවී ඇති ක්ෂේත්ර පර්යේෂණ වලට සමාන දේවල් සොයා ගැනීමයි. නිදසුනක් ලෙස 2.8 හි දැක්වෙන්නේ රූපවාහිනී 31 ටයිම්ස් එකක ටයිල්මර්ඩේඩ් බර්ගර් 09 රියැදුරු සඳහාම ලැයිස්තුගත කර ඇති 31 ක් පමණයි. එනම් එම වෙළෙන්දාම එකම "විකුණුම්කරු" විසින් විකුණනු ලැබේ. කෙසේවෙතත්, මෙම ලැයිස්තුගත කිරීම් 31 වෙනස් වෙනස් ලක්ෂණ ඇත. මිල, අවසන් දිනය සහ නාවික ගාස්තු. වෙනත් වචනවලින් කිවහොත්, එය "අයවැයක්" පර්යේෂකයින් සඳහා පර්යේෂණ සිදු කරයි.

"අයවැය ගොල්ඩර්" විසින් විකුණන ලද ටේලර්මාඞ් තැටි දර්පණ 09 හි ලැයිස්තුගත කිරීම යනු එකම අයිතමය එකම අයිතමය විකුණන්නා වන එකම අයිතමය වන අතර, එය තරමක් වෙනස් ලක්ෂණ සහිත සෑම විටම එකම ලැයිස්තුගත කර ඇති ලැයිස්තු සමූහයකි. ඊජිප්තුවේ දැවැන්ත ලොග් ඇතුළත මිලියන සිය ගණනක් ලැයිස්තුගත කර ඇති ගැලපෙන කට්ටල සංඛ්යාව දහස් ගණනකි. මේ අනුව, නියමිත ආරම්භක මිලයක් සහිත සියලුම වෙන්දේසි සඳහා අවසන් මිල ගණනය කිරීම වෙනුවට, ඒනාවා සහ සගයන් සමග ගැලපෙන කට්ටල තුල සසඳා. මෙම සියගණනක් දහස් සංඛ්යාත කන්ඩායම් අතර සංසන්දනයන්ගෙන් ප්රතිඵල සමපූර්ණ කිරීම සඳහා, එක් එක් අයිතමයේ පාදක අගය (උදා. එහි සාමාන්ය විකුණුම් මිල) අනුව Einav සහ සගයන් විසින් ආරම්භක මිල හා අවසාන මිල නැවත ප්රකාශයට පත් කරන ලදි. උදාහරණයක් ලෙස, ටේලර්මාඞ් බෙරයර් 09 රියදුරුට ඩොලර් 100 ක මිල ගණන් (එහි විකුණුම් මත පදනම්ව) නම්, එවිට ආරම්භක මිල ඩොලර් 0.1 ක් ලෙස දැක්විය යුතු අතර අවසාන මිල 120 ඩොලර් 1.2 කි.

රූප සටහන 2.8: ගැලපෙන කට්ටලයක උදාහරණයක්. මෙය හරියටම එකම ගොල්ෆ් ක්ලබ් (ටේලර්මාඩර් බර්ගර් 09 ධාවක) වන අතර එය එකම පුද්ගලයෙකු විසින් විකුණනු ලැබේ. නමුත් මෙම විකිණුම් සමහරක් විවිධ කොන්දේසි යටතේ (උදා., විවිධ ආරම්භක මිල) යටතේ සිදු කරන ලදී. Einav et al. (2015), රූප සටහන 1b.

රූප සටහන 2.8: ගැලපෙන කට්ටලයක උදාහරණයක්. මෙය හරියටම එකම ගොල්ෆ් ක්ලබ් (ටේලර්මඩේඩ් බර්නර් 09 ධාවක) වන එකම පුද්ගලයා ("අයවැය ගොල්ෆ්ෆර්") විසින් විකුණනු ලැබුවද, නමුත් මෙම විකිණුම් සමහරක් විවිධ කොන්දේසි යටතේ (උදා. වෙනස් ආරම්භක මිල) සිදු කරන ලදී. Einav et al. (2015) , රූප සටහන 1b.

වෙන්දේසි ප්රතිඵලවල ආරම්භක මිල පිළිබඳ බලපෑම ගැන අයැන්නා හා සගයන් උනන්දු විය. පළමුවෙන්ම, ඉහළ ආරම්භක මිල ගණන් විකිණීමේ සම්භාවිතාව අඩු කිරීම සඳහා රේඛීය පරාසයක් භාවිතා කර ඇති අතර ඉහළ ආරම්භක මිල අවසන් වන මිල ගණන් වැඩි කිරීම (විකිණීම මත කොන්දේසියක්) වැඩි වේ. තමන් විසින්ම රේඛීය සම්බන්ධතාවයක් විස්තර කර ඇති අතර ඒවායේ සාමාන්ය අගය ගණනය කරනු ලබන්නේ මෙම විශ්ලේෂණයන්ය. ඊනෑවා සහ සගයන් විසින් වඩා සියුම් තක්සේරු ගනනාවක් නිර්මාණය කිරීම සඳහා ඔවුන්ගේ දත්තවල දැවැන්ත ප්රමාණය භාවිතා කළහ. උදාහරණයක් වශයෙන්, විවිධ ආරම්භක මිල සඳහා වෙන වෙනම ගණනය කිරීම මගින්, මිල සහ විකිණුම් මිල අතර ආරම්භය සාපේක්ෂව නොගැලපේ (පය 2.9) බව සොයා ගත්හ. විශේෂයෙන්, 0.05 සිට 0.85 අතර මිල ගණන් ආරම්භ කිරීම සඳහා, ආරම්භක මිල විකිණුම් මිල කෙරෙහි ඉතා සුළු බලපෑමක්, ඔවුන්ගේ පළමු විශ්ලේෂණයෙන් මුලුමනින්ම මැකී ගිය සොයා ගැනීමකි. තවද, භාණ්ඩ සියල්ල සාමාන්යයෙන් සාමාන්යයෙන් වඩා වැඩි වූ නමුත්, ඒන්වාග් සහ සගයන් විසින් විවිධ වර්ගයේ භාණ්ඩ 23 ක් සඳහා (උදාහරණ වශයෙන් සුරතල් සැපයුම්, ඉලෙක්ට්රොනික උපකරණ සහ ක්රීඩා අනුස්මරණ) සඳහා මිල ආරම්භ කිරීම පිළිබඳ බලපෑම (රූපය 2.10). මෙම ඇස්තමේන්තු පෙන්නුම් කරන්නේ වඩාත් සුවිශේෂී භාණ්ඩ සඳහා සිහිවටන ආරම්භක මිලක් විකිණීම පිළිබඳ සම්භාවිතාව කෙරෙහි බලපෑමක් ඇති කිරීම හා අවසන් විකුණුම් මිල මත විශාල බලපෑමක් ඇති බවය. තවද, ඩී.එස්.අයි.වී. වැනි වෙළඳ භාණ්ඩ සඳහා ආරම්භක මිල සඳහා අවසාන මිල මත කිසිදු බලපෑමක් සිදු නොවේ. වෙනත් වචනවලින් කිවහොත්, විවිධ වර්ගයේ භාණ්ඩ 23 කින් ප්රතිඵලයක් වන සාමාන්යයක් මෙම අයිතමයන් අතර වැදගත් වෙනස්කම් සඟවයි.

රූපය 2.9: අළෙවි ආරම්භක මිල හා විකුණුම්වල සම්භාවිතාව (අ) හා විකුණුම් මිල (b) අතර සම්බන්ධතාවය. ආරම්භක මිල සහ විකිණුම් සම්භාවිතාව අතර දළ වශයෙන් රේඛීය සම්බන්ධතාවයක් ඇත, නමුත් ආරම්භක මිල සහ විකිණුම් මිල අතර නොඉඳුල් සම්බන්ධය; 0.05 සිට 0.85 දක්වා මිල ගණන් ආරම්භ කිරීම සඳහා ආරම්භක මිල විකිණීමේ මිල කෙරෙහි ඉතා සුළු බලපෑමක් ඇති කරයි. අවස්ථා දෙකේදීම, සබඳතා මූලික වශයෙන් අයිතමය වටිනාකමෙන් ස්වායත්ත වේ. අනුවර්තනය කරන ලද්දේ Einav et al. (2015), රූප 4a සහ 4b.

රූපය 2.9: අළෙවි ආරම්භක මිල හා විකුණුම්වල සම්භාවිතාව (අ) හා විකුණුම් මිල (b) අතර සම්බන්ධතාවය. ආරම්භක මිල සහ විකිණුම් සම්භාවිතාව අතර දළ වශයෙන් රේඛීය සම්බන්ධතාවයක් ඇත, නමුත් ආරම්භක මිල සහ විකිණුම් මිල අතර නොඉඳුල් සම්බන්ධය; 0.05 සිට 0.85 දක්වා මිල ගණන් ආරම්භ කිරීම සඳහා ආරම්භක මිල විකිණීමේ මිල කෙරෙහි ඉතා සුළු බලපෑමක් ඇති කරයි. අවස්ථා දෙකේදීම, සබඳතා මූලික වශයෙන් අයිතමය වටිනාකමෙන් ස්වායත්ත වේ. අනුවර්තනය කරන ලද්දේ Einav et al. (2015) , රූප 4a සහ 4b.

රූපය 2.10: එක් එක් වර්ගයේ අයිතමයන්ගේ ඇස්තමේන්තු; ඝන තිතක් යනු සියලු ප්රවර්ගයන් එකට එකතු කිරීම සඳහා ඇස්තමේන්තුවක් (Einav et al., 2015). මෙම ඇස්තමේන්තු මගින් පෙන්නුම් කෙරෙන්නේ වඩාත්ම කැපී පෙනෙන භාණ්ඩ සඳහා වන සිහිවටන භාණ්ඩය - ආරම්භක මිල විකිණීම (x-අක්ෂය) සම්භාවිතාව කෙරෙහි සුලූ බලපෑමක් ඇති අතර අවසන් විකුණුම් මිල (y-අක්ෂය) මත වැඩි බලපෑමක් ඇති කරයි. අනුවර්තනය කරන ලද්දේ Einav et al. (2015), 8 වන රූපය.

රූපය 2.10: එක් එක් වර්ගයේ අයිතමයන්ගේ ඇස්තමේන්තු; ඝන තිතක් යනු සියලු ප්රවර්ගයන් එකට එකතු කිරීම සඳහා ඇස්තමේන්තුවක් (Einav et al. 2015) . මෙම ඇස්තමේන්තු පෙන්නුම් කරන්නේ වඩාත් කැපී පෙනෙන අයිතමයන් වන සිහිවටන වැනි ආරම්භක මිල විකිණීම ( \(x\) -axis සම්භාවිතාව කෙරෙහි සුලු බලපෑමක් ඇතිවයි) සහ අවසන් විකුණුම් මිල ( \(y\) සඳහා වැඩි බලපෑමක් ඇති කරයි \(y\) -axis). අනුවර්තනය කරන ලද්දේ Einav et al. (2015) , 8 වන රූපය.

ඔබ ඊ බේ මත වෙන්දේසි සඳහා විශේෂයෙන් උනන්දුවක් නොතිබුණද, ඔබ විසින් රේඛීය සම්බන්ධතාව විස්තර කරන සරල ඇස්තමේන්තු වලට වඩා ඊටත් වඩා බෙහෙවින් ගැළපෙන ඊටත් වඩා සංඛ්යාත්මක අගය 2.9 සහ රූපය 2.10 ට වඩා අගය කොට සැලකිය යුතු අතර විවිධ වර්ගයේ භාණ්ඩ ඒකාබද්ධ කෙරේ. තව ද, ක්ෂේත්රයේ පර්යේෂණවලින් මෙම වඩාත් සියුම් තක්සේරු කිරීම් ජනනය කිරීමට විද්යාත්මකව හැකි වුවද එම පිරිවැය එවන් අත්හදා බැලීම් අතිශයින්ම අසීරු වනු ඇත.

ස්වාභාවික අත්හදා බැලීම් වලට අනුව, ගැලපීම් සිදු කරන ක්රම ගණනාවක්ම නරක ඇස්තමේන්තු වලට මග පෑදිය හැකිය. ගැලපෙන ඇස්තමේන්තු සමඟ ඇති ලොකුම උත්සුකය නම්, ඒවා ගැලපෙන නොකළ දේවල් නිසා ඒවාට පක්ෂපාතී විය හැකි බවයි. නිදසුනක් වශයෙන්, ඔවුන්ගේ ප්රධාන ප්රතිඵලවල දී, ඊනාව් සහ සගයන් ලක්ෂණ හතර මත නිශ්චිතව ගැලපුනේ: විකුණුම් හැඳුනුම් අංකය, අයිතම වර්ගය, අයිතම මාතෘකාව සහ උප සිරැසි. භාණ්ඩ ගැලපීම සඳහා භාවිතා නොකළ ක්රම වලින් වෙනස් නම්, මෙය අසාධාරණ සැසඳීමක් නිර්මාණය කළ හැකිය. නිදසුනක් ලෙස, "අයවැය ගොල්ෆර්" ටයිමූර්මඩය ගිනි 09 රියැදුරා ශීත ඍතුවේ දී (ගොල්ෆ් කී්රඩාවන් අඩු ජනප්රිය වී ඇති විට) අඩු නම්, ආරම්භක මිල ගණන් පහළ අගයට අඩු වනු ඇති බව පෙනෙන්නට ඇත, ඇත්ත වශයෙන්ම එය මෙය කෞතුක වස්තුවක් වනු ඇත සෘතු වෙනස්වීම් ඉල්ලුම. මෙම ගැටළුව විසඳීමට එක් ප්රවේශයක් විවිධ ආකාරයේ ගැලපීම් උත්සාහ කරයි. නිදසුනක් වශයෙන්, අයිනව් සහ සගයන් ඔවුන්ගේ විශ්ලේෂණය නැවත සමාලෝචනය සඳහා භාවිතා කරන කාල පරිච්ඡේදය වෙනස් කරන අතර (ගැලපුම් කට්ටල අවුරුද්දක් ඇතුලත, අවුරුද්දක් ඇතුළත, සහ සමකාලීන) අයිතමයන් ඇතුළත් විය. වාසනාවකට මෙන්, සියළුම වේලෙන කවුළු සඳහා සමාන ප්රතිඵල සොයා ගන්නා ලදී. ගැලපීම් සම්බන්ධ තවත් කනස්සල්ලකි. ගැලපීම් වලින් ගැලපෙන සමීක්ෂණ අදාළ වන්නේ එකම අනුරූප දත්ත සඳහා පමණි. ඒවාට ගැලපෙන නොවිය හැකි නඩු සඳහා ඒවා අදාළ නොවේ. නිදසුනක් වශයෙන්, විවිධ ලැයිස්තුගත කර ඇති භාණ්ඩ සඳහා ඔවුන්ගේ පර්යේෂණ සීමා කිරීම මගින් Einav සහ සගයන් වෘත්තීය සහ අර්ධ-වෘත්තීය විකුණුම්කරුවන් කෙරෙහි අවධානය යොමු කරයි. මේ අනුව, මෙම සංසන්දනයන් අර්ථකථනය කරන විට අප ඒවා මෙම ඊනියා subset සඳහා පමණක් අදාළ බව මතක තබා ගත යුතුය.

සමාලෝචනය නොවන පරීක්ෂණාත්මක දත්ත වල සාධාරණ සංසන්දනයන් සොයා ගැනීම සඳහා බලවත් උපාය මාර්ගයකි. බොහෝ සමාජ විද්යාඥයින්ට ගැලපෙන පරිදි දෙවන වරට අත්හදා බැලීම් වලට අනුකුලව පෙනෙන නමුත්, එය සුළු වශයෙන් සංශෝධනය කළ හැකි විශ්වාසයකි. දැවැන්ත දත්ත වල ගැලපීම (1) විෂමතාවයේ විෂමතාවයක් වැදගත් වන අතර, (2) ගැලපීම් සඳහා අවශ්ය වැදගත් විචල්යයන් මැනිය හැකිය. වගු අංක 2.4 මඟින් විශාල දත්ත මූලාශ්ර සමඟ ගැලපෙන ආකාරය පිළිබඳ තවත් උදාහරණ සපයයි.

වගුව 2.4: විශාල දත්ත මූලාශ්ර සමග ගැලපෙන පරිදි භාවිතා කරන අධ්යයන නිදර්ශන
සැලකිය යුතු අවධානය විශාල දත්ත මූලාශ්රය යොමුව
පොලිස් හිංසනය මත වෙඩි තැබීමේ බලපෑම Stop-and-frisk වාර්තා Legewie (2016)
පවුල් සහ අසල්වැසියන් මත සැප්තැම්බර් 11 වන දා බලපෑම් ඡන්ද වාර්තා සහ පරිත්යාග වාර්තා Hersh (2013)
සමාජ වසංගතය සන්නිවේදනය සහ නිෂ්පාදන දරුකමට හදා ගැනීම Aral, Muchnik, and Sundararajan (2009)

අවසාන වශයෙන්, අසම්පූර්ණ නොවන දත්තයන් මගින් ඇතිවන බලපෑම් ඇස්තමේන්තු කිරීම අසීරු ය. එහෙත් ස්වභාවික අත්හදා බැලීම් සහ සංඛ්යාන වෙනස් කිරීම් (උදා. ගැළපීම) වැනි ප්රවේශයන් භාවිතා කළ හැකිය. සමහර අවස්ථා වලදී මෙම ප්රවේශයන් වැරදි ලෙස හැසිරවිය හැකිය. එහෙත් ප්රවේශමෙන් යොදවා ගත් විට, මෙම ප්රවේශයන් පරිච්ජේදයේ 4 වන පරිච්ඡේදයේ විස්තර කර ඇති පරික්ෂාකාරී ප්රවේශය සඳහා ප්රයෝජනවත් අංගයක් විය හැකිය. තවදුරටත්, මෙම ප්රවේශයන් දෙක සෑම විටම, විශාල දත්ත පද්ධති මත.