2.4.3 ការពិសោធន៍ប្រហាក់ប្រហែល

យើងអាចធ្វើការពិសោធន៍អំពីអ្វីដែលយើងមិនមានឬមិនអាចធ្វើបាន។ វិធីសាស្រ្តពីរដែលទទួលបានអត្ថប្រយោជន៍ជាពិសេសពីប្រភពទិន្នន័យធំគឺការធ្វើពិសោធន៍ធម្មជាតិនិងការផ្គូផ្គង។

សំណួរវិទ្យាសាស្រ្តនិងគោលនយោបាយសំខាន់ៗមួយចំនួនមានមូលហេតុ។ ឧទាហរណ៍តើអ្វីទៅជាផលប៉ះពាល់នៃកម្មវិធីបណ្ដុះបណ្ដាលការងារលើប្រាក់ឈ្នួល? អ្នកស្រាវជ្រាវប៉ុនប៉ងឆ្លើយសំណួរនេះអាចប្រៀបធៀបប្រាក់ចំណូលរបស់មនុស្សដែលបានចុះឈ្មោះចូលហ្វឹកហាត់ដល់អ្នកដែលមិនមាន។ ប៉ុន្តែតើភាពខុសគ្នារវាងប្រាក់ឈ្នួលរវាងក្រុមទាំងនេះដោយសារតែការបណ្តុះបណ្តាលនិងចំនួនប៉ុន្មានដោយសារតែភាពខុសគ្នារវាងមនុស្សដែលចុះឈ្មោះនិងអ្នកដែលមិនមាន? នេះគឺជាសំណួរពិបាកមួយហើយវាជាសំណួរមួយដែលមិនបាត់ទៅវិញដោយមានទិន្នន័យបន្ថែមទៀត។ និយាយម្យ៉ាងទៀតការព្រួយបារម្ភអំពីភាពខុសគ្នាដែលអាចកើតមានកើតឡើងមិនថាមានអ្នកធ្វើការប៉ុន្មាននាក់នៅក្នុងទិន្នន័យរបស់អ្នកទេ។

ក្នុងស្ថានភាពជាច្រើនវិធីដែលមានបំផុតបំផុតដើម្បីប៉ាន់ស្មានផលប៉ះពាល់នៃការព្យាបាលមួយចំនួនដូចជាការបណ្តុះបណ្តាលការងារគឺជាការអនុវត្តការពិសោធដែលគ្រប់គ្រងដោយចៃដន្យដែលអ្នកស្រាវជ្រាវផ្តល់ការព្យាបាលដល់មនុស្សមួយចំនួនដោយមិនដឹងខ្លួន។ ខ្ញុំនឹងចំណាយពេលទាំងអស់នៃជំពូក 4 ដើម្បីពិសោធន៍ដូច្នេះនៅទីនេះខ្ញុំនឹងផ្តោតលើយុទ្ធសាស្រ្តពីរដែលអាចត្រូវបានប្រើជាមួយទិន្នន័យដែលមិនពិសោធន៍។ យុទ្ធសាស្រ្តទី 1 គឺអាស្រ័យលើការស្វែងរកអ្វីដែលកំពុងកើតឡើងនៅលើពិភពលោកដែលចៃដន្យ (ឬជិតចៃដន្យ) ផ្តល់ការព្យាបាលដល់មនុស្សមួយចំនួននិងមិនមែនអ្នកដទៃ។ យុទ្ធសាស្ត្រទី 2 គឺអាស្រ័យលើការកែតម្រូវទិន្ន័យគ្មានការពិសោធន៍តាមស្ថិតិក្នុងការប៉ុនប៉ងដើម្បីគណនាភាពខុសគ្នារវាងអ្នកដែលបានធ្វើនិងមិនបានទទួលការព្យាបាល។

ការសង្ស័យមួយអាចអះអាងថាយុទ្ធសាស្រ្តទាំងពីរនេះគួរតែត្រូវបានជៀសវាងដោយសារតែពួកគេតម្រូវឱ្យមានការសន្មត់យ៉ាងខ្លាំងការសន្មត់ដែលមានការលំបាកដើម្បីវាយតម្លៃហើយថានៅក្នុងការអនុវត្តត្រូវបានរំលោភជាញឹកញាប់។ ខណៈពេលដែលខ្ញុំមានចិត្តអាណិតអាសូរចំពោះការអះអាងនេះខ្ញុំគិតថាវានៅតែឆ្ងាយពេក។ វាជាការពិតដែលថាវាជាការលំបាកក្នុងការជឿទុកចិត្តបានធ្វើឱ្យមានការប៉ាន់ប្រមាណមូលហេតុពីទិន្នន័យដែលមិនពិសោធន៍ប៉ុន្តែខ្ញុំមិនគិតថានេះមានន័យថាយើងមិនគួរព្យាយាម។ ជាពិសេសវិធីសាស្រ្តដែលមិនពិសោធន៍អាចមានប្រយោជន៍ប្រសិនបើឧបសគ្គភស្តុភារបង្ការអ្នកពីការធ្វើពិសោធន៍ឬប្រសិនបើឧបសគ្គសីលធម៌មានន័យថាអ្នកមិនចង់ដំណើរការពិសោធន៍។ លើសពីនេះទៀតវិធីសាស្ដ្រមិនពិសោធន៍អាចមានប្រយោជន៍ប្រសិនបើអ្នកចង់ទាញយកអត្ថប្រយោជន៍នៃទិន្នន័យដែលមានរួចហើយដើម្បីបង្កើតការពិសោធន៍ដែលមានការគ្រប់គ្រងដោយចៃដន្យ។

មុនពេលដំណើរការវាគួរកត់សំគាល់ផងដែរថាការប៉ាន់ប្រមាណមូលហេតុគឺជាប្រធានបទដ៏ស្មុគស្មាញមួយក្នុងការស្រាវជ្រាវសង្គមនិងមួយដែលអាចនាំឱ្យមានការជជែកវែកញែកខ្លាំងនិងអារម្មណ៍។ នៅក្នុងអ្វីដែលខាងក្រោមខ្ញុំនឹងផ្តល់នូវការពិពណ៌នាសុទិដ្ឋិនិយមអំពីវិធីសាស្ត្រនីមួយៗដើម្បីកសាងវិចារណញាណអំពីវាបន្ទាប់មកខ្ញុំនឹងរៀបរាប់អំពីបញ្ហាមួយចំនួនដែលកើតឡើងនៅពេលប្រើវិធីសាស្រ្តនោះ។ ព័ត៌មានលម្អិតបន្ថែមអំពីវិធីសាស្រ្តនីមួយៗអាចរកបាននៅក្នុងសម្ភារឧបទេសនៅចុងបញ្ចប់នៃជំពូកនេះ។ ប្រសិនបើអ្នកមានគម្រោងប្រើប្រាស់វិធីសាស្រ្តទាំងនេះក្នុងការស្រាវជ្រាវផ្ទាល់របស់ខ្ញុំខ្ញុំសូមផ្តល់អនុសាសន៍ឱ្យអានសៀវភៅមួយក្នុងចំណោមសៀវភៅដ៏អស្ចារ្យជាច្រើនអំពីការសន្និដ្ឋានមូលហេតុ (Imbens and Rubin 2015; Pearl 2009; Morgan and Winship 2014)

វិធីសាស្ត្រមួយដើម្បីធ្វើការប៉ាន់ប្រមាណមូលហេតុពីទិន្នន័យដែលមិនមែនជាការពិសោធន៍គឺដើម្បីរកមើលព្រឹត្តិការណ៍មួយដែលបានផ្តល់ការព្យាបាលដោយចៃដន្យដល់មនុស្សមួយចំនួននិងមិនមែនចំពោះអ្នកដទៃ។ ស្ថានភាពទាំងនេះត្រូវបានគេហៅថា ពិសោធន៍ធម្មជាតិ ។ ឧទាហរណ៍ជាក់ស្តែងបំផុតមួយនៃការធ្វើតេស្តធម្មជាតិគឺមកពីការស្រាវជ្រាវរបស់ Joshua Angrist (1990) វាស់ឥទ្ធិពលនៃសេវាកម្មយោធាលើប្រាក់ចំណូល។ ក្នុងអំឡុងសង្គ្រាមនៅវៀតណាមសហរដ្ឋអាមេរិកបានបង្កើនទំហំកងកម្លាំងប្រដាប់អាវុធរបស់ខ្លួនតាមរយៈពង្រាងមួយ។ ដើម្បីសំរេចថាតើប្រជាពលរដ្ឋណាម្នាក់នឹងត្រូវគេហៅឱ្យបម្រើនោះរដ្ឋាភិបាលអាមេរិកបានប្រារព្ធឆ្នោតមួយ។ ថ្ងៃខែឆ្នាំកំណើតត្រូវបានសរសេរលើក្រដាសមួយហើយដូចដែលបានបង្ហាញក្នុងរូបភាពទី 2.7 ក្រដាសទាំងនេះត្រូវបានជ្រើសរើសមួយដងដើម្បីកំណត់លំដាប់ដែលបុរសវ័យក្មេងនឹងត្រូវបានហៅឱ្យបម្រើ (ស្ត្រីវ័យក្មេងមិនត្រូវបានទទួលយក ទៅសេចក្តីព្រាង) ។ ដោយយោងតាមលទ្ធផលបុរសកើតនៅថ្ងៃទី 14 ខែកញ្ញាត្រូវបានគេហៅថាជាលើកដំបូងបុរសកើតនៅថ្ងៃទី 24 ខែមេសាត្រូវបានគេហៅថាទីពីរ។ នៅទីបញ្ចប់ក្នុងឆ្នោតនេះបុរសដែលកើតនៅថ្ងៃ 195 ខុសគ្នាត្រូវបានគេធ្វើសេចក្តីព្រាងខណៈដែលបុរសកើតនៅថ្ងៃ 171 មិនមាន។

រូបភាពទី 2.7: មហាសន្និបាត Alexander Pirnie (R-NY) បានគូរកន្សោមទីមួយសម្រាប់សេចក្តីព្រាងច្បាប់ស្តីពីការបោះឆ្នោតនៅថ្ងៃទី 1 ខែធ្នូឆ្នាំ 1969 ។ លោកយ៉ូស្វេអង់ហ្គ្រីស (1990) បានផ្សំពង្រាងឆ្នោតជាមួយទិន្នន័យចំណូលពីរដ្ឋបាលសន្តិសុខសង្គមដើម្បីប៉ាន់ប្រមាណឥទ្ធិពលនៃការបម្រើយោធា លើប្រាក់ចំណូល។ នេះគឺជាឧទាហរណ៍នៃការស្រាវជ្រាវដែលប្រើការពិសោធធម្មជាតិ។ ប្រភព: ប្រព័ន្ធសេវាជ្រើសរើសស។ រ។ អ (1969) / Wikimedia Commons ។

រូបភាពទី 2.7: មហាសន្និបាត Alexander Pirnie (R-NY) បានគូរកន្សោមទីមួយសម្រាប់សេចក្តីព្រាងច្បាប់ស្តីពីការបោះឆ្នោតនៅថ្ងៃទី 1 ខែធ្នូឆ្នាំ 1969 ។ លោកយ៉ូស្វេអង់ហ្គ្រីស (1990) ផ្សំពង្រាងឆ្នោតជាមួយទិន្នន័យចំណូលពីរដ្ឋបាលសន្តិសុខសង្គមដើម្បីប៉ាន់ប្រមាណឥទ្ធិពលនៃការបម្រើយោធា លើប្រាក់ចំណូល។ នេះគឺជាឧទាហរណ៍នៃការស្រាវជ្រាវដែលប្រើការពិសោធធម្មជាតិ។ ប្រភព: ប្រព័ន្ធសេវាជ្រើសរើសអាមេរិក (1969) / វិគីមេឌា

ទោះបីជាវាមិនច្បាស់ភ្លាមៗក្តីក៏សេចក្តីព្រាងច្បាប់មានភាពស្រដៀងគ្នាខ្លាំងទៅនឹងការពិសោធន៏ពិសោធន៏ដោយចៃដន្យ: ក្នុងករណីទាំងពីរអ្នកចូលរួមត្រូវបានគេជ្រើសរើសឱ្យទទួលការព្យាបាលដោយចៃដន្យ។ ដើម្បីសិក្សាអំពីប្រសិទ្ធិភាពនៃការព្យាបាលដោយចៃដន្យនេះ Angrist ទាញយកប្រយោជន៍ពីប្រព័ន្ធទិន្នន័យដ៏ធំមួយនៅលើប្រព័ន្ធទិន្នន័យដ៏ធំមួយពោលគឺរដ្ឋបាលសន្តិសុខសង្គមអាមេរិកដែលប្រមូលព័ត៌មានស្ទើរតែគ្រប់ប្រាក់ចំណូលរបស់អាមេរិកពីការងារ។ ដោយការច្របាច់បញ្ចូលគ្នានូវព័ត៌មានអំពីអ្នកដែលត្រូវបានជ្រើសរើសដោយចៃដន្យនៅក្នុងឆ្នោតលាយជាមួយនឹងទិន្នន័យរកប្រាក់ចំណូលដែលត្រូវបានគេប្រមូលបាននៅក្នុងកំណត់ត្រារដ្ឋាភិបាលរដ្ឋបាលខួរក្បាលបានសន្និដ្ឋានថាប្រាក់ចំណូលរបស់អតីតយុទ្ធជនមានចំនួនតិចជាងប្រាក់ចំណូលរបស់អតីតយុទ្ធជនដែលប្រៀបធៀប។

ឧទាហរណ៍នេះបង្ហាញថាជួនកាលកម្លាំងសង្គមនយោបាយឬធម្មជាតិផ្តល់ការព្យាបាលតាមវិធីដែលអាចត្រូវបានប្រើដោយអ្នកស្រាវជ្រាវហើយជួនកាលឥទ្ធិពលនៃការព្យាបាលទាំងនេះត្រូវបានចាប់យកដោយប្រភពទិន្នន័យធំ ៗ ជានិច្ច។ យុទ្ធសាស្រ្តស្រាវជ្រាវនេះអាចសង្ខេបដូចខាងក្រោម: \[\text{random (or as if random) variation} + \text{always-on data} = \text{natural experiment}\]

ដើម្បីបង្ហាញពីយុទ្ធសាស្រ្តនេះក្នុងយុគសម័យឌីជីថលចូរយើងពិចារណាលើការសិក្សាដោយអាឡិចសាន់ហ្សេសនិងអេនរីកូម៉ូរីធី (2009) ដែលបានព្យាយាមប៉ាន់ស្មានផលប៉ះពាល់នៃការធ្វើការជាមួយសហសេវិកដែលមានផលិតភាពលើផលិតភាពរបស់កម្មករ។ មុនពេលឃើញលទ្ធផលវាគួរអោយកត់សំគាល់ថាមានការរំពឹងទុកខុសគ្នាដែលអ្នកអាចមាន។ ម្យ៉ាងវិញទៀតអ្នកប្រហែលជារំពឹងថាការធ្វើការជាមួយសហសេវិកដែលមានផលិតភាពនឹងនាំឱ្យកម្មករម្នាក់បង្កើនផលិតភាពរបស់គាត់ដោយសារតែការបង្ខិតបង្ខំពីមិត្តភក្តិ។ ឬផ្ទុយទៅវិញអ្នកប្រហែលជារំពឹងថាការមានកូនធ្វើការដ៏លំបាកអាចនាំឱ្យកម្មករដកដង្ហើមព្រោះការងាររបស់មិត្តភក្តិនឹងត្រូវបានធ្វើ។ វិធីច្បាស់បំផុតដើម្បីសិក្សាពីផលប៉ះពាល់របស់មិត្តភក្ដិលើផលិតភាពនឹងក្លាយជាការពិសោធន៍គ្រប់គ្រងដោយចៃដន្យមួយដែលបុគ្គលិកត្រូវបានគេកំណត់អោយដោយផ្លាស់ប្តូរជាមួយកម្មករនៃកម្រិតផលិតភាពខុសៗគ្នាហើយបន្ទាប់មកលទ្ធផលត្រូវបានវាស់សម្រាប់មនុស្សគ្រប់គ្នា។ យ៉ាងណាក៏ដោយក្រុមអ្នកស្រាវជ្រាវមិនបានគ្រប់គ្រងតារាងពេលវេលារបស់កម្មករនៅក្នុងអាជីវកម្មពិតប្រាកដណាមួយឡើយដូច្នេះម៉ាសនិងម៉ីថេទីត្រូវពឹងផ្អែកលើការពិសោធន៍ធម្មជាតិទាក់ទងនឹងអ្នកគិតលុយនៅផ្សារទំនើប។

នៅផ្សារទំនើបពិសេសនេះដោយសារតែវិធីដែលការកំណត់ពេលត្រូវបានធ្វើហើយវិធីដែលផ្លាស់ប្តូរគ្នាត្រូវគ្នាអ្នកគិតលុយម្នាក់ៗមានអ្នកធ្វើការខុសៗគ្នាខុសៗគ្នាក្នុងពេលខុសៗគ្នា។ លើសពីនេះទៅទៀតនៅក្នុងផ្សារទំនើបនេះកិច្ចការរបស់អ្នកគិតលុយមិនទាក់ទងទៅនឹងផលិតភាពរបស់មិត្តភក្តិឬរបៀបដែលរវល់របស់ហាងនោះទេ។ និយាយម្យ៉ាងទៀតទោះបីជាការកំណត់ពេលនៃអ្នកគិតលុយមិនត្រូវបានកំណត់ដោយឆ្នោតនោះក៏ដោយក៏វាហាក់បីដូចជាថាពលករត្រូវបានគេកំណត់ឱ្យធ្វើការជាមួយមិត្តភក្តិដែលមានផលិតភាពខ្ពស់ (ឬទាប) ។ សំណាងល្អផ្សារទំនើបនេះក៏មានប្រព័ន្ធពិនិត្យឌីជីថលចាស់ដែលតាមដានវត្ថុដែលអ្នកគិតលុយម្នាក់ៗកំពុងស្កេនគ្រប់ពេលវេលា។ ពីទិន្នន័យកំណត់ហេតុនេះលោក Mas និង Moretti មានលទ្ធភាពបង្កើតរង្វាស់ជាក់លាក់នៃផលិតផលដែលមានលក្ខណៈច្បាស់លាស់បុគ្គលនិងវាស់វែងជានិច្ចនូវចំនួនធាតុដែលបានស្កេនក្នុងមួយវិនាទី។ ម៉ាសនិងម៉ីថេបានប៉ាន់ប្រមាណថាប្រសិនបើអ្នកគិតលុយត្រូវបានគេប្រគល់ឱ្យទៅអ្នកធ្វើការដែលមានផលិតភាពខ្ពស់ជាងមធ្យមភាគ 10% ផលិតភាពរបស់អ្នកស្រីនឹងកើនឡើង 1,5% ។ លើសពីនេះទៀតពួកគេបានប្រើទំហំនិងភាពសម្បូរបែបនៃទិន្នន័យរបស់ពួកគេដើម្បីស្វែងយល់ពីបញ្ហាសំខាន់ៗពីរគឺ ភាពមិនប្រទាក់ក្រឡាគ្នា នៃផលប៉ះពាល់នេះ (សម្រាប់ប្រភេទណាខ្លះដែលមានឥទ្ធិពលធំជាង?) និង យន្ដ ការ ដែល នៅពីក្រោយប្រសិទ្ធិភាព (ហេតុអ្វីបានជាមានមិត្តភក្តិដែលមានផលិតភាពខ្ពស់នាំទៅរក ផលិតភាពខ្ពស់?) ។ យើងនឹងត្រលប់ទៅបញ្ហាសំខាន់ៗពីរនេះគឺភាពមិនធម្មតានៃផលប៉ះពាល់និងយន្តការនៃការព្យាបាល - នៅជំពូកទី 4 នៅពេលយើងពិភាក្សាអំពីការពិសោធន៍លម្អិត។

ជាទូទៅក្នុងការសិក្សាទាំងពីរនេះតារាង 2.3 សង្ខេបពីការសិក្សាដទៃទៀតដែលមានរចនាសម្ព័ន្ធដូចនេះដោយប្រើប្រភពទិន្នន័យដែលតែងតែវាស់វែងផលប៉ះពាល់នៃការប្រែប្រួលចៃដន្យមួយចំនួន។ នៅក្នុងការអនុវត្តអ្នកស្រាវជ្រាវប្រើយុទ្ធសាស្រ្តខុសគ្នាពីរដើម្បីស្វែងរកការពិសោធន៍ធម្មជាតិដែលទាំងពីរអាចមានផ្លែផ្កា។ អ្នកស្រាវជ្រាវមួយចំនួនចាប់ផ្តើមជាមួយប្រភពទិន្នន័យដែលតែងតែរកនិងស្វែងរកព្រឹត្តិការណ៍ចៃដន្យនៅលើពិភពលោក។ អ្នកផ្សេងទៀតចាប់ផ្តើមព្រឹត្តិការណ៍ចៃដន្យនៅលើពិភពលោកហើយស្វែងរកប្រភពទិន្នន័យដែលចាប់យកផលប៉ះពាល់របស់វា។

តារាង 2.3: ឧទាហរណ៍នៃពិសោធន៍ធម្មជាតិដោយប្រើប្រភពទិន្នន័យធំ
ការផ្តោតសំខាន់ ប្រភពនៃការពិសោធធម្មជាតិ បើកប្រភពទិន្នន័យជានិច្ច សេចក្តីយោង
ផលប៉ះពាល់របស់មិត្តលើផលិតភាព ដំណើរការកំណត់ពេលវេលា ពិនិត្យចេញទិន្នន័យ Mas and Moretti (2009)
បង្កើតមិត្តភាព ព្យុះសង្ឃរា Facebook Phan and Airoldi (2015)
ការរីករាលដាលនៃអារម្មណ៍ ភ្លៀង Facebook Lorenzo Coviello et al. (2014)
ការផ្លាស់ប្តូរសេដ្ឋកិច្ចទៅលើមិត្តភក្ដិ រញ្ជួយដី ទិន្នន័យប្រាក់ចល័ត Blumenstock, Fafchamps, and Eagle (2011)
ឥរិយាបថប្រើប្រាស់ផ្ទាល់ខ្លួន 2013 អាមេរិកបានបិទ ទិន្នន័យហិរញ្ញវត្ថុផ្ទាល់ខ្លួន Baker and Yannelis (2015)
ផលប៉ះពាល់សេដ្ឋកិច្ចនៃប្រព័ន្ធអ្នកណែនាំ ផ្សេងៗគ្នា ការរុករកទិន្នន័យនៅក្រុមហ៊ុន Amazon Sharma, Hofman, and Watts (2015)
ឥទ្ធិពលនៃភាពតានតឹងចំពោះទារកមិនទាន់កើត 2006 អ៊ីស្រាអែល - សង្រ្គាម Hezbollah កំណត់ត្រាកំណើត Torche and Shwed (2015)
ការអានលើវិគីភីឌា វិវរណៈ Snowden កំណត់ហេតុវិគីភីឌា Penney (2016)
ផលប៉ះពាល់របស់មិត្តលើការហាត់ប្រាណ អាកាសធាតុ កម្មវិធីតាមដានលំហាត់រាង្គកាយ Aral and Nicolaides (2017)

ក្នុងការពិភាក្សាអំពីការពិសោធធម្មជាតិខ្ញុំបានបោះបង់ចោលនូវចំណុចសំខាន់មួយគឺថាការទៅពីអ្វីដែលធម្មជាតិបានផ្តល់ទៅអ្វីដែលអ្នកចង់បានពេលខ្លះអាចជារឿងពិបាកណាស់។ ចូរយើងត្រលប់ទៅមើលសេចក្តីព្រាងគំរូរបស់វៀតណាមវិញ។ ក្នុងករណីនេះអេកកចាប់អារម្មណ៍ក្នុងការប៉ាន់ប្រមាណអំពីឥទ្ធិពលនៃការបម្រើយោធាលើប្រាក់ចំណូល។ ជាអកុសលសេវាយោធាមិនត្រូវបានគេកំណត់ដោយចៃដន្យទេ។ ផ្ទុយទៅវិញវាត្រូវបានគេព្រាងដែលត្រូវបានគេកំណត់ដោយចៃដន្យ។ ទោះយ៉ាងណាក៏ដោយមិនមែនគ្រប់គ្នាដែលត្រូវបានគេព្រាងឱ្យបម្រើនោះទេ (មានការលើកលែងជាច្រើន) ហើយមិនមែនគ្រប់គ្នាដែលបម្រើការត្រូវបានព្រាង (មនុស្សអាចស្ម័គ្រចិត្តបម្រើ) ។ ដោយសារតែការធ្វើសេចក្តីព្រៀងត្រូវបានគេកំណត់ដោយចៃដន្យអ្នកស្រាវជ្រាវម្នាក់អាចប៉ាន់ស្មានពីប្រសិទ្ធភាពនៃការព្រាងសម្រាប់បុរសទាំងអស់នៅក្នុងសេចក្តីព្រាងនេះ។ ប៉ុន្តែពួកទេវតាមិនចង់ដឹងអំពីប្រសិទ្ធិភាពនៃការពង្រាងនោះទេ។ គាត់ចង់ដឹងពីប្រសិទ្ធិភាពនៃការបម្រើនៅក្នុងយោធា។ ដើម្បីធ្វើការប៉ាន់ស្មាននេះទោះជាយ៉ាងណាក៏ដោយត្រូវមានការសន្មតនិងផលវិបាកបន្ថែមទៀត។ ទី 1 អ្នកស្រាវជ្រាវចាំបាច់ត្រូវសន្មតថាមធ្យោបាយតែមួយគត់ដែលត្រូវបានព្រាងមានផលប៉ះពាល់លើប្រាក់ចំណូលគឺតាមរយៈសេវាកម្មយោធាការសន្មតហៅថា ការដាក់កំហិតនៃការបដិសេធ ។ ការសន្មត់នេះអាចជាការខុសប្រសិនបើឧទាហរណ៍បុរសដែលត្រូវបានគេព្រាងបានស្នាក់នៅក្នុងសាលារៀនបានយូរដើម្បីចៀសវាងការបម្រើឬប្រសិនបើនិយោជកមិនសូវជួលបុរសដែលត្រូវបានព្រាង។ ជាទូទៅការដាក់កំហិតនៃការបដិសេធគឺជាការសន្មត់ដ៏សំខាន់មួយហើយវាជាការពិបាកក្នុងការផ្ទៀងផ្ទាត់។ ទោះបីជាការដាក់កំហិតការដាក់កំហិតគឺត្រឹមត្រូវក៏ដោយក៏វានៅតែមិនអាចប៉ាន់ស្មានពីផលប៉ះពាល់នៃសេវាកម្មលើមនុស្សទាំងអស់។ ផ្ទុយទៅវិញវាបង្ហាញថាអ្នកស្រាវជ្រាវអាចប៉ាន់ប្រមាណតែប៉ុណ្ណោះលើប្រភេទជាក់លាក់នៃបុរសដែលគេហៅថាអ្នកជំនាញ (បុរសដែលនឹងបម្រើនៅពេលដែលបានព្រាងប៉ុន្តែមិនបម្រើនៅពេលមិនត្រូវបានព្រាង) (Angrist, Imbens, and Rubin 1996) ។ ទោះយ៉ាងណាក៏ដោយមិនមានការចាប់អារម្មណ៍ពីប្រជាប្រិយភាពដើមឡើយ។ សូមកត់សម្គាល់ថាបញ្ហាទាំងនេះកើតមានឡើងសូម្បីតែនៅក្នុងករណីស្អាតៗដែលទាក់ទងនឹងសេចក្តីព្រាងច្បាប់។ សំណុំនៃផលវិបាកបន្ថែមទៀតកើតឡើងនៅពេលការព្យាបាលមិនត្រូវបានផ្តល់ដោយឆ្នោតរាងកាយ។ ឧទាហរណ៍នៅក្នុងការសិក្សារបស់ Mas និង Moretti នៃអ្នកគិតលុយសំណួរបន្ថែមបានលេចឡើងអំពីការសន្មតថាកិច្ចការរបស់មិត្តភក្ដិគឺចៃដន្យ។ ប្រសិនបើការសន្មត់នេះត្រូវបានគេរំលោភបំពានយ៉ាងធ្ងន់ធ្ងរនោះវាអាចយាយីការប៉ាន់ស្មានរបស់ពួកគេ។ សរុបមកការពិសោធធម្មជាតិអាចជាយុទ្ធសាស្ត្រដ៏មានឥទ្ធិពលមួយសម្រាប់ការប៉ាន់ប្រមាណមូលហេតុពីទិន្នន័យដែលមិនមានការពិសោធន៍ហើយប្រភពទិន្នន័យធំបង្កើនសមត្ថភាពរបស់យើងក្នុងការទាញយកប្រយោជន៍លើពិសោធន៍ធម្មជាតិនៅពេលដែលវាកើតឡើង។ ទោះជាយ៉ាងណាក៏ដោយវាប្រហែលជាត្រូវការការយកចិត្តទុកដាក់យ៉ាងខ្លាំងហើយជួនកាលការសន្មត់ដ៏ខ្លាំងក្លាត្រូវធ្វើពីអ្វីដែលធម្មជាតិបានផ្តល់ដល់ការប៉ាន់ប្រមាណដែលអ្នកចង់បាន។

យុទ្ធសាស្ត្រទី 2 ដែលខ្ញុំចង់ប្រាប់អ្នកអំពីការប៉ាន់ប្រមាណមូលហេតុពីទិន្នន័យដែលមិនមែនជាការពិសោធន៍គឺអាស្រ័យលើការកែតម្រូវទិន្នន័យដែលមិនមានការពិសោធន៍ដើម្បីគណនាភាពខុសគ្នារវាងអ្នកដែលបានធ្វើនិងមិនបានទទួលការព្យាបាល។ មានវិធីសាស្រ្តក្នុងការកែតម្រូវបែបនេះប៉ុន្តែខ្ញុំនឹងផ្តោតលើអ្វីមួយ ដែលត្រូវបាន គេហៅថាការ ផ្គូរផ្គង ។ នៅក្នុងការផ្គូផ្គងអ្នកស្រាវជ្រាវពិនិត្យមើលទិន្នន័យមិនពិសោធន៍ដើម្បីបង្កើតគូរបស់មនុស្សដែលស្រដៀងគ្នាលើកលែងតែម្នាក់បានទទួលការព្យាបាលហើយម្នាក់ទៀតមិនមាន។ នៅក្នុងដំណើរការនៃការផ្គូផ្គង, អ្នកស្រាវជ្រាវពិតជាត្រូវបានគេ កាត់ ផងដែរ; នោះគឺការបោះបង់ចោលករណីដែលមិនមានភាពច្បាស់លាស់។ ដូច្នេះវិធីសាស្ត្រនេះនឹងត្រូវបានគេហៅថាការផ្គូរផ្គងនិងការកាត់អោយបានត្រឹមត្រូវជាងមុនប៉ុន្តែខ្ញុំនឹងប្រកាន់យកតាមពាក្យប្រពៃណី: ការផ្គូផ្គង។

ឧទាហរណ៏មួយនៃអំណាចនៃយុទ្ធសាស្រ្តផ្គូផ្គងជាមួយនឹងប្រភពទិន្នន័យដែលមិនមានការពិសោធន៍ដ៏ធំគឺបានមកពីការស្រាវជ្រាវលើឥរិយាបថអតិថិជនដោយលីរីនអេណាវ៉ាវនិងសហការី (2015) ។ ពួកគេចាប់អារម្មណ៍លើការដេញថ្លៃដែលធ្វើឡើងនៅលើ eBay ហើយក្នុងការរៀបរាប់ពីការងាររបស់ពួកគេខ្ញុំនឹងផ្តោតលើផលប៉ះពាល់នៃការដេញថ្លៃចាប់ផ្តើមតម្លៃលើលទ្ធផលនៃការដេញថ្លៃដូចជាតម្លៃលក់ឬប្រូបាប៊ីលីតេនៃការលក់។

មធ្យោបាយដែលឆោតល្ងង់បំផុតដើម្បីប៉ាន់ប្រមាណប្រសិទ្ធិភាពនៃការចាប់ផ្តើមតម្លៃទៅលើតម្លៃលក់គឺគ្រាន់តែគណនាតម្លៃចុងក្រោយសម្រាប់ការដេញថ្លៃជាមួយនឹងតម្លៃចាប់ផ្តើមខុសគ្នា។ វិធីសាស្រ្តនេះនឹងត្រូវបានផាកពិន័យប្រសិនបើអ្នកចង់ព្យាករណ៍តម្លៃលក់ដែលបានផ្តល់ឱ្យតម្លៃចាប់ផ្តើម។ ប៉ុន្តែប្រសិនបើសំណួររបស់អ្នកពាក់ព័ន្ធនឹងផលប៉ះពាល់នៃតម្លៃចាប់ផ្តើមនោះវិធីសាស្ត្រនេះនឹងមិនដំណើរការទេពីព្រោះវាមិនផ្អែកលើការប្រៀបធៀបដោយយុត្តិធម៌។ ការដេញថ្លៃដែលមានតម្លៃចាប់ផ្ដើមទាបអាចមានភាពខុសគ្នាខ្លាំងពីអ្នកដែលមានតម្លៃចាប់ផ្តើមខ្ពស់ (ឧទាហរណ៏ពួកគេអាចនឹងមានទំនិញខុសៗគ្នាឬមានប្រភេទអ្នកលក់ផ្សេងៗគ្នា) ។

ប្រសិនបើអ្នកដឹងពីបញ្ហាដែលអាចកើតមានឡើងនៅពេលដែលធ្វើការប៉ាន់ស្មានពីមូលហេតុនៃទិន្នន័យដែលមិនមែនជាការពិសោធន៍អ្នកអាចរំលងវិធីសាស្រ្តដែលឆោតល្ងង់និងពិចារណាពីការដំណើរការពិសោធន៍វាលមួយដែលអ្នកនឹងលក់វត្ថុជាក់លាក់មួយពោលគឺក្លឹបវាយកូនហ្គោល - ប៉ារ៉ាម៉ែត្រនៃការដេញថ្លៃនិយាយថាការដឹកជញ្ជូនដោយឥតគិតថ្លៃនិងការដេញថ្លៃបើកសម្រាប់ពីរសប្តាហ៍ - ប៉ុន្តែជាមួយនឹងការចាប់ផ្តើមតម្លៃដែលបានផ្ដល់ដោយចៃដន្យ។ ដោយប្រៀបធៀបលទ្ធផលនៃលទ្ធផលទីផ្សារការពិសោធន៍លើវាលនេះនឹងផ្តល់នូវការវាស់ស្ទង់ច្បាស់លាស់នៃប្រសិទ្ធិភាពនៃការចាប់ផ្តើមតម្លៃទៅលើតម្លៃលក់។ ប៉ុន្តែការវាស់ស្ទង់នេះនឹងអនុវត្តចំពោះតែផលិតផលពិសេសមួយនិងសំណុំប៉ារ៉ាម៉ែត្រដេញថ្លៃ។ លទ្ធផលអាចមានភាពខុសគ្នាឧទាហរណ៍សម្រាប់ប្រភេទផ្សេងៗនៃផលិតផល។ ដោយគ្មានទ្រឹស្តីរឹងមាំវាពិបាកក្នុងការសំអាងពីការពិសោធន៍តែមួយនេះទៅនឹងការពិសោធន៍ដែលអាចធ្វើទៅបានដែលអាចធ្វើទៅបាន។ លើសពីនេះទៅទៀតការពិសោធន៍លើវាលមានតំលៃថ្លៃគ្រប់គ្រាន់ដែលវាមិនអាចដំណើរការរាល់បំរែបំរួលដែលអ្នកចង់សាកល្បង។

ផ្ទុយទៅនឹងវិធីសាស្រ្តពិសោធន៍នុយក្លេអែរនិងពិសោធន៍, Einav និងមិត្តរួមការងាររបស់គាត់បានប្រើវិធីសាស្រ្តទីបី: ការផ្គូផ្គង។ ល្បិចសំខាន់ក្នុងយុទ្ធសាស្រ្តរបស់ពួកគេគឺដើម្បីរកមើលអ្វីដែលស្រដៀងនឹងការពិសោធន៍លើវាលដែលបានកើតឡើងរួចហើយនៅលើ eBay ។ ឧទាហរណ៏តួលេខ 2.8 បង្ហាញពីបញ្ជីរាយនាមចំនួន 31 សម្រាប់ក្លឹបវាយកូនគោលដូចគ្នា Taylormade Burner 09 Driver ត្រូវបានលក់ដោយអ្នកលក់ដូចគ្នានឹង "អ្នករកស៊ីថវិកា" ។ ទោះជាយ៉ាងណាក៏ដោយ 31 បញ្ជីទាំងនេះមានលក្ខណៈខុសគ្នាបន្តិចបន្តួចដូចជាការចាប់ផ្តើមខុសគ្នា។ តម្លៃ, កាលបរិច្ឆេទបញ្ចប់, និងថ្លៃដឹកជញ្ជូន។ នៅក្នុងពាក្យផ្សេងទៀតវាគឺដូចជាប្រសិនបើ "budgetgolfer" កំពុងដំណើរការពិសោធន៍សម្រាប់អ្នកស្រាវជ្រាវ។

បញ្ជីនៃអ្នកបើកបរ Taylormade Burner 09 នេះត្រូវបានលក់ដោយ "budgetgolfer" គឺជាឧទាហរណ៍មួយនៃតារាងដែលបានផ្គូរផ្គងបញ្ជីដែលធាតុដូចគ្នានឹងដូចគ្នាត្រូវបានលក់ដោយអ្នកលក់តែមួយដូចគ្នាប៉ុន្តែរាល់ពេលដែលមានលក្ខណៈខុសគ្នាបន្តិចបន្តួច។ នៅក្នុងកំណត់ហេតុដ៏ធំនៃ eBay មានព្យញ្ជនៈរាប់រយរាប់ពាន់នាក់ដែលពាក់ព័ន្ធនឹងការរាយរាប់លាន។ ដូច្នេះប្រៀបធៀបតម្លៃចុងក្រោយសម្រាប់ការដេញថ្លៃទាំងអស់ជាមួយតម្លៃចាប់ផ្តើមដែលបានផ្តល់ឱ្យ Einav និងមិត្តរួមការងាររបស់គាត់បើប្រៀបធៀបទៅនឹងសំណុំឈុត។ ដើម្បីរួមបញ្ចូលលទ្ធផលពីការប្រៀបធៀបនៅក្នុងសំណុំដែលបានផ្គូផ្គងរាប់ពាន់នាក់នេះ Einav និងមិត្តរួមការងាររបស់គាត់បានសម្តែងនូវតម្លៃចាប់ផ្តើមនិងតម្លៃចុងក្រោយទាក់ទងនឹងតម្លៃយោងនៃធាតុនីមួយៗ (ឧទាហរណ៍តម្លៃលក់ជាមធ្យមរបស់វា) ។ ឧទាហរណ៍ប្រសិនបើអ្នកបើកបរ Taylormade Burner 09 មានតម្លៃ 100 ដុល្លា (ផ្អែកលើការលក់របស់វា) នោះតម្លៃចាប់ផ្តើម 10 ដុល្លានឹងត្រូវបានបង្ហាញជា 0.1 ហើយតម្លៃចុងក្រោយគឺ $ 120 ជា 1.2 ។

រូបភាព 2.8: ឧទាហរណ៏នៃសំណុំដែលត្រូវគ្នា។ នេះគឺជាក្លឹបវាយកូនហ្គូលពិតប្រាកដ (Taylormade Burner 09 Driver) ដែលត្រូវបានលក់ដោយមនុស្សដូចគ្នាពិតប្រាកដ (budgetgolfer) ប៉ុន្តែមួយចំនួននៃការលក់ទាំងនេះត្រូវបានធ្វើនៅក្រោមលក្ខខណ្ឌខុសគ្នា (ឧ។ តម្លៃចាប់ផ្តើមខុសៗគ្នា) ។ បន្តដោយការអនុញ្ញាតពីអ៊ីនៀល et al ។ (ឆ្នាំ 2015) តាង 1 ខ។

រូបភាព 2.8: ឧទាហរណ៏នៃសំណុំដែលត្រូវគ្នា។ នេះគឺជាក្លឹបវាយកូនហ្គូលពិតប្រាកដ (Taylormade Burner 09 Driver) ដែលត្រូវបានលក់ដោយមនុស្សដូចគ្នាតែអ្នកខ្លះត្រូវបានលក់ក្នុងលក្ខខ័ណ្ឌខុសៗគ្នា។ បន្តដោយការអនុញ្ញាតពី Einav et al. (2015) 1 ខ។

រំលឹកឡើងវិញថា Einav និងសហសេវិកបានចាប់អារម្មណ៍លើផលប៉ះពាល់នៃតម្លៃចាប់ផ្តើមនៃលទ្ធផលដេញថ្លៃ។ ដំបូងពួកគេប្រើតំរែតំរង់លីនេអ៊ែរដើម្បីប៉ាន់ស្មានថាតម្លៃចាប់ផ្តើមកាន់តែខ្ពស់នឹងកាត់បន្ថយប្រូបាប៊ីលីតេនៃការលក់ហើយតម្លៃចាប់ផ្តើមខ្ពស់កើនឡើងបង្កើនតម្លៃលក់ចុងក្រោយ (តាមលក្ខខណ្ឌលក់) ។ ដោយខ្លួនពួកគេការប៉ាន់ស្មានទាំងនេះដែលរៀបរាប់ពីទំនាក់ទំនងជាលិកានិងត្រូវបានគិតជាមធ្យមលើគ្រប់ផលិតផលទាំងអស់មិនមែនសុទ្ធតែគួរឱ្យចាប់អារម្មណ៍ទេ។ បន្ទាប់មក Einav និងសហសេវិកបានប្រើទិន្នន័យដ៏ធំសម្បើមរបស់ពួកគេដើម្បីបង្កើតការប៉ាន់ស្មានបន្ថែមទៀត។ ឧទាហរណ៍ដោយការប៉ាន់ស្មានផលប៉ះពាល់ដាច់ដោយឡែកពីគ្នាសម្រាប់តម្លៃចាប់ផ្តើមខុស ៗ គ្នាខុសៗគ្នាពួកគេបានរកឃើញថាទំនាក់ទំនងរវាងតម្លៃចាប់ផ្តើមនិងតម្លៃលក់គឺមិនត្រង់ (រូបភាពទី 2.9) ។ ជាពិសេសសម្រាប់តម្លៃចាប់ផ្តើមរវាង 0,05 និង 0,85 តម្លៃចាប់ផ្តើមមានផលប៉ះពាល់តិចតួចលើតម្លៃលក់ដែលជាការរកឃើញដែលត្រូវបានខកខានទាំងស្រុងដោយការវិភាគដំបូងរបស់ពួកគេ។ លើសពីនេះជាជាងប្រើជាមធ្យមលើធាតុទាំងអស់ Einav និងមិត្តរួមការងាររបស់គាត់បានប៉ាន់ប្រមាណពីផលប៉ះពាល់នៃតម្លៃចាប់ផ្តើមសម្រាប់ធាតុផ្សេងៗគ្នា 23 ប្រភេទ (ឧទាហរណ៍ការផ្គត់ផ្គង់សត្វចិញ្ចឹមអេឡិចត្រូនិចនិងវត្ថុចងចាំកីឡា) (រូបភាព 2.10) ។ ការប៉ាន់ប្រមាណទាំងនេះបង្ហាញថាសម្រាប់ធាតុប្លែកៗដូចជាតម្លៃចាប់ផ្តើមមានតម្លៃទាបមានផលប៉ះពាល់តិចតួចទៅលើប្រូបាប៊ីលីតេនៃការលក់និងផលប៉ះពាល់ធំធេងទៅលើតម្លៃលក់ចុងក្រោយ។ លើសពីនេះទៀតសម្រាប់ធាតុទំនិញបន្ថែមទៀតដូចជាឌីវីឌីជាដើមតម្លៃចាប់ផ្តើមស្ទើរតែគ្មានផលប៉ះពាល់លើតម្លៃចុងក្រោយ។ នៅក្នុងពាក្យផ្សេងទៀតជាមធ្យមដែលរួមបញ្ចូលគ្នានូវលទ្ធផលពី 23 ប្រភេទផ្សេងគ្នានៃធាតុលាក់ភាពខុសគ្នាដ៏សំខាន់រវាងធាតុទាំងនេះ។

រូបភាពទី 2.9: ទំនាក់ទំនងរវាងការចាប់ផ្តើមលក់ដេញថ្លៃនិងប្រូបាប៊ីលីតេនៃការលក់មួយ (a) និងតម្លៃលក់ (ខ) ។ មានទំនាក់ទំនងលីនេអ៊ែររវាងតម្លៃចាប់ផ្ដើមនិងប្រូបាប៊ីលីតេនៃការលក់ប៉ុន្តែទំនាក់ទំនងមិនត្រង់ស៊ីនរវាងតម្លៃចាប់ផ្តើមនិងតម្លៃលក់។ សម្រាប់ការចាប់ផ្តើមតម្លៃរវាង 0.05 និង 0.85, តម្លៃចាប់ផ្តើមមានផលប៉ះពាល់តិចតួចណាស់លើតម្លៃលក់។ ក្នុងករណីទាំងពីរទំនាក់ទំនងមានមូលដ្ឋានលើឯករាជ្យនៃធាតុ។ សម្របខ្លួនពីអេនីនអ៊ាល។ (ឆ្នាំ 2015) តាងទី 4 ខនិង 4 ខ។

រូបភាពទី 2.9: ទំនាក់ទំនងរវាងការចាប់ផ្តើមលក់ដេញថ្លៃនិងប្រូបាប៊ីលីតេនៃការលក់មួយ (a) និងតម្លៃលក់ (ខ) ។ មានទំនាក់ទំនងលីនេអ៊ែររវាងតម្លៃចាប់ផ្ដើមនិងប្រូបាប៊ីលីតេនៃការលក់ប៉ុន្តែទំនាក់ទំនងមិនត្រង់ស៊ីនរវាងតម្លៃចាប់ផ្តើមនិងតម្លៃលក់។ សម្រាប់ការចាប់ផ្តើមតម្លៃរវាង 0.05 និង 0.85, តម្លៃចាប់ផ្តើមមានផលប៉ះពាល់តិចតួចណាស់លើតម្លៃលក់។ ក្នុងករណីទាំងពីរទំនាក់ទំនងមានមូលដ្ឋានលើឯករាជ្យនៃធាតុ។ សម្របខ្លួនពីអេនីន Einav et al. (2015) ទី 4 ខនិង 4 ខ។

រូបភាពទី 2.10: ការប៉ាន់ប្រមាណពីប្រភេទនីមួយៗនៃធាតុ ចំណុចរឹងគឺជាការប៉ាន់ប្រមាណសម្រាប់ប្រភេទទាំងអស់ដែលបញ្ចូលគ្នា (Einav et al ។ , 2015) ។ ការប៉ាន់ប្រមាណទាំងនេះបង្ហាញថាសម្រាប់ធាតុប្លែកៗដូចជាតំលៃអនុស្សាវរីយ៍តម្លៃដើមដំបូងមានផលប៉ះពាល់តិចតួចទៅលើប្រូបាប៊ីលីតេនៃការលក់ (អ័ក្ស x) និងមានឥទ្ធិពលកាន់តែធំទៅលើតម្លៃលក់ចុងក្រោយ (អ័ក្ស y) ។ សម្របខ្លួនពីអេនីនអ៊ាល។ (ឆ្នាំ 2015) តាង 8 ។

រូបភាពទី 2.10: ការប៉ាន់ប្រមាណពីប្រភេទនីមួយៗនៃធាតុ ចំណុចរឹងគឺជាការប៉ាន់ប្រមាណសម្រាប់ប្រភេទទាំងអស់ដែលបញ្ចូលគ្នា (Einav et al. 2015) ។ ការប៉ាន់ស្មានទាំងនេះបង្ហាញថាសម្រាប់ធាតុប្លែក ៗ ច្រើនដូចជាអនុស្សាវរីយ៍តម្លៃចាប់ផ្តើមមានផលប៉ះពាល់តិចជាងចំពោះលទ្ធភាពលក់ ( \(x\) -axis) និងឥទ្ធិពលធំទៅលើតម្លៃលក់ចុងក្រោយ ( \(y\) - កាំភ្លើង) ។ សម្របខ្លួនពីអេនីន Einav et al. (2015) 8 ។

ទោះបីជាអ្នកមិនចាប់អារម្មណ៏លើការដេញថ្លៃនៅលើ eBay ក៏ដោយអ្នកត្រូវតែកោតសរសើរនូវវិធីដែលតួលេខ 2.9 និងតួលេខ 2.10 ផ្តល់នូវការយល់ដឹងកាន់តែច្រើនអំពី eBay ជាងការប៉ាន់ប្រមាណសាមញ្ញដែលពិពណ៌នាអំពីទំនាក់ទំនងលីនេអ៊ែរនិងរួមបញ្ចូលគ្នានូវប្រភេទផ្សេងៗគ្នាជាច្រើន។ លើសពីនេះទៅទៀតបើទោះបីជាវាអាចមានលក្ខណៈវិទ្យាសាស្ត្រដើម្បីបង្កើតការប៉ាន់ស្មានដែលមានលក្ខណៈពិសោធន៏បន្ថែមទៀតជាមួយនឹងការពិសោធន៍លើវាលតម្លៃនឹងធ្វើឱ្យការធ្វើពិសោធន៍បែបនេះមិនអាចទៅរួចទេ។

ដូចជាការពិសោធន៍ធម្មជាតិមានវិធីមួយចំនួនដែលការផ្គូផ្គងអាចនាំឱ្យមានការប៉ាន់ស្មានអាក្រក់។ ខ្ញុំគិតថាការព្រួយបារម្ភធំជាងគេជាមួយនឹងការប៉ាន់ស្មានត្រូវគ្នាគឺថាពួកគេអាចត្រូវបានលម្អៀងដោយរឿងដែលមិនត្រូវបានប្រើក្នុងការផ្គូផ្គង។ ឧទាហរណ៏, នៅក្នុងលទ្ធផលសំខាន់របស់ពួកគេ, Einav និងមិត្តរួមការងាររបស់គាត់បានធ្វើការផ្គូរផ្គងលើលក្ខណៈបួនយ៉ាងដូចជាលេខសម្គាល់អ្នកលក់ប្រភេទធាតុចំណងជើងនិងចំណងជើងរង។ ប្រសិនបើធាតុមានភាពខុសគ្នាតាមវិធីដែលមិនត្រូវបានប្រើសម្រាប់ការផ្គូផ្គងនោះវាអាចបង្កើតការប្រៀបធៀបមិនយុត្តិធម៌។ ឧទាហរណ៍ប្រសិនបើ "budgetgolfer" បញ្ចុះតម្លៃសម្រាប់អ្នកបើកបរ Taylormade Burner 09 នៅរដូវរងា (នៅពេលដែលក្លឹបកីឡាវាយកូនគោលមិនសូវមានប្រជាប្រិយភាព) នោះវាអាចបង្ហាញថាតម្លៃចាប់ផ្ដើមទាបជាងមុននាំឱ្យតម្លៃទាបនៅពេលដែលវាជាវត្ថុបុរាណនៃ បំរែបំរួលតាមរដូវកាល។ វិធីសាស្រ្តមួយដើម្បីដោះស្រាយកង្វល់នេះគឺកំពុងព្យាយាមប្រភេទផ្សេងគ្នានៃការផ្គូផ្គង។ ឧទាហរណ៍ Einav និងសហសេវិកបានធ្វើការវិភាគឡើងវិញនូវការវិភាគរបស់ពួកគេខណៈពេលដែលខុសគ្នានូវផ្ទាំងពេលវេលាដែលត្រូវបានប្រើសម្រាប់ការផ្គូរផ្គង (សំណុំដែលបានផ្គូរផ្គងរួមបញ្ចូលធាតុដែលដាក់លក់ក្នុងរយៈពេលមួយឆ្នាំក្នុងរយៈពេលមួយខែនិងក្នុងពេលដំណាលគ្នា) ។ ជាសំណាងល្អពួកគេបានរកឃើញលទ្ធផលស្រដៀងគ្នាសម្រាប់បង្អួចពេលវេលាទាំងអស់។ ការព្រួយបារម្ភបន្ថែមទៀតជាមួយការផ្គូផ្គងកើតឡើងពីការបកប្រែ។ ការប៉ាន់ប្រមាណពីការផ្គូផ្គងត្រូវបានអនុវត្តចំពោះទិន្នន័យដែលត្រូវគ្នាតែប៉ុណ្ណោះ។ ពួកគេមិនអនុវត្តចំពោះករណីដែលមិនអាចផ្គូផ្គងបានទេ។ ឧទាហរណ៍ដោយកំណត់ការស្រាវជ្រាវរបស់ពួកគេទៅនឹងមុខទំនិញដែលមានបញ្ជីច្រើន Einav និងមិត្តរួមការងាររបស់គាត់កំពុងផ្តោតទៅលើអ្នកលក់អាជីពនិងពាក់កណ្តាលវិជ្ជាជីវៈ។ ដូច្នេះនៅពេលបកស្រាយការប្រៀបធៀបទាំងនេះយើងត្រូវតែចងចាំថាពួកគេគ្រាន់តែអនុវត្តទៅសំណុំរងនៃ eBay នេះ។

ការផ្គូផ្គងគឺជាយុទ្ធសាស្ត្រដ៏មានឥទ្ធិពលមួយសម្រាប់ការស្វែងរកការប្រៀបធៀបដោយយុត្តិធម៌នៅក្នុងទិន្នន័យដែលមិនមានការពិសោធន៍។ ចំពោះអ្នកវិទ្យាសាស្ត្រសង្គមការផ្គូផ្គងមានលក្ខណៈល្អប្រសើរជាងការពិសោធន៍ប៉ុន្តែនេះគឺជាជំនឿដែលអាចកែលម្អបន្តិចបន្តួច។ ការផ្គូផ្គងទិន្នន័យដ៏ធំអាចមានភាពល្អប្រសើរជាងការពិសោធន៍វាលមួយចំនួនតូចនៅពេល (1) ភាពមិនធម្មតានៅក្នុងផលប៉ះពាល់គឺសំខាន់ហើយ (2) អថេរសំខាន់ចាំបាច់សម្រាប់ការផ្គូផ្គងត្រូវបានវាស់។ តារាង 2.4 ផ្តល់នូវឧទាហរណ៏ផ្សេងទៀតមួយចំនួនអំពីវិធីផ្គូផ្គងអាចត្រូវបានប្រើប្រាស់ជាមួយប្រភពទិន្នន័យធំ ៗ ។

តារាង 2.4: ឧទាហរណ៏នៃការសិក្សាដែលប្រើការផ្គូរផ្គងជាមួយប្រភពទិន្នន័យធំ
ការផ្តោតសំខាន់ ប្រភពទិន្នន័យធំ សេចក្តីយោង
ឥទ្ធិពលនៃការបាញ់ប្រហារទៅលើអំពើហិង្សារបស់ប៉ូលីស កំណត់ត្រាបញ្ឈប់និងហ្វ្រង់ស៊ីស Legewie (2016)
ឥទ្ធិពលនៃថ្ងៃទី 11 ខែកញ្ញាឆ្នាំ 2001 ទៅលើគ្រួសារនិងអ្នកជិតខាង កំណត់ត្រាបោះឆ្នោតនិងកំណត់ហេតុបរិច្ចាក Hersh (2013)
ការរីករាលដាលសង្គម ការទំនាក់ទំនងនិងទិន្នន័យការអនុម័តផលិតផល Aral, Muchnik, and Sundararajan (2009)

សរុបមកការប៉ាន់ប្រមាណផលប៉ះពាល់ពីទិន្នន័យដែលមិនមែនជាការពិសោធន៍គឺពិបាកប៉ុន្តែវិធីសាស្ត្រដូចជាការធ្វើពិសោធន៍ធម្មជាតិនិងការលៃតម្រូវស្ថិតិ (ឧទាហរណ៍ការផ្គូផ្គង) អាចត្រូវបានប្រើ។ ក្នុងករណីមួយចំនួនវិធីសាស្ដ្រទាំងនេះអាចមានកំហុសខុសគ្នាប៉ុន្តែនៅពេលត្រូវបានប្រើប្រាស់យ៉ាងប្រុងប្រយ័ត្នវិធីសាស្រ្តទាំងនេះអាចជាការបំពេញបន្ថែមមានប្រសិទ្ធភាពចំពោះវិធីសាស្រ្តពិសោធន៍ដែលខ្ញុំរៀបរាប់នៅក្នុងជំពូក 4. លើសពីនេះវិធីសាស្រ្តទាំងពីរនេះហាក់ដូចជាទទួលបានអត្ថប្រយោជន៍ពីការរីកចម្រើននៃការប្រើប្រាស់ - លើប្រព័ន្ធទិន្នន័យធំ ៗ ។