2.4.3.2 ផ្គូផ្គង

ផ្គូផ្គងនឹងបង្កើតដោយការកាត់មែកប្រៀបធៀបពិព័រណ៍ឆ្ងាយករណី។

ការប្រៀបធៀបពិព័រណ៍អាចមកពីការពិសោធន៍ randomized បានគ្រប់គ្រងទាំងឬបទពិសោធន៍ធម្មជាតិ។ ប៉ុន្តែមានស្ថានភាពជាច្រើនដែលជាកន្លែងដែលអ្នកមិនអាចរត់ការពិសោធន៍ល្អនិងធម្មជាតិមិនបានផ្ដល់ការពិសោធន៍ធម្មជាតិ។ នៅក្នុងការកំណត់ទាំងនេះជាវិធីល្អបំផុតដើម្បីបង្កើតការប្រៀបធៀបផ្គូផ្គងត្រឹមត្រូវត្រូវ។ នៅក្នុងការប្រកួតអ្នកស្រាវជ្រាវបានមើលទៅតាមរយៈទិន្នន័យមិនពិសោធន៍ដើម្បីបង្កើតគូនៃមនុស្សដែលមានលក្ខណៈស្រដៀងគ្នាលើកលែងតែមួយដែលបានទទួលការព្យាបាលនិងមួយមានមិនបាន។ នៅក្នុងដំណើរការនៃការប្រកួតនេះក្រុមអ្នកស្រាវជ្រាវគឺពិតណាស់ការកាត់មែក; នោះគឺបោះចោលករណីដែលមិនមានការប្រៀបធៀបជាក់ស្តែង។ ដូច្នេះវិធីសាស្រ្តនេះនឹងត្រូវបានហៅតែច្រើនបានត្រឹមត្រូវផ្គូផ្គងនិងការ pruning, ប៉ុន្តែខ្ញុំនឹងបិទជាមួយនឹងរយៈព​​េលប្រពៃណី: ផ្គូផ្គង។

ឧទាហរណ៍ស្រស់ស្អាតនៃអំណាចនៃយុទ្ធសាស្រ្តជាមួយប្រភពទិន្នន័យដែលមិនផ្គូផ្គងនឹងពិសោធន៍យ៉ាងច្រើនបានមកពីការស្រាវជ្រាវលើឥរិយាបថអ្នកប្រើប្រាស់ដោយ Liran Einav និងសហការី (2015) ។ Einav និងមិត្តរួមការងារត្រូវបានគេចាប់អារម្មណ៍នៅក្នុងការដេញថ្លៃយកកន្លែងនៅលើ eBay និងការអធិប្បាយទៅការងាររបស់ពួកគេខ្ញុំនឹងផ្តោតលើទិដ្ឋភាពពិសេសមួយ: ផលប៉ះពាល់នៃការលក់ដេញថ្លៃក្នុងតម្លៃចាប់ផ្តើមនៅលទ្ធផលដេញថ្លៃដូចជាតម្លៃលក់ឬប្រូបាប៊ីលីតេនៃការលក់មួយ។

វិធីឆោតល្ងង់បំផុតដើម្បីឆ្លើយសំណួរអំពីប្រសិទ្ធិភាពនៃតម្លៃចាប់ផ្តើមនៅលើតម្លៃការលក់នេះនឹងត្រូវបានទៅជាធម្មតាគណនាតម្លៃចុងក្រោយសម្រាប់ការដេញថ្លៃជាមួយនឹងតម្លៃចាប់ផ្តើមផ្សេងគ្នា។ វិធីសាស្រ្តនេះអាចនឹងមានការផាកពិន័យប្រសិនបើអ្នកគ្រាន់តែចង់ធ្វើឱ្យទស្សន៍ទាយនេះតម្លៃលក់នៃវត្ថុដែលបានផ្តល់ឱ្យដែលត្រូវបានគេដាក់នៅលើ eBay ដោយមានតម្លៃចាប់ផ្តើមផ្តល់ឱ្យ។ ប៉ុន្តែប្រសិនបើសំណួររបស់អ្នកគឺជាអ្វីដែលជាផលប៉ះពាល់នៃការចាប់ផ្តើមតម្លៃលើលទ្ធផលទីផ្សារវិធីសាស្រ្តនេះនឹងមិនធ្វើការទេព្រោះវាមិនមានមូលដ្ឋានលើការប្រៀបធៀបពិព័រណ៍នេះ; ការដេញថ្លៃដោយមានតម្លៃចាប់ទាបអាចនឹងពិតជាខុសគ្នាពីការដេញថ្លៃដោយមានតម្លៃចាប់ផ្តើមខ្ពស់ (ដូចជាពួកគេអាចនឹងត្រូវបានសម្រាប់ប្រភេទផ្សេងគ្នានៃទំនិញឬរួមមានប្រភេទផ្សេងគ្នានៃអ្នកលក់) ។

ប្រសិនបើអ្នកមានការព្រួយបារម្ភរួចទៅហើយអំពីការប្រៀបធៀបត្រឹមត្រូវ, អ្នកអាចរំលងវិធីសាស្រ្តរឿងឆោតល្ងង់និងពិចារណាការរត់ការពិសោធន៍វាលមួយកន្លែងដែលអ្នកនឹងលក់ជាក់លាក់ធាតុបាននិយាយថា, កីឡាវាយកូនគោលក្លឹបជាមួយនូវសំណុំថេរនៃការដេញថ្លៃប៉ារ៉ាម៉ែត្រមួយដែលថាការដឹកជញ្ជូនដោយឥតគិតថ្លៃ, ការលក់ដេញថ្លៃ បើកចំហសម្រាប់ពីរសប្តាហ៍លដូចគ្នាតែកំណត់តម្លៃដែលចាប់ផ្តើមដោយចៃដន្យ។ ដោយប្រៀបធៀបលទ្ធផលទីផ្សារនោះលទ្ធផលពិសោធន៍វាលនេះនឹងផ្តល់នូវការវាស់វែងយ៉ាងច្បាស់ពីផលប៉ះពាល់នៃការចាប់ផ្តើមតម្លៃលើតម្លៃលក់។ ប៉ុន្តែការវាស់វែងនេះនឹងបានតែអនុវត្តទៅកាន់ផលិតផលជាក់លាក់មួយនិងកំណត់ប៉ារ៉ាម៉ែត្រលក់ដេញថ្លៃ។ លទ្ធផលនេះអាចនឹងមានភាពខុសគ្នា, ឧទាហរណ៍សម្រាប់ប្រភេទផ្សេងគ្នានៃផលិតផល។ បើគ្មានទ្រឹស្តីយ៉ាងខ្លាំង, វាគឺជាការលំបាកក្នុងការ extrapolate តែមួយនេះពីការពិសោធន៍នេះជួរពេញលេញនៃការពិសោធន៍អាចធ្វើទៅបានដែលអាចត្រូវបានរត់។ លើសពីនេះទៀតការពិសោធន៍វាលមានតម្លៃថ្លៃគ្រប់គ្រាន់ថាវានឹងក្លាយ infeasible ដើម្បីរត់ឱ្យបានគ្រប់គ្រាន់នៃពួកគេឡើងទៅគ្របដណ្តប់ទំហំប៉ារ៉ាម៉ែត្រទាំងមូលនៃផលិតផលនិងប្រភេទលក់ដេញថ្លៃ។

ផ្ទុយទៅនឹងវិធីសាស្រ្តនិងវិធីសាស្រ្តពិសោធន៍រឿងឆោតល្ងង់ក្នុងការ, Einav និងសហការីយកវិធីសាស្រ្តទីបី: ការផ្គូផ្គង។ ល្បិចសំខាន់នៃយុទ្ធសាស្រ្តរបស់ពួកគេគឺដើម្បីរកឱ្យឃើញរឿងស្រដៀងគ្នាទៅនឹងការពិសោធន៍វាលដែលបានកើតឡើងរួចទៅហើយនៅលើ eBay ។ ឧទាហរណ៍រូបភាពទី 2,6 បង្ហាញមួយចំនួននៃការចុះបញ្ជីសម្រាប់ការ 31 ក្លឹបវាយកូនហ្គោពិតដូចគ្នាមួយដែលកម្មវិធីដុត 09 កម្មវិធីបញ្ជា Taylormade បាន-ត្រូវបានលក់ដោយពិតជា seller- ដូចគ្នា "budgetgolfer" ។ ទោះជាយ៉ាងណា, ការចុះបញ្ជីទាំងនេះមានលក្ខណៈខុសគ្នាបន្តិច។ ដប់មួយនៃពួកគេផ្តល់ជូននូវកម្មវិធីបញ្ជាសម្រាប់តម្លៃថេរមួយនៃ 124,99 $ ខណៈដែល 20 នាក់ផ្សេងទៀតមានការដេញថ្លៃជាមួយនឹងកាលបរិច្ឆេទចុងផ្សេងគ្នា។ ដូចគ្នានេះផងដែរការចុះបញ្ជីនេះមានថ្លៃសេវាដឹកជញ្ជូនផ្សេងគ្នា, ទាំង $ 7.99 ឬ $ 9.99 ។ នៅក្នុងពាក្យផ្សេងទៀត, វាគឺដូចជាប្រសិនបើ "budgetgolfer" កំពុងរត់ការពិសោធន៍សម្រាប់អ្នកស្រាវជ្រាវបាន។

ការចុះបញ្ជីរបស់កម្មវិធីដុត 09 កម្មវិធីបញ្ជា Taylormade បានត្រូវបានលក់ដោយ "budgetgolfer" គឺជាឧទាហរណ៍មួយនៃសំណុំត្រូវបានផ្គូផ្គងនៃការចុះបញ្ជី, ដែលជាកន្លែងដែលធាតុដូចគ្នាពិតប្រាកដត្រូវបានត្រូវបានលក់ដោយអ្នកលក់ដូចគ្នាពិតប្រាកដប៉ុន្តែរាល់ពេលដែលមានលក្ខណៈខុសគ្នាបន្តិច។ នៅក្នុងកំណត់ហេតុយ៉ាងធំរបស់ eBay មានរាប់រយរាប់ពាន់នាក់នៃសំណុំត្រូវបានផ្គូផ្គងពាក់ព័ន្ធនឹងរាប់លាននាក់នៃការចុះបញ្ជី។ ដូច្នេះជាជាងការប្រៀបធៀបតម្លៃចុងក្រោយសម្រាប់ការដេញថ្លៃទាំងអស់នៅក្នុងតម្លៃចាប់ផ្តើមផ្តល់ឱ្យ, Einav និងមិត្តរួមការងារនៅក្នុងសំណុំប្រៀបធៀបបានផ្គូផ្គង។ ក្នុងគោលបំណងដើម្បីបញ្ចូលគ្នានូវលទ្ធផលពីការប្រៀបធៀបក្នុងរយៈព​​េលរាប់រយរាប់ពាន់នាក់នៃសំណុំត្រូវបានផ្គូផ្គងទាំងនេះ, Einav និងមិត្តរួមការងារឡើងវិញបង្ហាញពីតម្លៃចាប់ផ្តើមនិងតម្លៃចុងក្រោយនៅក្នុងលក្ខខណ្ឌនៃតម្លៃសេចក្តីយោងនៃធាតុគ្នា (ឧទា, តម្លៃលក់មធ្យមរបស់ខ្លួន) ។ ឧទាហរណ៍ប្រសិនបើកម្មវិធីដុត 09 កម្មវិធីបញ្ជា Taylormade មានតម្លៃសេចក្តីយោងនៃ 100 $ (ដោយផ្អែកលើការលក់របស់ខ្លួន), បន្ទាប់មកមានតម្លៃចាប់ពី $ 10 នឹងត្រូវបានបង្ហាញជា 0,1 និងតម្លៃចុងក្រោយ 120 $ នឹងត្រូវបានបញ្ជាក់ជា 1.2 ។

តួលេខ 2,6: ឧទាហរណ៍នៃសំណុំត្រូវបានផ្គូផ្គងមួយ។ នេះគឺជាការពិតប្រាកដដូចគ្នាក្នុងក្លិបកីឡាវាយកូនគោល (កកម្មវិធីដុត 09 កម្មវិធីបញ្ជា Taylormade បាន) ត្រូវបានលក់ដោយបុគ្គលដូចគ្នាពិតប្រាកដ (budgetgolfer), ប៉ុន្តែមួយចំនួននៃការលក់ទាំងនេះត្រូវបានអនុវត្តលក្ខខណ្ឌខុសគ្នា (ឧ, តម្លៃចាប់ផ្តើមមានភាពខុសគ្នា) ។ តួលេខបានយកពី Einav et al ។ (ឆ្នាំ 201​​5) ។

តួលេខ 2,6: ឧទាហរណ៍នៃសំណុំត្រូវបានផ្គូផ្គងមួយ។ នេះគឺជាការពិតប្រាកដដូចគ្នាក្នុងក្លិបកីឡាវាយកូនគោល (កកម្មវិធីដុត 09 កម្មវិធីបញ្ជា Taylormade បាន) ត្រូវបានលក់ដោយបុគ្គលដូចគ្នាពិតប្រាកដ ( "budgetgolfer"), ប៉ុន្តែមួយចំនួននៃការលក់ទាំងនេះត្រូវបានអនុវត្តលក្ខខណ្ឌខុសគ្នា (ឧទា, តម្លៃចាប់ផ្តើមមានភាពខុសគ្នា) ។ តួលេខបានយកពី Einav et al. (2015)

សូមចាំថា Einav និងមិត្តរួមការងារត្រូវបានគេចាប់អារម្មណ៍នៅក្នុងផលប៉ះពាល់នៃតម្លៃចាប់ផ្តើមនៅលើលទ្ធផលដេញថ្លៃ។ ដំបូងដោយប្រើតំរែតំរង់លីនេអ៊ែរពួកគេបានប៉ាន់ប្រមាណថាមានតម្លៃចាប់ផ្តើមកាន់តែខ្ពស់បានកាត់បន្ថយប្រូបាប៊ីលីតេនៃការលក់មួយហើយថាតម្លៃចាប់ផ្តើមខ្ពស់ជាងមុនក្នុងការបង្កើនតម្លៃលក់ចុងក្រោយ, លក្ខខណ្ឌលើការលក់មួយកើតឡើង។ ដោយខ្លួនឯង, ការប៉ាន់ស្មានដែលទាំងនេះត្រូវបានជាមធ្យមលើគ្រប់ផលិតផលនិងសន្មត់ថាទំនាក់ទំនងជាលីនេអ៊ែររវាងតម្លៃចាប់ផ្តើមនិងចុងក្រោយលទ្ធផលគឺមិនមែនទាំងអស់គួរឱ្យចាប់អារម្មណ៍នោះ។ ប៉ុន្តែ Einav និងសហការីប្រើទំហំយ៉ាងធំនៃទិន្នន័យរបស់ពួកគេដើម្បីប៉ាន់ប្រមាណពីភាពខុសគ្នានៃការរកឃើញល្បិចច្រើន។ ជាដំបូង Einav ការប៉ាន់ប្រមាណនិងសហការីបានធ្វើឱ្យការទាំងនេះដោយឡែកពីគ្នាសម្រាប់ធាតុនៃតម្លៃផ្សេងគ្នានិងដោយមិនប្រើតំរែតំរង់លីនេអ៊ែរ។ ពួកគេបានរកឃើញថាខណៈពេលដែលទំនាក់ទំនងរវាងតម្លៃចាប់ផ្តើមនិងប្រូបាប៊ីលីតេនៃការលក់នេះគឺលីនេអ៊ែរទំនាក់ទំនងរវាងតម្លៃចាប់ផ្តើមនិងតម្លៃលក់នេះគឺយ៉ាងច្បាស់មិនមែនជាលីនេអ៊ែរ (រូបភាពទី 2.7) ។ ក្នុងនោះសម្រាប់ការចាប់ផ្តើមតម្លៃ 0,05 និង 0,85 រវាង, តម្លៃចាប់ផ្តើមមានផលប៉ះពាល់តិចតួចណាស់នៅលើតម្លៃលក់, ការរកឃើញដែលត្រូវបានសាងបានខកខានក្នុងការវិភាគដែលបានសន្មត់ថាទំនាក់ទំនងជាលីនែអ៊ែរ។

រូបភាពទី 2.7: ទំនាក់ទំនងរវាងការចាប់ផ្តើមដេញថ្លៃនិងតម្លៃប្រូបាប៊ីលីតេនៃការលក់ (បន្ទះខាងឆ្វេង) និងតម្លៃលក់ (បន្ទះខាងស្ដាំ) ។ មានគឺប្រហែលជាទំនាក់ទំនងរវាងលីនេអ៊ែរតម្លៃចាប់ផ្តើមនិងប្រូបាប៊ីលីតេនៃការលក់នោះទេតែមានទំនាក់ទំនងមិនមែនជាលីនេអ៊ែររវាងតម្លៃចាប់ផ្តើមនិងតម្លៃលក់! សម្រាប់ការចាប់ផ្តើមតម្លៃ 0,05 និង 0,85 រវាង, តម្លៃចាប់ផ្តើមមានផលប៉ះពាល់តិចតួចណាស់នៅលើតម្លៃលក់។ នៅក្នុងករណីទាំងពីរនេះគឺមានមូលដ្ឋានទំនាក់ទំនងឯករាជ្យនៃតម្លៃធាតុ។ ក្រាហ្វទាំងនេះបង្កើតកូនចៅ 4 រូបភពនិង 4 Einav et al ។ (ឆ្នាំ 201​​5) ។

រូបភាពទី 2.7: ទំនាក់ទំនងរវាងការចាប់ផ្តើមដេញថ្លៃនិងតម្លៃប្រូបាប៊ីលីតេនៃការលក់ (បន្ទះខាងឆ្វេង) និងតម្លៃលក់ (បន្ទះខាងស្ដាំ) ។ មានគឺប្រហែលជាទំនាក់ទំនងរវាងលីនេអ៊ែរតម្លៃចាប់ផ្តើមនិងប្រូបាប៊ីលីតេនៃការលក់នោះទេតែមានទំនាក់ទំនងមិនមែនជាលីនេអ៊ែររវាងតម្លៃចាប់ផ្តើមនិងតម្លៃលក់! សម្រាប់ការចាប់ផ្តើមតម្លៃ 0,05 និង 0,85 រវាង, តម្លៃចាប់ផ្តើមមានផលប៉ះពាល់តិចតួចណាស់នៅលើតម្លៃលក់។ នៅក្នុងករណីទាំងពីរនេះគឺមានមូលដ្ឋានទំនាក់ទំនងឯករាជ្យនៃតម្លៃធាតុ។ ក្រាហ្វទាំងនេះបង្កើតកូនចៅ 4 រូបភពនិង 4 Einav et al. (2015)

ទីពីរ, ជាជាងជាមធ្យមជាងធាតុទាំងអស់, Einav និងសហការីផងដែរប្រើទិន្នន័យដែលមានទំហំយ៉ាងធំរបស់ពួកគេដើម្បីប៉ាន់ប្រមាណពីផលប៉ះពាល់នៃតម្លៃចាប់ផ្តើមសម្រាប់ 23 ប្រភេទផ្សេងគ្នានៃធាតុ (ឧទាហរណ៍ការផ្គត់ផ្គង់ចិញ្ចឹម, អេឡិចត្រូនិនិងអនុស្សាវរីយ៍កីឡាអូឡាំពិក) (រូបភាពទី 2.8) ។ ការព្យាករទាំងនេះបានបង្ហាញថាសម្រាប់ធាតុកាន់តែច្រើនដោយឡែកដូចជាការចាប់ផ្ដើមតម្លៃអនុស្សាវរីយ៍មានផលប៉ះពាល់មានទំហំតូចជាងនៅលើប្រូបាប៊ីលីតេនៃការលក់និងឥទ្ធិពលធំនៅលើតម្លៃលក់ចុងក្រោយ។ លើសពីនេះទៀតសម្រាប់ធាតុដូច commodified ជាច្រើនដូចជាឌីវីឌីនិងវីដេអូដែលចាប់ផ្តើមមានស្ទើរតែតម្លៃផលប៉ះពាល់លើតម្លៃចុងក្រោយនោះទេ។ នៅក្នុងពាក្យផ្សេងទៀតដែលរួមបញ្ចូលគ្នានូវលទ្ធផលជាមធ្យមពី 23 ប្រភេទផ្សេងគ្នានៃធាតុមួយដែលលាក់ពសំខាន់អំពីភាពខុសគ្នារវាងធាតុទាំងនេះ។

រូបភាពទី 2.8: ការប៉ាន់ប្រមាណពីលទ្ធផលបានបង្ហាញថាប្រភេទជាលក្ខណៈបុគ្គល; ចំណុចរឹងមាំក្នុងការប៉ាន់ប្រមាណសម្រាប់ប្រភេទទាំងអស់ដែលបានបញ្ចូលគ្នារួមគ្នា, តារាង 11 (Einav et al ។ ឆ្នាំ 201​​5, តារាង 11) ។ ការព្យាករទាំងនេះបានបង្ហាញថាសម្រាប់ធាតុកាន់តែច្រើនដោយឡែកដូចជាអនុស្សាវរីយ៍ដែលមានតម្លៃចាប់ផ្តើមមានឥទ្ធិពលតិចតួចទៅលើប្រូបាប៊ីលីតេនៃការលក់មួយ (អ័ក្ស x) និងឥទ្ធិពលធំនៅលើតម្លៃលក់ចុងក្រោយ (អ័ក្ស Y) ផងដែរ។

រូបភាពទី 2.8: ការប៉ាន់ប្រមាណពីលទ្ធផលបានបង្ហាញថាប្រភេទជាលក្ខណៈបុគ្គល; ចំណុចរឹងមាំក្នុងការប៉ាន់ប្រមាណសម្រាប់ប្រភេទទាំងអស់បញ្ចូលគ្នាជាមួយគ្នា (Einav et al. 2015, Table 11) ។ ការព្យាករទាំងនេះបានបង្ហាញថាសម្រាប់ធាតុកាន់តែច្រើនដោយឡែកដូចជាអនុស្សាវរីយ៍ដែលមានតម្លៃចាប់ផ្តើមមានឥទ្ធិពលតិចតួចទៅលើប្រូបាប៊ីលីតេនៃការលក់មួយ (អ័ក្ស x) និងឥទ្ធិពលធំនៅលើតម្លៃលក់ចុងក្រោយ (អ័ក្ស Y) ផងដែរ។

សូម្បីតែប្រសិនបើអ្នកគឺជាអ្នកមិនចាប់អារម្មណ៍ជាពិសេសនៅក្នុងការដេញថ្លៃនៅលើ eBay, អ្នកមានដើម្បីសរសើរវិធីដែលរូបភាពទី 2.7 និង 2.8 ការផ្តល់ជូនមួយរូបយល់ដឹងផ្តួនៃរបស់ eBay ជាងការព្យាករតំរែតំរង់លីនេអ៊ែរសាមញ្ញមួយដែលសន្មត់និងការរួមបញ្ចូលគ្នានូវទំនាក់ទំនងលីនេអ៊ែរខុសគ្នាជាច្រើននៃប្រភេទធាតុនេះ។ ការប៉ាន់ប្រមាណច្បាស់បន្ថែមទៀតនេះបង្ហាញពីអំណាចនៃការផ្គូផ្គងនៅក្នុងទិន្នន័យធំមួយនេះ; ការប៉ាន់ស្មានទាំងនេះនឹងមិនអាចទៅរួចនោះទេដោយមិនបានមួយចំនួនធំសម្បើមនៃការពិសោធន៍វាលដែលនឹងត្រូវបានថ្លៃសន្ធឹកសន្ធាប់ពេក។

ជាការពិតណាស់យើងគួរតែមានទំនុកចិត្តលើលទ្ធផលនៃការសិក្សាដែលផ្គូផ្គងជាក់លាក់ណាមួយដែលតិចជាងយើងនឹងនៅក្នុងលទ្ធផលនៃការពិសោធន៍ប្រៀបធៀបបាន។ នៅពេលដែលការវាយតម្លៃលទ្ធផលពីការសិក្សាផ្គូផ្គងណាមួយដែលមានការព្រួយបារម្ភសំខាន់ពីរ។ ជាដំបូងយើងត្រូវចងចាំថាយើងអាចធានាបាននូវការប្រៀបធៀបតែត្រឹមត្រូវនៅលើអ្វីដែលត្រូវបានប្រើសម្រាប់ផ្គូផ្គង។ នៅក្នុងលទ្ធផលសំខាន់របស់ពួកគេ Einav ពិតប្រាកដនិងអ្នករួមការងារបានបួនលក្ខណៈផ្គូផ្គង: ចំនួនអ្នកលក់លេខសម្គាល់ប្រភេទធាតុចំណងជើងធាតុ, និងចំណងជើងរង។ ប្រសិនបើមានធាតុគឺខុសគ្នានៅក្នុងវិធីដែលមិនត្រូវបានប្រើសម្រាប់ផ្គូផ្គងដែលអាចបង្កើតជាការប្រៀបធៀបថាមិនត្រឹមត្រូវ។ ឧទាហរណ៍ប្រសិនបើ "budgetgolfer" ទម្លាក់តម្លៃសម្រាប់កម្មវិធីដុត 09 កម្មវិធីបញ្ជា Taylormade បាននៅក្នុងរដូវរងារ (នៅពេលដែលក្លឹបវាយកូនហ្គោលគឺមានការពេញនិយមតិច), បន្ទាប់មកវាអាចលេចឡើងថាតម្លៃចាប់ផ្តើមទាបនាំឱ្យមានការបញ្ចុះតម្លៃចុងក្រោយ, ពេលដែលនៅក្នុងការពិតនេះនឹងក្លាយជារដូវកាលមួយនៃវត្ថុបុរាណ បំរែបំរួលនៅក្នុងតម្រូវការ។ នៅក្នុងទូទៅ, វិធីសាស្រ្តល្អបំផុតដើម្បីបញ្ហានេះហាក់ដូចជាត្រូវបានព្យាយាមប្រភេទផ្សេងគ្នាជាច្រើននៃការប្រកួត។ ឧទាហរណ៍ការធ្វើឡើងវិញនិងសហការី Einav ការវិភាគរបស់ខ្លួនដែលជាកន្លែងដែលសំណុំត្រូវបានផ្គូផ្គងរួមបញ្ចូលធាតុនៅលើការលក់ក្នុងរយៈព​​េលមួយឆ្នាំក្នុងរយៈព​​េលមួយខែហើយដែលមានស្រាប់។ ធ្វើឱ្យបង្អួចពេលវេលាកាន់តែតឹងរ៉ឹងមានការថយចុះចំនួននៃសំណុំត្រូវបានផ្គូផ្គងនោះទេប៉ុន្តែកាត់បន្ថយការព្រួយបារម្ភអំពីការបំរែបំរួលតាមរដូវកាល។ ជាសំណាងល្អពួកគេបានរកឃើញថាការផ្លាស់ប្តូរដោយលទ្ធផលការផ្លាស់ប្តូរទាំងនេះនៅក្នុងលក្ខណៈវិនិច្ឆ័យដែលត្រូវគ្នា។ នៅក្នុងអក្សរសិល្ប៍ដែលផ្គូផ្គងនឹងប្រភេទនៃការព្រួយបារម្ភនេះជាធម្មតាត្រូវបានបញ្ជាក់នៅក្នុងលក្ខខណ្ឌនៃការសង្កេតនិង unobservables ប៉ុន្តែគំនិតសំខាន់គឺពិតជាថាអ្នកស្រាវជ្រាវកំពុងបង្កើតប្រៀបធៀបតែការតាំងពិព័រណ៍លើលក្ខណៈពិសេសដែលបានប្រើនៅក្នុងការប្រកួត។

ការព្រួយបារម្ភសំខាន់ទីពីរនៅពេលដែលការបកស្រាយលទ្ធផលផ្គូផ្គងគឺថាពួកគេតែអនុវត្តទៅទិន្នន័យដែលបានផ្គូផ្គង; ពួកគេមិនបានអនុវត្តចំពោះករណីដែលមិនអាចត្រូវបានផ្គូផ្គង។ ឧទាហរណ៍ដោយកំណត់ការស្រាវជ្រាវរបស់ពួកគេដើម្បីចុះបញ្ជីធាតុដែលមានច្រើន Einav និងសហការីកំពុងផ្តោតលើអ្នកលក់ពាក់កណ្តាលជំនាញវិជ្ជាជីវៈនិងជំនាញវិជ្ជាជីវៈ។ ដូច្នេះនៅពេលបកប្រែការប្រៀបធៀបនេះយើងត្រូវតែចងចាំថាពួកគេគ្រាន់តែអនុវត្តទៅសំណុំរងនៃក្រុមហ៊ុន eBay នេះ។

ផ្គូផ្គងជាយុទ្ធសាស្រ្តមួយដែលមានឥទ្ធិពលសម្រាប់ការស្វែងរកការប្រៀបធៀបស្មើភាពគ្នានៅក្នុងទិន្នន័យធំ។ អ្នកវិទ្យាសាស្រ្តសង្គមជាច្រើនផ្គូផ្គងមានអារម្មណ៍ថាដូចជាលើកទីពីរដែលល្អបំផុតដើម្បីធ្វើពិសោធន៍ប៉ុន្តែនោះគឺជាជំនឿដែលគួរត្រូវបានកែលម្អបន្តិចមួយ។ ការផ្គូផ្គងនៅក្នុងទិន្នន័យធំមួយអាចនឹងល្អប្រសើរជាងការមួយចំនួនតូចមួយនៃការពិសោធន៍វាលពេល: 1) មានកំណើតនៅផលប៉ះពាល់គឺមានសារៈសំខាន់និង 2) មានអ្នកសង្កេតការណ៍ល្អសម្រាប់ផ្គូផ្គង។ តារាង 2.4 ផ្តល់នូវឧទាហរណ៍មួយចំនួនផ្សេងទៀតនៃរបៀបដែលផ្គូផ្គងអាចត្រូវបានប្រើជាមួយប្រភពទិន្នន័យធំ។

តារាង 2.4: ឧទាហរណ៍នៃការសិក្សាដែលប្រើការផ្គូផ្គងដើម្បីស្វែងរកការប្រៀបធៀបមធ្យមនៅក្នុងដានឌីជីថល។
ការផ្តោតយ៉ាងសំខាន់ ប្រភពទិន្នន័យធំ អំណះអំណាង
បែបផែននៃការបាញ់ប្រហារលើអំពើហឹង្សារបស់ប៉ូលីស បញ្ឈប់និង Frisk កំណត់ត្រា Legewie (2016)
បែបផែននៃទី 11 ខែកញ្ញាឆ្នាំ 2001 លើក្រុមគ្រួសារនិងអ្នកជិតខាង កំណត់ត្រាការបោះឆ្នោតនិងការកត់ត្រាការបរិច្ចាគ Hersh (2013)
ការរីករាលដាលសង្គម ការទំនាក់ទំនងនិងការអនុម័តផលិតផលទិន្នន័យ Aral, Muchnik, and Sundararajan (2009)

នៅក្នុងសេចក្តីសន្និដ្ឋាន, វិធីសាស្រ្តការប៉ាន់ស្មានផលប៉ះពាល់ទៅនឹងរឿងឆោតល្ងង់ពីទិន្នន័យមិនធ្វើអោយពិសោធន៍មានះថាក់-។ ទោះជាយ៉ាងណា, យុទ្ធសាស្រ្តសម្រាប់ការធ្វើឱ្យការប៉ាន់ស្មានធ្វើអោយស្ថិតនៅតាមបណ្ដោយបន្តពីខ្លាំងបំផុតទៅទាបបំផុតមួយនិងអាចរកឃើញការប្រៀបធៀបអ្នកស្រាវជ្រាវពិព័រណ៍នៅក្នុងទិន្នន័យមិនពិសោធន៍។ កំណើននៃប្រព័ន្ធទិន្នន័យធំជានិច្ចបង្កើនសមត្ថភាពរបស់យើងក្នុងការប្រើវិធីសាស្រ្តដែលមានស្រាប់ចំនួនពីរប្រសិទ្ធិភាព: ការពិសោធន៍ធម្មជាតិនិងការផ្គូផ្គង។