3.6.1 សម្រាយស្នើសុំ

ការភ្ជាប់ការស្ទង់មតិរបស់អ្នកទៅដានឌីជីថលអាចមានដូចជាសុំឱ្យមនុស្សគ្រប់គ្នាសំណួររបស់អ្នកគ្រប់ពេលវេលា។

ការសួរជាទូទៅម​​ានពីរប្រភេទសំខាន់: អង្កេតនិងជំរឿន។ ការស្ទង់មតិគំរូ, ដែលជាកន្លែងដែលអ្នកចូលដំណើរការមួយចំនួនតូចមួយនៃមនុស្សដែលអាចបត់បែនបានទាន់ពេលវេលានិងមានតំលៃថោកដែលទាក់ទង។ ទោះជាយ៉ាងណា, ការស្ទង់មតិគំរូព្រោះពួកគេត្រូវបានផ្អែកលើគំរូមួយដែលជាញឹកញាប់ត្រូវបានកំណត់នៅក្នុងដំណោះស្រាយរបស់ពួកគេ; ជាមួយនឹងការស្ទង់មតិគំរូមួយ, វាជាញឹកញាប់គឺពិបាកក្នុងការធ្វើការប៉ាន់ប្រមាណអំពីតំបន់ភូមិសាស្ត្រជាក់លាក់ឬសម្រាប់ក្រុមប្រជាសាស្រ្តជាក់លាក់។ ជំរឿននៅលើផ្សេងទៀត, ព្យាយាមដើម្បីសំភាសន៍គ្រប់គ្នានៅក្នុងចំនួនប្រជាជន។ ពួកគេមានដំណោះស្រាយមួយយ៉ាងធំប៉ុន្តែពួកគេមានតំលៃថ្លៃជាទូទៅចង្អៀតក្នុងការផ្តោតអារម្មណ៍ (ដែលពួកគេបានត្រឹមតែរួមបញ្ចូលមួយចំនួនតូចនៃសំណួរ) និងមិនទាន់ពេលវេលា (ពួកគេបានកើតឡើងនៅលើកាលវិភាគជាក់លាក់មួយ, ដូចជារៀងរាល់ 10 ឆ្នាំ) (Kish 1979) ។ ឥឡូវនេះស្រមៃបើសិនជាអ្នកស្រាវជ្រាវអាចបញ្ចូលគ្នានូវលក្ខណៈល្អបំផុតនៃការអង្កេតនិងជំរឿនប្រជាជន ស្រមៃប្រសិនបើអ្នកស្រាវជ្រាវអាចសួរសំណួរជារៀងរាល់ទៅមនុស្សគ្រប់គ្នាជារៀងរាល់ថ្ងៃ។

ជាក់ស្តែង, ជាបន្តនេះគ្រប់ទីកន្លែង, តែងតែនៅលើការស្ទង់មតិគឺជាប្រភេទនៃការទូទៅផ្នែកវិទ្យាសាស្រ្តសង្គម។ ប៉ុន្តែវាហាក់ដូចជាថាយើងអាចចាប់ផ្តើមដើម្បីប្រហាក់ប្រហែលនេះដោយរួមបញ្ចូលគ្នារវាងសំណួរអង្កេតមួយចំនួនតូចមួយនៃមនុស្សដែលមានដានឌីជីថលពីមនុស្សជាច្រើន។ ខ្ញុំហៅការរួមបញ្ចូលគ្នានេះប្រភេទនៃការស្នើសុំបានពង្រីកឱ្យធំ។ ប្រសិនបើធ្វើបានយ៉ាងល្អនោះវាអាចជួយយើងបានផ្តល់នូវការប៉ាន់ប្រមាណជាដែលមាននៅក្នុងស្រុកកាន់តែច្រើន (តំបន់ភូមិសាស្រ្តមានទំហំតូចសម្រាប់), granular ច្រើនទៀត (សម្រាប់ក្រុមប្រជាសាស្រ្តជាក់លាក់), និងទាន់ពេលវេលាច្រើនទៀត។

ឧទាហរណ៍មួយនៃការស្នើសុំបានពង្រីកឱ្យធំបានមកពីការងាររបស់លោកយ៉ូស្វេ Blumenstock ដែលចង់ប្រមូលទិន្នន័យដែលនឹងជួយអភិវឌ្ឍមគ្គុទេសក៍នៅក្នុងប្រទេសក្រីក្រ។ ជាពិសេសជាងនេះទៅទៀត Blumenstock ចង់បង្កើតប្រព័ន្ធដើម្បីវាស់ស្ទង់ទ្រព្យសម្បត្តិនិងសុខុមាលភាពដែលបានរួមបញ្ចូលភាពពេញលេញនៃការធ្វើជំរឿនដោយមានភាពបត់បែននិងភាពញឹកញាប់នៃការស្ទង់មតិមួយមួយ (Blumenstock 2014; Blumenstock, Cadamuro, and On 2015) ។ នៅក្នុងការពិត, ខ្ញុំបានរៀបរាប់ការងារមួយរយៈខ្លីរួចទៅហើយ Blumenstock ក្នុងជំពូកទី 1 ។

ដើម្បីចាប់ផ្តើម, Blumenstock សហការជាមួយអ្នកផ្តល់សេវាទូរស័ព្ទចល័តធំជាងគេនៅប្រទេសរ៉្វាន់ដា។ ក្រុមហ៊ុននេះបានផ្ដល់អោយគាត់កំណត់ត្រាប្រតិបត្តិការអនាមិកពីអតិថិជនអំពី 1,5 លានគ្របដណ្តប់ឥរិយាបថនេះពីឆ្នាំ 2005 និងឆ្នាំ 2009 កំណត់ហេតុនេះមានអំពីការហៅទូរស័ព្ទនិងអត្ថបទសារគ្នាដូចជាពេលចាប់ផ្តើមរយៈពេលនិងទីតាំងភូមិសាស្រ្តប្រហាក់ប្រហែលនៃទូរស័ព្ទចូលនិងការទទួល។ មុនពេលដែលយើងចាប់ផ្តើមនិយាយអំពីបញ្ហាស្ថិតិរបស់វាគឺមានតំលៃចង្អុលបង្ហាញថាជំហានដំបូងនេះអាចជាផ្នែកមួយនៃការលំបាកបំផុតនោះ។ ដូចបានរៀបរាប់ក្នុងជំពូកទី 2 ទិន្នន័យដានឌីជីថលបំផុតគឺមិនអាចចូលដំណើរការដល់អ្នកស្រាវជ្រាវ។ ហើយមានក្រុមហ៊ុនជាច្រើនមានហាក់ដូចស្ទាក់ស្ទើរក្នុងការចែករំលែកទិន្នន័យពីព្រោះឯកជ​​ន; ដែលជាអតិថិជនរបស់ពួកគេប្រហែលជាមិនបានរំពឹងថានឹងត្រូវបានកំណត់ត្រារបស់ខ្លួនក្នុងបរិមាណច្រើនចែករំលែកជាមួយក្រុមអ្នកស្រាវជ្រាវ។ ក្នុងករណីនេះក្រុមអ្នកស្រាវជ្រាវបានយកជំហានប្រយ័ត្នក្នុងការបញ្ចេញទិន្នន័យនិងការងាររបស់ពួកគេត្រូវបានគ្រប់គ្រងដោយភាគីទីបី (ពោលគឺ IRB បានរបស់ពួកគេ) ។ ប៉ុន្តែទោះបីជាកិច្ចខិតខំប្រឹងប្រែងទាំងនេះ, ទិន្នន័យទាំងនេះគឺប្រហែលជានៅតែកំណត់អត្តសញ្ញាណហើយពួកគេទំនងជាមានការប្រកាន់អក្សរតូចធំ (Mayer, Mutchler, and Mitchell 2016; Landau 2016) ។ ខ្ញុំនឹងត្រឡប់ទៅសំណួរវិជ្ជាជីវៈទាំងនេះនៅក្នុងជំពូកទី 6 ។

សូមចាំថា Blumenstock ចាប់អារម្មណ៍ក្នុងការវាស់ទ្រព្យសម្បត្តិនិងសុខុមាលភាព។ ប៉ុន្តែលក្ខណៈទាំងនេះគឺមិនដោយផ្ទាល់នៅក្នុងកំណត់ត្រាការហៅ។ នៅក្នុងពាក្យផ្សេងទៀត, កំណត់ត្រាការហៅទាំងនេះគឺមិនពេញលេញសម្រាប់ការស្រាវជ្រាវនេះជាលក្ខណៈពិសេសទូទៅនៃដានឌីជីថលដែលត្រូវបានពិភាក្សានៅក្នុងលម្អិតនៅក្នុងជំពូកទី 2 ប៉ុន្តែវាហាក់ដូចជាទំនងជាថាការកត់ត្រាការហៅនេះប្រហែលជាមានមួយចំនួនអំពីទ្រព្យសម្បត្តិពនិងសុខុមាលភាព។ ដូច្នេះវិធីមួយនៃការសួរសំណួរ Blumenstock អាចជា: គឺវាអាចធ្វើទៅបានដើម្បីព្យាករណ៍ថាតើនរណាម្នាក់នឹងឆ្លើយតបទៅនឹងការស្ទង់មតិមួយដែលមានមូលដ្ឋានលើទិន្នន័យដានឌីជីថលរបស់ពួកគេ? បើដូច្នោះនោះដោយសួរមនុស្សមួយចំនួនដែលយើងអាចទាយចម្លើយរបស់អ្នកដទៃ។

ដើម្បីវាយតម្លៃនេះអាណាចក្រ Blumenstock និងការស្រាវជ្រាវពីវិទ្យាស្ថានទីក្រុងគីហ្គាលីអ្នកជំនួយការវិទ្យាសាស្រ្តនិងបច្ចេកវិទ្យាបានគេហៅថាគំរូនៃអតិថិជនទូរស័ព្ទចល័តប្រមាណមួយពាន់មួយ។ អ្នកស្រាវជ្រាវបានពន្យល់ថាគោលបំណងនៃគម្រោងនេះដើម្បីចូលរួមសួរថាសម្រាប់ការយល់ព្រមរបស់ពួកគេដើម្បីភ្ជាប់ការអង្កេតនេះបានឆ្លើយតបទៅនឹងកំណត់ត្រាការហៅទូរស័ព្ទនិងបន្ទាប់មកបានសួរពួកគេស៊េរីនៃសំណួរមួយដើម្បីវាស់ទ្រព្យសម្បត្តិនិងសុខុមាលភាពរបស់ពួកគេដូចជា "តើអ្នកជាម្ចាស់មួយ វិទ្យុ? "និង" តើអ្នកជាម្ចាស់កង់មួយ? » (សូមមើលរូបភាពទី 3.11 សម្រាប់បញ្ជីផ្នែកមួយ) ។ អ្នកចូលរួមទាំងអស់ក្នុងការអង្កេតនេះត្រូវបានផ្តល់សំណងផ្នែកហិរញ្ញវត្ថុ។

បន្ទាប់, Blumenstock បានប្រើជានីតិវិធីពីរជំហានជាទូទៅនៅក្នុងវិទ្យាសាស្ដ្រទិន្នន័យ: វិស្វកម្មលក្ខណៈពិសេសអមដោយការរៀនសូត្រប្រាស់។ ជាដំបូងនៅក្នុងជំហានវិស្វកម្មលក្ខណៈពិសេសសម្រាប់មនុស្សគ្រប់គ្នាដែលត្រូវបានសម្ភាសន៍បានឆ្លើយថា Blumenstock បម្លែងកំណត់ត្រាហៅចូលទៅក្នុងសំណុំនៃលក្ខណៈអំពីមនុស្សម្នាក់មួយ; អ្នកវិទ្យាសាស្ដ្រទិន្នន័យដែលអាចហៅលក្ខណៈ "លក្ខណៈពិសេស" និងវិទ្យាសាស្ដ្រសង្គមនឹងហៅពួកគេថា "អថេរ។ " ឧទាហរណ៍សម្រាប់មនុស្សម្នាក់, Blumenstock គណនាចំនួនសរុបនៃថ្ងៃដោយមានសកម្មភាពចំនួនមនុស្សខុសគ្នាមនុស្សម្នាក់ដែលបាននៅក្នុងការទំនាក់ទំនងជាមួយនឹងចំនួន នៃប្រាក់ចំណាយលើទូរស័ព្ទនិងនៅលើដូច្នេះ។ សំខាន់, វិស្វកម្មលក្ខណៈពិសេសល្អទាមទារចំណេះដឹងនៃការកំណត់ការស្រាវជ្រាវនេះ។ ឧទាហរណ៍ប្រសិនបើវាជាការសំខាន់ក្នុងការបែងចែករវាងការហៅទូរស័ព្ទក្នុងស្រុកនិងអន្ដរជាតិ (ដែលយើងអាចរំពឹងថានឹងមនុស្សដែលបានហៅជាអន្តរជាតិដើម្បីឱ្យមានទ្រព្យធន), បន្ទាប់មកនេះត្រូវតែត្រូវបានធ្វើនៅជំហានវិស្វកម្មលក្ខណៈពិសេស។ អ្នកស្រាវជ្រាវយល់ដឹងតិចតួចអំពីប្រទេសរ៉្វាន់ដាអាចមិនរួមបញ្ចូលលក្ខណៈពិសេសនេះ, ហើយបន្ទាប់មកសម្តែងការព្យាករណ៍នៃម៉ូដែលនេះនឹងរងទុក្ខ។

បន្ទាប់, ការរៀននៅក្នុងជំហានការចាត់ចែង, Blumenstock បានកសាងឡើងជាគំរូស្ថិតិដើម្បីទស្សន៍ទាយការឆ្លើយតបការស្ទង់មតិសម្រាប់មនុស្សម្នាក់ដោយផ្អែកលើលក្ខណៈពិសេសរបស់ខ្លួន។ ក្នុងករណីនេះត្រូវបានគេប្រើតំរែតំរង់ដឹកជញ្ជូន Blumenstock ជាមួយចំនួន 10 ដងឆ្លងសុពលភាពទេប៉ុន្តែគាត់អាចបានប្រើភាពខុសគ្នានៃវិធីសាស្រ្តស្ថិតិឬម៉ាស៊ីនការរៀនសូត្រផ្សេងទៀត។

ដូច្នេះតើវាបានធ្វើការ? គឺ Blumenstock អាចទស្សន៍ទាយចម្លើយតបទៅនឹងការស្ទង់មតិសំណួរថា«តើអ្នកជាម្ចាស់វិទ្យុ? "និង" តើអ្នកជាម្ចាស់កង់មួយ? "ដោយប្រើលក្ខណៈពិសេសចេញមកពីការកត់ត្រាការហៅ? តម្រៀបនៃការ។ ភាពត្រឹមត្រូវនៃការព្យាករនេះត្រូវបានគេខ្ពស់សម្រាប់លក្ខណៈមួយចំនួន (រូបភាព 3.11) ។ ប៉ុន្តែវាគឺតែងតែជាការសំខាន់ក្នុងការប្រៀបធៀបវិធីសាស្រ្តក្នុងការព្យាករមួយដែលស្មុគ្រស្មាញប្រឆាំងនឹងជាជម្រើសសាមញ្ញ។ ក្នុងករណីនេះជាជម្រើសសាមញ្ញគឺដើម្បីទស្សន៍ទាយថាអ្នករាល់គ្នានឹងផ្តល់នូវចម្លើយទូទៅបំផុត។ ឧទាហរណ៍ 97,3% បានរាយការណ៍ថាម្ចាស់វិទ្យុដូច្នេះប្រសិនបើ Blumenstock បានព្យាករថាអ្នករាល់គ្នានឹងរាយការណ៍ពីម្ចាស់វិទ្យុដែលគាត់នឹងមានភាពត្រឹមត្រូវនៃ 97,3% ដែលជាការគួរឱ្យភ្ញាក់ផ្អើលស្រដៀងគ្នាទៅនឹងការអនុវត្តនៃនីតិវិធីស្មុគស្មាញបន្ថែមទៀតរបស់គាត់ (97,6% ភាពត្រឹមត្រូវ) នេះមួយ។ នៅក្នុងពាក្យផ្សេងទៀតទាំងអស់ទិន្នន័យពុម្ពអក្សរក្បូរក្បាច់និងការបង្ហាញម៉ូតកើនឡើងភាពត្រឹមត្រូវនៃការព្យាករពី 97,3% ដល់ 97,6% ។ ទោះយ៉ាងណាសម្រាប់សំណួរផ្សេងទៀតដូចជា "តើអ្នកជាម្ចាស់កង់?", ធ្វើឱ្យប្រសើរឡើងពីការព្យាករ% ទៅ 67,6 54,4% ។ ជាទូទៅ, រូបភាពទី 3.12 បង្ហាញសម្រាប់លក្ខណៈខ្លះ Blumenstock មិនបានប្រសើរឡើងច្រើនហួសពីការធ្វើឱ្យទស្សន៍ទាយមូលដ្ឋានសាមញ្ញប៉ុន្តែថាសម្រាប់លក្ខណៈផ្សេងទៀតមិនមានភាពប្រសើរឡើងមួយចំនួន។

រូបភាពទី 3.11: ភាពត្រឹមត្រូវទបណ្តុះបណ្តាសម្រាប់ម៉ូដែលស្ថិតិកំណត់ត្រាហៅជាមួយ។ លទ្ធផលពីតារាងទី 2 នៃ Blumenstock (2014) ។

រូបភាពទី 3.11: ភាពត្រឹមត្រូវទបណ្តុះបណ្តាសម្រាប់ម៉ូដែលស្ថិតិកំណត់ត្រាហៅជាមួយ។ លទ្ធផលពីតារាងទី 2 នៃ Blumenstock (2014)

រូបភាពទី 3.12: ការប្រៀបធៀបនៃភាពត្រឹមត្រូវព្យាករណ៍សម្រាប់ម៉ូដែលស្ថិតិទទួលបានការបណ្តុះបណ្តាលជាមួយកំណត់ត្រាហៅការព្យាករមូលដ្ឋានសាមញ្ញ។ ពិន្ទុត្រូវបាន jittered បន្តិចដើម្បីជៀសវាងការត្រួតស៊ីគ្នា! សូមមើលតារាងទី 2 នៃ Blumenstock (2014) សម្រាប់តម្លៃពិតប្រាកដ។

រូបភាពទី 3.12: ការប្រៀបធៀបនៃភាពត្រឹមត្រូវព្យាករណ៍សម្រាប់ម៉ូដែលស្ថិតិទទួលបានការបណ្តុះបណ្តាលជាមួយកំណត់ត្រាហៅការព្យាករមូលដ្ឋានសាមញ្ញ។ ពិន្ទុត្រូវបាន jittered បន្តិចដើម្បីជៀសវាងការត្រួតស៊ីគ្នា! សូមមើលតារាងទី 2 នៃ Blumenstock (2014) សម្រាប់តម្លៃពិតប្រាកដ។

នៅចំណុចនេះអ្នកអាចនឹងត្រូវបានគិតថាលទ្ធផលទាំងនេះគឺជាការខកចិត្តបន្តិចប៉ុន្តែគ្រាន់តែមួយឆ្នាំក្រោយមក Blumenstock និងពីរមិត្តរួមការងារ-កាព្រីយ៉ែល Cadamuro និង Robert បោះពុម្ភផ្សាយនៅលើក្រដាសមួយនៅក្នុងវិទ្យាសាស្រ្តជាមួយនឹងលទ្ធផលល្អប្រសើរជាងមុនខ្លាំង (Blumenstock, Cadamuro, and On 2015) ។ មានមូលហេតុសំខាន់ពីរបច្ចេកទេសសម្រាប់ភាពប្រសើរឡើងនោះគឺ: 1) ពួកគេបានប្រើវិធីសាស្រ្តស្មុគ្រស្មាញកាន់តែច្រើន (មានន័យថាវិធីសាស្រ្តថ្មីដើម្បីបំព​​ាក់វិស្វកម្មនិងម៉ូដែលរៀនម៉ាស៊ីនដែលទំនើប) និង 2) ជាជាងការព្យាយាមដើម្បីឆ្លើយតបទៅនឹងសំណួរ infer ការស្ទង់មតិបុគ្គល (ឧទា, «តើអ្នកជាម្ចាស់វិទ្យុមួយ? "), ពួកគេបានព្យាយាមសន្និដ្ឋានទ្រព្យសមាសធាតុសន្ទស្សន៍។

Blumenstock និងសហការីបានបង្ហាញការសម្តែងរបស់ពួកគេនៅក្នុងវិធីសាស្រ្តពីរយ៉ាង។ ដំបូងពួកគេបានរកឃើញថាសម្រាប់ប្រជាជនក្នុងគំរូរបស់ពួកគេពួកគេអាចធ្វើការងារបានល្អស្អាតនៃការព្យាករណ៍ទ្រព្យសម្បត្តិរបស់ខ្លួនពីកំណត់ត្រាហៅ (រូបភាព 3.14) ។ ទីពីរនិងមិនធ្លាប់សំខាន់ជាង Blumenstock និងសហការីបានបង្ហាញថានីតិវិធីរបស់ពួកគេអាចបង្កើតការប៉ាន់ប្រមាណដែលមានគុណភាពខ្ពស់នៃការចែកចាយភូមិសាស្រ្តនៃទ្រព្យសម្បត្តិនៅក្នុងប្រទេសរ៉្វាន់ដា។ ជាពិសេសជាងនេះទៅទៀតពួកគេបានប្រើម៉ូដែលម៉ាស៊ីនរៀនរបស់ពួកគេដែលត្រូវបានទទួលការបណ្តុះបណ្តាលស្តីពីគំរូរបស់ពួកគេនៃប្រជាជនប្រហែល 1.000 នាក់ដើម្បីទស្សន៍ទាយទ្រព្យសម្បត្តិនៃការទាំងអស់ 1,5 លាននាក់ក្នុងកំណត់ត្រាការហៅ។ លើសពីនេះទៀត, ជាមួយនឹងទិន្នន័យទំហំភូមិសាស្ត្របានបង្កប់នៅក្នុងទិន្នន័យការហៅ (រំលឹកថាទិន្នន័យការហៅរួមបញ្ចូលទីតាំងនៃអគារកោសិកាដែលនៅជិតបំផុតសម្រាប់ការហៅគ្នា), អ្នកស្រាវជ្រាវអាចប៉ាន់ស្មានថាកន្លែងប្រហាក់ប្រហែលរស់នៅរបស់មនុស្សម្នាក់។ ការដាក់ការប៉ាន់ស្មានទាំងពីររួមគ្នា, ការស្រាវជ្រាវបានផលិតការប៉ាន់ប្រមាណនៃការចែកចាយភូមិសាស្រ្តនៃទ្រព្យសម្បត្តិអតិថិជននៅស្ថានភាពទំហំល្អប្រសើរខ្លាំងណាស់។ ឧទាហរណ៍ពួកគេអាចប៉ាន់ស្មានថាទ្រព្យសម្បត្តិជាមធ្យមនៅក្នុងការគ្នានៃកោសិកាដា Rwanda 2148 (អង្គភាពរដ្ឋបាលដែលតូចជាងគេបំផុតនៅក្នុងប្រទេសកម្ពុជា) ។ តម្លៃទ្រព្យសម្បត្តិបានព្យាករថាអ្នកទាំងនេះជា granular ដូច្នេះពួកគេត្រូវបានគេមានការលំបាកក្នុងការពិនិត្យមើល។ ដូច្នេះក្រុមអ្នកស្រាវជ្រាវបានសរុបលទ្ធផលរបស់ខ្លួនដើម្បីផលិតការប៉ាន់ប្រមាណនៃទ្រព្យសម្បត្តិជាមធ្យមនៃស្រុករបស់ប្រទេសរ៉្វាន់ដា 30 ។ ការប៉ាន់ប្រមាណថ្នាក់ស្រុកទាំងនេះត្រូវបានគេប៉ាន់ប្រមាណទាក់ទងនឹងយ៉ាងខ្លាំងទៅនឹងមាសមួយដែលបានមកពីការស្ទង់មតិតាមបែបប្រពៃណីស្ដង់ដារដែលបានការអង្កេតប្រជាសាស្ដ្រនិងសុខភាពប្រទេស Rwanda (រូបភាព 3.14) ។ ទោះបីជាការប៉ាន់ស្មានពីប្រភពពីរនាក់ដែលស្រដៀងគ្នា, ការប៉ាន់ប្រមាណពី Blumenstock និងមិត្តរួមការងារបានប្រមាណ 50 ដងតម្លៃថោកជាងនិងលឿនជាងមុន 10 ដង (នៅពេលដែលការចំណាយក្នុងការវាស់នៅក្នុងលក្ខខណ្ឌនៃការចំណាយលើការអថេរ) ។ នេះជាការធ្លាក់ចុះយ៉ាងខ្លាំងនៅក្នុងការចំណាយមានន័យថាជាជាងត្រូវបានរត់រៀងរាល់ពីរបីឆ្នាំដូចជាស្តង់ដាមួយសម្រាប់ការស្ទង់មតិប្រជាសាស្រ្តនិងសុខភាពដែលជាកូនកាត់នៃការស្ទង់មតិតូចមួយបានរួមបញ្ចូលគ្នាជាមួយនឹងទិន្នន័យដានឌីជីថលធំអាចត្រូវបានរត់ជារៀងរាល់ខែ។

រូបភាពទី 3.13: គំនូរបំព្រួញនៃ Blumenstock, Cadamuro និងនៅលើ (ឆ្នាំ 201​​5) ។ ទិន្នន័យទូរស័ព្ទពីក្រុមហ៊ុនទូរស័ព្ទត្រូវបានបម្លែងទៅជាម៉ាទ្រីសមួយដែលមានជួរដេកមួយសម្រាប់មនុស្សម្នាក់និងជួរឈរមួយសម្រាប់លក្ខណៈពិសេស (ឧទាហរណ៍អថេរ) ។ បន្ទាប់, អ្នកស្រាវជ្រាវបានបង្កើតគំរូសិក្សាមួយដែលបានចាត់ទៅទស្សន៍ទាយការឆ្លើយតបពីមនុស្សម្នាក់ការស្ទង់មតិនេះដោយម៉ាទ្រីសលក្ខណៈពិសេស។ បន្ទាប់មក, ការរៀនប្រាស់គំរូត្រូវបានប្រើប្រាស់ដើម្បីឆ្លើយតបការស្ទង់មតិនេះគិតគូរសម្រាប់មនុស្សគ្រប់គ្នា។ នៅក្នុងខ្លឹម, អ្នកស្រាវជ្រាវបានប្រើការឆ្លើយតបប្រហែលមួយពាន់នាក់ដើម្បីអះអាងទ្រព្យសម្បត្តិប្រហែលមួយលាននាក់។ ដូចគ្នានេះផងដែរ, អ្នកស្រាវជ្រាវបានប៉ាន់ប្រមាណថាជាកន្លែងលំនៅដ្ឋានសម្រាប់លទាំងអស់ 1,5 លាននាក់ដែលមានមូលដ្ឋានលើទីតាំងនៃការហៅទូរស័ព្ទរបស់ពួកគេ។ នៅពេលដែលការប៉ាន់ស្មានទាំងពីរនាក់ត្រូវបានរួមបញ្ចូលគ្នានេះទ្រព្យសម្បត្តិបានប៉ាន់ប្រមាណនិងជាកន្លែងនៃលំនៅដ្ឋាន-ប៉ាន់ប្រមាណថាលទ្ធផលគឺស្រដៀងគ្នាទៅនឹងការប៉ាន់ប្រមាណពីការស្ទង់មតិប្រជាសាស្រ្តនិងសុខភាពការស្ទង់មតិប្រពៃណីមាសស្តង់ដារ (រូបភាព 3.14) ។

រូបភាពទី 3.13: គំនូរបំព្រួញនៃ Blumenstock, Cadamuro, and On (2015) ។ ទិន្នន័យទូរស័ព្ទពីក្រុមហ៊ុនទូរស័ព្ទត្រូវបានបម្លែងទៅជាម៉ាទ្រីសមួយដែលមានជួរដេកមួយសម្រាប់មនុស្សម្នាក់និងជួរឈរមួយសម្រាប់លក្ខណៈពិសេស (ពោលគឺអថេរ) ។ បន្ទាប់, អ្នកស្រាវជ្រាវបានបង្កើតគំរូសិក្សាមួយដែលបានចាត់ទៅទស្សន៍ទាយការឆ្លើយតបពីមនុស្សម្នាក់ការស្ទង់មតិនេះដោយម៉ាទ្រីសលក្ខណៈពិសេស។ បន្ទាប់មក, ការរៀនប្រាស់គំរូត្រូវបានប្រើប្រាស់ដើម្បីឆ្លើយតបការស្ទង់មតិនេះគិតគូរសម្រាប់មនុស្សគ្រប់គ្នា។ នៅក្នុងខ្លឹម, អ្នកស្រាវជ្រាវបានប្រើការឆ្លើយតបប្រហែលមួយពាន់នាក់ដើម្បីអះអាងទ្រព្យសម្បត្តិប្រហែលមួយលាននាក់។ ដូចគ្នានេះផងដែរ, អ្នកស្រាវជ្រាវបានប៉ាន់ប្រមាណថាជាកន្លែងលំនៅដ្ឋានសម្រាប់លទាំងអស់ 1,5 លាននាក់ដែលមានមូលដ្ឋានលើទីតាំងនៃការហៅទូរស័ព្ទរបស់ពួកគេ។ នៅពេលដែលការប៉ាន់ស្មានទាំងពីរនាក់ត្រូវបានរួមបញ្ចូលគ្នានេះទ្រព្យសម្បត្តិបានប៉ាន់ប្រមាណនិងជាកន្លែងនៃលំនៅដ្ឋាន-ប៉ាន់ប្រមាណថាលទ្ធផលគឺស្រដៀងគ្នាទៅនឹងការប៉ាន់ប្រមាណពីការស្ទង់មតិប្រជាសាស្រ្តនិងសុខភាពការស្ទង់មតិប្រពៃណីមាសស្តង់ដារ (រូបភាព 3.14) ។

រូបភាពទី 3.14: លទ្ធផលពី Blumenstock, Cadamuro និងនៅលើ (ឆ្នាំ 201​​5) ។ នៅកម្រិតបុគ្គល, អ្នកស្រាវជ្រាវបានអាចធ្វើការងារសមហេតុផលនៅព្យាករថាទ្រព្យសម្បត្តិរបស់នរណាម្នាក់ពីកំណត់ត្រាការហៅរបស់ខ្លួន។ ការប៉ាន់ប្រមាណពីថ្នាក់ស្រុកដែលត្រូវបានទ្រព្យសម្បត្តិដែលផ្អែកលើការព្យាករបុគ្គលទ្រព្យសម្បត្តិកម្រិតនិងកន្លែងនៃលំនៅដ្ឋានដែលលទ្ធផលនេះគឺស្រដៀងគ្នានឹងលទ្ធផលទទួលបានពីការអង្កេតប្រជាសាស្ដ្រនិងសុខភាព, ការស្ទង់មតិប្រពៃណីមាសស្តង់ដា។

រូបភាពទី 3.14: លទ្ធផលពី Blumenstock, Cadamuro, and On (2015) ។ នៅកម្រិតបុគ្គល, អ្នកស្រាវជ្រាវបានអាចធ្វើការងារសមហេតុផលនៅព្យាករថាទ្រព្យសម្បត្តិរបស់នរណាម្នាក់ពីកំណត់ត្រាការហៅរបស់ខ្លួន។ ការប៉ាន់ប្រមាណពីថ្នាក់ស្រុកដែលត្រូវបានទ្រព្យសម្បត្តិដែលផ្អែកលើការព្យាករបុគ្គលទ្រព្យសម្បត្តិកម្រិតនិងកន្លែងនៃលំនៅដ្ឋានដែលលទ្ធផលនេះគឺស្រដៀងគ្នានឹងលទ្ធផលទទួលបានពីការអង្កេតប្រជាសាស្ដ្រនិងសុខភាព, ការស្ទង់មតិប្រពៃណីមាសស្តង់ដា។

នៅក្នុងសេចក្តីសន្និដ្ឋាន, Blumenstock បានស្នើសុំវិធីសាស្រ្តរបស់ពង្រីកឱ្យធំរួមបញ្ចូលគ្នាជាមួយនឹងទិន្នន័យទិន្នន័យស្ទង់មតិរបស់ឌីជីថលដើម្បីផលិតដានប្រៀបធៀបជាមួយនឹងការប៉ាន់ប្រមាណការប៉ាន់ស្មានការស្ទង់មតិមាសស្តង់ដា។ ឧទាហរណ៍ពិសេសនេះផងដែរបញ្ជាក់មួយចំនួននៃយន្តហោះចាប់ផ្តើមហោះពាណិជ្ជកម្មរវាងស្នើសុំពង្រីកឱ្យធំនិងវិធីសាស្រ្តការស្ទង់មតិប្រពៃណី។ ជាដំបូង, ការប៉ាន់ស្មានសួរពង្រីកឱ្យធំត្រូវបានទាន់ពេលវេលាច្រើនទៀត, តម្លៃថោក, និង granular ច្រើនទៀត។ ប៉ុន្តែនៅលើដៃផ្សេងទៀត, នៅពេលនេះ, មិនមានទ្រឹស្តីមូលដ្ឋានយ៉ាងរឹងមាំសម្រាប់ប្រភេទនៃការស្នើសុំបានពង្រីកឱ្យធំនេះ។ នោះហើយគឺជាឧទាហរណ៍មួយនេះមិនបានបង្ហាញនៅពេលដែលវានឹងធ្វើការហើយនៅពេលដែលវានឹងមិន។ លើសពីនេះទៀតវិធីសាស្រ្តដែលបានស្នើសុំមិនដែលបានពង្រីកឱ្យធំទាន់មានវិធីល្អក្នុងការប៉ាន់ប្រមាណនៅជុំវិញភាពមិនច្បាស់លាស់ quantify របស់ខ្លួន។ ទោះជាយ៉ាងណា, ដែលបានស្នើសុំបានពង្រីកឱ្យធំមានការតភ្ជាប់ជ្រៅទៅតំបន់ធំបីនៅក្រោយការ stratification ស្ថិតិមានមូលដ្ឋានម៉ូដែល (Little 1993) , imputation (Rubin 2004) , និងការប៉ាន់ស្មានតំបន់តូចមួយ (Rao and Molina 2015) ហើយនេះដូច្នេះខ្ញុំរំពឹងថាការរីកចម្រើននឹង នឹងមានយ៉ាងឆាប់រហ័ស។

ស្នើសុំពង្រីកឱ្យធំជារូបមន្តមូលដ្ឋានខាងក្រោមដែលអាចត្រូវបានតាមស្ថានភាពជាក់លាក់របស់អ្នក។ វាមានគ្រឿងផ្សំជាពីរជំហានពីរគឺមានហើយ។ គ្រឿងផ្សំទាំងពីរគឺជាទី 1) សំណុំទិន្នន័យដានឌីជីថលដែលជាធំទូលាយប៉ុន្តែស្តើង (នោះគឺវាមានមនុស្សជាច្រើនប៉ុន្តែមិនពដែលអ្នកត្រូវការអំពីមនុស្ស) និង 2) ការស្ទង់មតិនោះគឺជាការតូចចង្អៀតប៉ុន្តែក្រាស់ (នោះគឺជា, វាមាន មនុស្សដែលមានតិចតួចប៉ុណ្ណោះប៉ុន្តែវាមានពដែលអ្នកត្រូវការអំពីមនុស្សទាំងនោះ) ។ បន្ទាប់មក, មានជំហានពីរ។ ដំបូងដើម្បីឱ្យប្រជាជននៅក្នុងប្រភពទិន្នន័យទាំងពីរនេះកសាងគំរូការរៀនម៉ាស៊ីនដែលប្រើទិន្នន័យដានឌីជីថលដើម្បីទស្សន៍ទាយចម្លើយស្ទង់មតិ។ បន្ទាប់ប្រើថាគំរូការរៀនម៉ាស៊ីនដើម្បីចម្លើយការស្ទង់មតិគិតគូររបស់មនុស្សគ្រប់គ្នានៅក្នុងទិន្នន័យដានឌីជីថល។ ដូច្នេះប្រសិនបើមានសំណួរមួយចំនួនដែលអ្នកចង់សួរទៅកាន់មនុស្សជាច្រើនមើលទៅសម្រាប់ទិន្នន័យដានឌីជីថលពីមនុស្សទាំងនោះដែលអាចត្រូវបានប្រើដើម្បីទស្សន៍ទាយចម្លើយរបស់ពួកគេ។

ប្រៀបធៀបប៉ុនប៉ងជាលើកដំបូងនិងលើកទីពីរ Blumenstock នៅបញ្ហានេះផងដែរពន្យល់នូវមេរៀនសំខាន់មួយអំពីការផ្លាស់ប្តូរពីវិធីសាស្រ្តសម័យលើកទីពីរដើម្បីលើកទីបីការស្ទង់មតិសម័យការស្រាវជ្រាវ: ការចាប់ផ្តើមមិនមែនជាចុងបញ្ចប់។ ដែលត្រូវបានជាច្រើនដងដែលជាវិធីសាស្រ្តជាលើកដំបូងនឹងមិនត្រូវបានល្អបំផុតប៉ុន្តែប្រសិនបើអ្នកស្រាវជ្រាវបន្តការងារ, អ្វីដែលអាចទទួលបានល្អប្រសើរជាងមុន។ ជាទូទៅ, នៅពេលដែលការវាយតំលៃវិធីសាស្រ្តថ្មីក្នុងការស្រាវជ្រាវសង្គមនៅក្នុងអាយុឌីជីថលវាជាការសំខាន់ដើម្បីធ្វើឱ្យការវាយតំលៃខុសគ្នាចំនួនពីរគឺ: 1) ផងដែរពីរបៀបធ្វើការងារនេះឥឡូវនេះហើយ 2​​) ថាតើតើអ្នកគិតថានេះអាចធ្វើការនៅក្នុងពេលអនាគតដែលជាទេសភាពទិន្នន័យ ការផ្លាស់ប្តូរនិងជាអ្នកស្រាវជ្រាវលះបង់ការយកចិត្តទុកដាក់បន្ថែមទៀតដើម្បីដោះស្រាយបញ្ហានេះ។ ទោះបីជា, ក្រុមអ្នកស្រាវជ្រាវដែលត្រូវបានទទួលការបណ្តុះបណ្តាលដើម្បីធ្វើឱ្យប្រភេទដំបូងនៃការវាយតំលៃ (របៀបដែលល្អគឺជាផ្នែកមួយជាក់លាក់នៃការស្រាវជ្រាវ), ទីពីរនេះជាញឹកញាប់គឺមានសារៈសំខាន់ជាច្រើនទៀត។