3.4.2 គំរូដែលមិនមែនជាប្រូបាប៊ីលីតេ: ទំងន់

ការបកប្រែនេះត្រូវបានបង្កើតឡើងដោយកុំព្យូទ័រ។ ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

3.4.2 គំរូដែលមិនមែនជាប្រូបាប៊ីលីតេ: ទំងន់

ជាមួយនឹងគំរូដែលមិនមែនជាប្រូបាប៊ីលីតេ, ទម្ងន់អាចធ្វើការបង្ខូចទ្រង់ទ្រាយដែលបង្កឡើងដោយដំណើរការគំរូសន្មត់។

នៅក្នុងវិធីដូចគ្នាដែលអ្នកស្រាវជ្រាវសំណាកមានទម្ងន់ចម្លើយពីប្រូបាប៊ីលីតេ, ពួកគេអាចសំណាកមានទម្ងន់ចម្លើយពី-ប្រូ non ។ ឧទាហរណ៍ជាការជំនួសទៅ CPS របស់មួយ, ស្រមៃថាអ្នកបានដាក់ផ្ទាំងបដាផ្សព្វផ្សាយពាណិជ្ជកម្មនៅលើគេហទំព័ររាប់ពាន់នាក់បានជ្រើសរើសអ្នកចូលរួមទៅក្នុងការស្ទង់មតិដើម្បីប៉ាន់ប្រមាណអត្រាគ្មានការងារធ្វើនេះ។ ជាធម្មតាអ្នកនឹងត្រូវបានសង្ស័យថាជាមធ្យមសាមញ្ញនៃគំរូរបស់អ្នកនឹងក្លាយជាការប៉ាន់ប្រមាណជាល្អនៃអត្រាគ្មានការងារធ្វើ។ ការសង្ស័យរបស់អ្នកគឺប្រហែលជាមកពីអ្នកគិតថាមនុស្សមួយចំនួនទំនងជាបន្ថែមទៀតដើម្បីបំពេញការស្ទង់មតិរបស់អ្នកជាងអ្នកដទៃ។ ឧទាហរណ៍, មនុស្សដែលមិនបានចំណាយពេលវេលាជាច្រើននៅលើបណ្ដាញនេះគឺមិនសូវដើម្បីបញ្ចប់ការស្ទង់មតិរបស់អ្នក។

ដូចដែលយើងបានឃើញនៅក្នុងផ្នែកចុងក្រោយនេះ, ទោះជាយ៉ាងណា, ប្រសិនបើយើងបានដឹងថាតើគំរូមួយត្រូវបានជ្រើសរើសជាយើងធ្វើជាមួយប្រូបាប៊ីលីតេគំរូ-បន្ទាប់មកយើងអាចធ្វើការបង្ខូចទ្រង់ទ្រាយដែលបង្កឡើងដោយដំណើរការគំរូ។ ជាអកុសលនៅពេលដែលធ្វើការជាមួយគំរូដែលមិនមែនជាប្រូបាប៊ីលីតេ, យើងមិនបានដឹងថាតើគំរូនេះត្រូវបានជ្រើស។ ប៉ុន្តែយើងអាចធ្វើការស្មានអំពីដំណើរការគំរូហើយបន្ទាប់មកអនុវត្តទំងន់នៅក្នុងវិធីដូចគ្នានេះដែរ។ ប្រសិនបើបានសន្មត់ទាំងនេះគឺត្រឹមត្រូវហើយនោះនឹងមិនធ្វើទម្ងន់ដែលបង្កឡើងដោយការបង្ខូចទ្រង់ទ្រាយដំណើរការគំរូ។

ជាឧទាហរណ៍សូមស្រមៃថាក្នុងការឆ្លើយតបទៅនឹងបដារបស់អ្នកការផ្សព្វផ្សាយពាណិជ្ជកម្ម, អ្នកត្រូវបានជ្រើសរើសអ្នកឆ្លើយតប 100.000 នាក់។ ទោះជាយ៉ាងណាអ្នកមិនឆ្លើយសំណួរជឿថានេះគឺជាគំរូ 100.000 ចៃដន្យសាមញ្ញនៃមនុស្សពេញវ័យអាមេរិក។ នៅក្នុងការពិតនៅពេលដែលអ្នកប្រៀបធៀបការឆ្លើយតបរបស់អ្នកទៅនឹងចំនួនប្រជាជនអាមេរិក, អ្នករកឃើញថាមនុស្សពីបណ្តាប្រទេសមួយចំនួន (ដូចជាញូវយ៉ក) គឺមានជាងតំណាងនិងថាមនុស្សពីបណ្តាប្រទេសមួយចំនួន (ដូចជារដ្ឋ Alaska) មានអាយុក្រោមតំណាង។ ដូច្នេះអត្រាគ្មានការងារធ្វើនៃគំរូរបស់អ្នកទំនងជាមានការប៉ាន់ប្រមាណអាក្រក់នៃអត្រាអត់ការងារធ្វើក្នុងចំនួនប្រជាជនគោលដៅ។

វិធីមួយដើម្បីមិនធ្វើវិញការបង្ខូចទ្រង់ទ្រាយដែលបានកើតឡើងនៅក្នុងដំណើរគំរូនេះគឺដើម្បីកំណត់ទម្ងន់ទៅមនុស្សម្នាក់គ្នា; ទម្ងន់ទាបជាងទៅអ្នកមកពីរដ្ឋដែលត្រូវបានលើតំណាងនៅក្នុងគំរូ (ឧទាហរណ៍ញូវយ៉ក) និងទម្ងន់ខ្ពស់ជាងនេះដើម្បីឱ្យប្រជាជនមកពីរដ្ឋដែលត្រូវមានតំណាងក្នុងគំរូ (ឧរដ្ឋ Alaska) បាន។ ជាពិសេសជាងទម្ងន់សម្រាប់អ្នកឆ្លើយតបនីមួយត្រូវបានទាក់ទងទៅនឹងអត្រាប្រេវ៉ាឡង់របស់ខ្លួននៅក្នុងគំរូរបស់អ្នកទាក់ទងទៅនឹងអត្រាប្រេវ៉ាឡង់របស់ខ្លួននៅក្នុងចំនួនប្រជាជនអាមេរិក។ នីតិវិធីទម្ងន់នេះត្រូវបានហៅថាក្រោយការ stratification និងគំនិតនៃការមានទម្ងន់គួររំលឹកបងប្អូនអំពីឧទាហរណ៍ក្នុងការឆ្លើយតបផ្នែកទី 3.4.1 ដែលជាកន្លែងដែលកោះ Rhode ពីត្រូវបានផ្តល់ទម្ងន់តិចជាងការឆ្លើយតបពីរដ្ឋ California ។ ក្រោយការ stratification តម្រូវឱ្យអ្នកដឹងថាអ្នកឆ្លើយតបបានគ្រប់គ្រាន់ដើម្បីដាក់ក្រុមនិងអ្នកចូលទៅក្នុងដើម្បីឱ្យដឹងថាសមាមាត្រនៃប្រជាជនគោលដៅក្នុងក្រុមនីមួយ។

ទោះបីជាទំងន់នៃគំរូប្រូបាប៊ីលីតេនិងគំរូដែលមិនមែនជាប្រូបាប៊ីលីតេមានគណិតវិទ្យាដូចគ្នា (សូមមើលឧបសម្ព័ន្ធបច្ចេកទេស), ពួកគេធ្វើបានយ៉ាងល្អនៅក្នុងស្ថានភាពខុសគ្នា។ ប្រសិនបើការស្រាវជ្រាវមានគំរូប្រូល្អឥតខ្ចោះ (ពោលគឺការមិនមានកំហុសដែលមិនគ្របដណ្តប់និងគ្មានការឆ្លើយតប) បន្ទាប់មកនឹងផលិតប៉ាន់ប្រមាណទម្ងន់ចំពោះលក្ខណៈទាំងអស់មិនលម្អៀងនៅក្នុងករណីទាំងអស់។ ធានាទ្រឹស្តីរឹងមាំនេះគឺជាមូលហេតុដែលការតស៊ូមតិនៃសំណាកប្រូរកឃើញថាពួកគេមានភាពទាក់ទាញដូច្នេះ។ នៅលើដៃផ្សេងគំរូដែលមិនមែនជាប្រូទម្ងន់ will ផលិតបានតែការប៉ាន់ស្មានមិនលម្អៀង for traits ទាំងអស់ប្រសិនបើទំនោរឆ្លើយតបនេះគឺមានដូចគ្នាសម្រាប់ everyone ក្នុងក្រុមនីមួយ។ នៅក្នុងពាក្យផ្សេងទៀតគិតត្រឡប់ទៅគំរូរបស់យើង, ការប្រើប្រាស់ក្រោយការ stratification នឹងផលិតបានប៉ាន់ប្រមាណមិនលម្អៀងប្រសិនបើអ្នករាល់គ្នានៅញូវយ៉កមានប្រហែលជាដូចគ្នានៃការចូលរួមនិងមនុស្សគ្រប់គ្នានៅអាឡាស្កាមានប្រហែលជាដូចគ្នានៃការចូលរួមនិងដូច្នេះនៅលើ។ ការសន្មត់នេះត្រូវបានគេហៅថាការសន្មត់ឆ្លើយតបទំនោរ-ដូចគ្នា-នៅក្នុងក្រុមហើយវាបានដើរតួនាទីយ៉ាងសំខាន់ក្នុងការដឹងថាប្រសិនបើក្រោយការ stratification នឹងធ្វើការយ៉ាងល្អជាមួយគំរូដែលមិនមែនជាប្រូបាប។

ជាអកុសលនៅក្នុងឧទាហរណ៍របស់យើងសន្មត់ឆ្លើយតបទំនោរដូចគ្នា-នៅក្នុង-ក្រុមទំនងជាមិនក្លាយទៅជាការពិត។ គឺថាវាហាក់ដូចជាមិនទំនងដែលថាមនុស្សគ្រប់រូបនៅអាឡាស្កាមានប្រហែលជាដូចគ្នានៃការត្រូវបាននៅក្នុងការអង្កេតរបស់អ្នក។ ប៉ុន្តែមានចំណុចសំខាន់បីដើម្បីរក្សាទុកក្នុងចិត្តអំពីការប្រកាស-ការ stratification ដែលទាំងអស់នេះធ្វើឱ្យវាហាក់បីដូចជាមានជោគជ័យជាច្រើនទៀត។

ដំបូង, ការសន្មត់ការឆ្លើយតបទំនោរដូចគ្នា-នៅក្នុង-ក្រុមក្លាយទៅជាច្រើនជឿទុកចិត្តបានជាចំនួននៃក្រុមកើនឡើង។ ហើយក្រុមអ្នកស្រាវជ្រាវមិនត្រូវបានកំណត់ទៅនឹងក្រុមដែលគ្រាន់តែផ្អែកលើទំហំភូមិសាស្រ្តតែមួយ។ ឧទាហរណ៍យើងអាចបង្កើតក្រុមដែលមានមូលដ្ឋាននៅលើរដ្ឋ, អាយុ, ភេទ, និងកម្រិតនៃការអប់រំ។ វាហាក់ដូចជាថាមានកាន់តែច្រើនជឿទុកចិត្តបានគឺមានឧបនិស្ស័យជាការឆ្លើយតបនៅក្នុងក្រុមនៃការដូចគ្នានេះ 18-29, និស្សិតបញ្ចប់ការសិក្សាជាស្ត្រីមហាវិទ្យាល័យដែលរស់នៅក្នុងរដ្ឋអាឡាស្កាជាងនៅក្នុងក្រុមនៃមនុស្សទាំងអស់ដែលរស់នៅក្នុងរដ្ឋអាឡាស្កានេះ។ ដូច្នេះជាចំនួននៃការកើនឡើងក្រុមបានប្រើសម្រាប់ការ stratification ក្រោយដែលជាការសន្មត់ដែលត្រូវការជាចាំបាច់ដើម្បីគាំទ្រដល់វាបានក្លាយទៅជាសមហេតុសមផលកាន់តែច្រើន។ ផ្ដល់ឱ្យជាការពិតនេះ, វាហាក់ដូចជាអ្នកស្រាវជ្រាវមួយចង់បង្កើតមួយចំនួនធំនៃក្រុមសម្រាប់ប្រកាសការ stratification ។ ប៉ុន្តែជាចំនួននៃក្រុមការកើនឡើង, អ្នកស្រាវជ្រាវបានរត់ចូលទៅក្នុងបញ្ហាមួយផ្សេងគ្នា: sparsity ទិន្នន័យ។ ប្រសិនបើមានតែមួយចំនួនតូចមួយនៃមនុស្សនៅក្នុងក្រុមនីមួយ, បន្ទាប់មកនេះនឹងត្រូវបានប៉ាន់ប្រមាណមិនប្រាកដប្រជាកាន់តែច្រើន, និងនៅក្នុងករណីធ្ងន់ធ្ងរដែលជាកន្លែងដែលមានគឺជាក្រុមមួយដែលមានការឆ្លើយតបទេ, បន្ទាប់មកក្រោយការ stratification ទាំងស្រុងបំបែកចុះ។ មានវិធីពីរយ៉ាងនៃភាពតានតឹងចេញនេះរវាងភ្ជាប់ជឿទុកចិត្តបាននៃការសន្មត់ការឆ្លើយតបក្នុងរយៈពេល-ទំនោរ-ក្រុម homogeneous- និង-តម្រូវការសម្រាប់ទំហំគំរូសមហេតុផលនៅក្នុងក្រុមនីមួយមាន។ វិធីសាស្រ្តមួយគឺដើម្បីផ្លាស់ទីទៅជាគំរូស្ថិតិទំនើបជាច្រើនទៀតសម្រាប់ការគណនាទម្ងន់និងមួយទៀតគឺដើម្បីប្រមូលធំ, គំរូចម្រុះជាច្រើនទៀតដែលអាចជួយធានាឱ្យបាននូវទំហំគំរូសមហេតុផលក្នុងក្រុមនីមួយ។ ហើយពេលខ្លះក្រុមអ្នកស្រាវជ្រាវបានធ្វើទាំងពីរ, ដូចដែលខ្ញុំនឹងរៀបរាប់នៅក្នុងលម្អិតបន្ថែមទៀតដូចខាងក្រោម។

ការពិចារណាជាលើកទីពីរនៅពេលដែលធ្វើការជាមួយនឹងការប្រកាស-ការ stratification ពីសំណាកដែលមិនប្រូគឺថាការសន្មត់ឆ្លើយតប-ដូចគ្នា-នៅក្នុង-ទំនោរក្រុមរួចទៅហើយបានធ្វើឱ្យជាញឹកញាប់ត្រូវបានវិភាគសំណាកប្រូពេល។ មូលហេតុដែលសន្មត់នេះគឺត្រូវបានត្រូវការសម្រាប់គំរូប្រូបាបនៅក្នុងការអនុវត្តគឺថាសំណាកប្រហែលជាមានមិនមែនជាការឆ្លើយតបនិងវិធីសាស្រ្តទូទៅបំផុតសម្រាប់ការលៃតម្រូវសម្រាប់ការមិនឆ្លើយតបគឺក្រោយការ stratification ដូចបានរៀបរាប់ខាងលើ។ ជាការពិតណាស់ក្រុមអ្នកស្រាវជ្រាវជាច្រើនបានដោយគ្រាន់តែការសន្មត់ជាក់លាក់មួយឱ្យបានមិនមែនមានន័យថាអ្នកគួរតែធ្វើវាបានផងដែរ។ ប៉ុន្តែវាមិនមានន័យថាបើប្រៀបធៀបសំណាកដែលមិនមែនជាប្រូបាប៊ីលីតេសំណាកប្រូនៅក្នុងការអនុវត្តយើងត្រូវតែរក្សាទុកក្នុងចិត្តថាទាំងពឹងផ្អែកលើការសន្មត់និងពជំនួយដើម្បីផលិតការប៉ាន់ប្រមាណ។ នៅក្នុងការកំណត់លក្ខណៈត្រឹមត្រូវបំផុត, មានគឺគ្រាន់តែជាគ្មានវិធីសាស្រ្តការសន្មត់ដោយឥតគិតថ្លៃដើម្បី inference ។

ជាចុងក្រោយ, ប្រសិនបើអ្នកខ្វល់អំពីការប៉ាន់ប្រមាណនៅក្នុងពិសេសមួយក្នុងឧទាហរណ៍អត្រាអ្នកអត់ការងារធ្វើរបស់យើងបន្ទាប់មកអ្នកត្រូវមានស្ថានភាពខ្សោយជាងការឆ្លើយតប-ទំនោរ-ក្នុងក្រុម-ដូចគ្នាការសន្មត់មួយ។ ជាពិសេស, អ្នកមិនត្រូវសន្មត់ថាអ្នកគ្រប់គ្នាមានឧបនិស្ស័យជាការឆ្លើយតបដូចគ្នាតែអ្នកត្រូវសន្មត់ថាមានការជាប់ទាក់ទងរវាងទំនោរឆ្លើយតបនិងអត្រាគ្មានការងារធ្វើនៅក្នុងក្រុមនីមួយ។ ជាការពិតណាស់, សូម្បីតែស្ថានភាពចុះខ្សោយនេះនឹងមិនរៀបចំការក្នុងស្ថានភាពខ្លះ។ ឧទាហរណ៍ស្រមៃប៉ាន់ប្រមាណសមាមាត្រនៃជនជាតិអាមេរិកដែលធ្វើការងារស្ម័គ្រចិត្តនេះ។ ប្រសិនបើមានមនុស្សដែលធ្វើការងារស្ម័គ្រចិត្តច្រើនតែយល់ព្រមឱ្យមាននៅក្នុងការស្ទង់មតិមួយ, បន្ទាប់មកអ្នកស្រាវជ្រាវលើប្រព័ន្ធនឹងចំនួនទឹកប្រាក់នៃការស្ម័គ្រចិត្តបានប៉ាន់ស្មានថាបានបើទោះបីជាពួកគេបានធ្វើការលៃតម្រូវក្រោយការ stratification, លទ្ធផលដែលត្រូវបានបង្ហាញអាណាចក្រដោយ Abraham, Helms, and Presser (2009) ។

ដូចខ្ញុំបាននិយាយមុននេះមិនមែនជាគំរូគេមើលជាមួយប្រូបាប៊ីលីតេសង្ស័យយ៉ាងខ្លាំងដោយអ្នកវិទ្យាសាស្ត្រសង្គមមួយផ្នែកដោយសារតែតួនាទីរបស់ពួកគេនៅក្នុងមួយចំនួននៃការបរាជ័យអាម៉ាស់បំផុតនៅក្នុងថ្ងៃដំបូងនៃការស្រាវជ្រាវស្ទង់មតិ។ ឧទាហរណ៍យ៉ាងច្បាស់ពីរបៀបដែលរហូតមកដល់ពេលនេះយើងបានមកជាមួយគំរូដែលមិនមែនជាប្រូបាប៊ីលីតេនៃការស្រាវជ្រាវនេះគឺលោក Wang វៃលោក David Rothschild, Sharad Goel និងលោកអនទ្រេ Gelman ថាលទ្ធផលនៃការរកឃើញវិញឱ្យបានត្រឹមត្រូវអាមេរិកឆ្នាំ 2012 ការបោះឆ្នោតដោយប្រើគំរូដែលមិនមែនជាអ្នកប្រើប្រាស់អាមេរិចប្រូបាប៊ីលីតេនៃការប្រើប្រាស់សេវាកម្ម Xbox -a គំរូចៃដន្យដែលមិនមែនពិតប្រាកដនៃជនជាតិអាមេរិក (Wang et al. 2015) ។ អ្នកស្រាវជ្រាវបានជ្រើសរើសអ្នកឆ្លើយតបពីប្រព័ន្ធហ្គេម Xbox និងជាអ្នកអាចរំពឹងថាគំរូការប្រើប្រាស់សេវាកម្ម Xbox សាររបស់បុរសនិងសារវ័យក្មេង: 18 - ក្មេងអាយុ 29 ឆ្នាំបានធ្វើឱ្យកើនឡើង 19% នៃអ្នកបោះឆ្នោតប៉ុន្តែ 65% នៃសំណាកគំរូ Xbox និងបុរសធ្វើឱ្យកើនឡើង 47% នៃអ្នកបោះឆ្នោតនិង 93% នៃសំណាកគំរូរបស់ Xbox (រូបភាពទី 3.4) ។ ដោយសារតែភាពលំអៀងប្រជាសាស្រ្តរឹងមាំទាំងនេះទិន្នន័យរបស់ Xbox ឆៅគឺជាសូចនាករក្រីក្រនៃការត្រឡប់មកវិញនៃការបោះឆ្នោត។ វាបានព្យាករថាការទទួលជ័យជម្នះយ៉ាងខ្លាំងសម្រាប់លោកមិត្តរ៉ូមនីនៅលើលោកអូបាម៉ា។ ជាថ្មីម្តងទៀត, នេះគឺជាឧទាហរណ៍មួយទៀតនៃគ្រោះថ្នាក់នៃការវត្ថុធាតុដើម, ដែលមិនមែនប្រូគំរូនិងជាមិនបានកែតម្រូវនៃការបង្កើតស្ថានភាពដូចអក្សរសាស្ត្រសង្ខេប។

រូបភាពទី 3.4: ប្រជាសាស្ត្រនៃអ្នកឆ្លើយសំណួរក្នុងលោក Wang et al ។ (ឆ្នាំ 2015) ។ ដោយសារតែការឆ្លើយតបត្រូវបានជ្រើសរើសពី Xbox, ពួកគេទំនងជាបន្ថែមទៀតដើម្បីជាការវ័យក្មេងនិងទំនងបន្ថែមទៀតដើម្បីជាបុរស, ទាក់ទងទៅនឹងអ្នកបោះឆ្នោតក្នុងការបោះឆ្នោតឆ្នាំ 2012 ។

រូបភាពទី 3.4: ប្រជាសាស្ត្រនៃអ្នកឆ្លើយសំណួរក្នុង Wang et al. (2015) ។ ដោយសារតែការឆ្លើយតបត្រូវបានជ្រើសរើសពី Xbox, ពួកគេទំនងជាបន្ថែមទៀតដើម្បីជាការវ័យក្មេងនិងទំនងបន្ថែមទៀតដើម្បីជាបុរស, ទាក់ទងទៅនឹងអ្នកបោះឆ្នោតក្នុងការបោះឆ្នោតឆ្នាំ 2012 ។

ទោះជាយ៉ាងណាលោក Wang និងសហការីបានដឹងពីបញ្ហាទាំងនេះនិងបានព្យាយាមដើម្បីឆ្លើយតបទៅនឹងទម្ងន់សម្រាប់ដំណើរការគំរូកែតម្រូវនេះ។ ជាពិសេស, ពួកគេបានប្រើជាទម្រង់ស្មុគ្រស្មាញច្រើនក្រោយការ stratification-ខ្ញុំបានប្រាប់អ្នកអំពី។ វាគឺមានតំលៃរៀនបន្ថែមទៀតអំពីវិធីសាស្រ្តបន្តិចព្រោះតែវាបង្កើតរបស់ខ្លួនញាណក្រោយការ stratification ប្រហែលនិងកំណែពិសេសលោក Wang និងសហការីបានគេប្រើជាផ្នែកមួយនៃវិធីសាស្រ្តគួរឱ្យរំភើបបំផុតក្នុងការដែលមិនមានប្រូបាបគំរូទម្ងន់។

នៅក្នុងឧទាហរណ៍សាមញ្ញរបស់យើងអំពីការប៉ាន់ប្រមាណអត្រាគ្មានការងារធ្វើនៅក្នុងផ្នែកទី 3.4.1 យើងបានបែងចែកទៅជាក្រុមចំនួនប្រជាជននៅលើរដ្ឋមានមូលដ្ឋាននៃលំនៅដ្ឋាន។ ផ្ទុយទៅវិញលោក Wang និងសហការីបានបែងចែកចូលទៅក្នុងទៅក្នុងចំនួនប្រជាជនក្រុមដែលបានកំណត់ដោយ 176.256: យែនឌ័រ (2 ប្រភេទ), ការប្រណាំង (4 ប្រភេទ), អាយុ (4 ប្រភេទ) ការអប់រំ (4 ប្រភេទ) រដ្ឋ (51 ប្រភេទ), លេខសម្គាល់គណបក្ស (3 ប្រភេទ), មនោគមវិជ្ជា (3 ប្រភេទ) និងឆ្នាំ 2008 ការបោះឆ្នោត (3 ប្រភេទ) ។ ជាមួយក្រុមជាច្រើនទៀត, អ្នកស្រាវជ្រាវបានសង្ឃឹមថាវានឹងមានទំនងកាន់តែខ្លាំងឡើងថានៅក្នុងក្រុមនីមួយ, ទំនោរជាការឆ្លើយតបគឺ uncorrelated មានការគាំទ្រសម្រាប់លោកអូបាម៉ា។ បន្ទាប់ជាជាងការសាងសង់កម្រិតទម្ងន់បុគ្គលដូចយើងបានធ្វើនៅក្នុងឧទាហរណ៍របស់យើងលោក Wang និងសហការីបានប្រើគំរូស្មុគស្មាញមួយដើម្បីប៉ាន់ប្រមាណសមាមាត្រនៃប្រជាជននៅក្នុងក្រុមនីមួយដែលនឹងបោះឆ្នោតឱ្យលោកអូបាម៉ា។ ជាចុងក្រោយ, ពួកគេបានរួមបញ្ចូលគ្នាការប៉ាន់ប្រមាណរបស់ក្រុមទាំងនេះនៃការគាំទ្រជាមួយនឹងទំហំដែលគេស្គាល់ថានៃក្រុមនីមួយដើម្បីផលិតនូវកម្រិតនៃការគាំទ្រប្រមាណជាទូទៅ។ នៅក្នុងពាក្យផ្សេងទៀតដែលពួកគេបាន chopped ប្រជាជនទៅកាន់ឡើងក្រុមផ្សេងគ្នាបានប៉ាន់ប្រមាណថាការគាំទ្រសម្រាប់លោកអូបាម៉ាក្នុងមួយក្រុមហើយបន្ទាប់មកបានយកការប៉ាន់ប្រមាណជាមធ្យមទម្ងន់នៃក្រុមនេះបានផលិតប៉ាន់ប្រមាណជារួម។

ដូច្នេះបញ្ហាប្រឈមធំក្នុងវិធីសាស្រ្តរបស់ពួកគេគឺដើម្បីប៉ាន់ប្រមាណការគាំទ្រសម្រាប់លោកអូបាម៉ានៅក្នុងគ្នានៃ 176.256 ក្រុមទាំងនេះ។ ទោះបីជាបន្ទះតែមួយគត់របស់ពួកគេរួមបញ្ចូលទាំងអ្នកចូលរួម 345.858 មួយចំនួនធំដោយស្តង់ដារនៃការបោះឆ្នោតការបោះឆ្នោតនេះមានក្រុមជាច្រើនដែលលោក Wang និងសហការីបានឆ្លើយតបស្ទើរតែគ្មាននាក់។ ដូច្នេះដើម្បីប៉ាន់ប្រមាណពីការគាំទ្រនៅក្នុងក្រុមនីមួយពួកគេបានប្រើបច្ចេកទេសមួយដែលគេហៅថាតំរែតំរង់ multilevel ក្រោយការ stratification ជាមួយដែលក្រុមអ្នកស្រាវជ្រាវបានហៅលោក P. ស្រឡាញ់សំខាន់ដើម្បីប៉ាន់ប្រមាណពីការគាំទ្រសម្រាប់លោកអូបាម៉ានៅក្នុងក្រុមជាក់លាក់មួយថ្លុកលោក P. ពពីមនុស្សជាច្រើនដែលបាន ទាក់ទងយ៉ាងជិតស្និទ្ធក្រុម។ ជាឧទាហរណ៍សូមពិចារណាអំពីបញ្ហាប្រឈមនៃការប៉ាន់ប្រមាណការគាំទ្រសម្រាប់លោកអូបាម៉ានៅក្នុងចំណោមស្រីនិយាយភាសាអេស្ប៉ាញដែលមានអាយុ 18-29 ឆ្នាំដែលមានបញ្ចប់ការសិក្សាពីមហាវិទ្យាល័យដែលត្រូវបានចុះបញ្ជីគណបក្សប្រជាធិបតេយ្យដែលបានបញ្ជាក់ថាខ្លួនបង្គួរនិងដែលបានបោះឆ្នោតឱ្យលោកអូបាម៉ានៅឆ្នាំ 2008 នេះ គឺជាក្រុមខ្លាំងណាស់ជាក់លាក់មួយហើយវាគឺអាចធ្វើបានដែលថាមាននរណាម្នាក់នៅក្នុងសំណាកដែលមានលក្ខណៈទាំងនេះ។ ដូច្នេះដើម្បីធ្វើឱ្យការប៉ាន់ប្រមាណអំពីក្រុមនេះ, លោក P. ជាមួយគ្នាថ្លុកការប៉ាន់ប្រមាណរបស់ពីមនុស្សនៅក្នុងក្រុមស្រដៀងគ្នាខ្លាំងណាស់។

ការប្រើយុទ្ធសាស្រ្តការវិភាគនេះលោក Wang និងសហការីអាចប្រើគំរូដែលមិនមែនជាប្រូ Xbox ដើម្បីប៉ាន់ប្រមាណការគាំទ្រយ៉ាងជិតស្និទ្ធដែលលោកអូបាម៉ាបានទទួលរួមក្នុងការបោះឆ្នោតឆ្នាំ 2012 (រូបភាពទី 3.5) ។ នៅក្នុងការពិតការប៉ាន់ប្រមាណរបស់ពួកគេមានជាច្រើនទៀតមានភាពត្រឹមត្រូវជាងសរុបនៃការស្ទង់មតិសាធារណៈមួយ។ ដូច្នេះក្នុងករណីនេះលោកជាពិសេសទំងន់ P. ហាក់ដូចធ្វើការងារបានល្អនៅក្នុងការកែលំអៀងដែលមិនមែនជាប្រូទិន្នន័យ; ភាពលំអៀងដែលអាចមើលឃើញនៅពេលដែលអ្នកសម្លឹងមើលទៅលើការប៉ាន់ស្មានពីទិន្នន័យរបស់ Xbox នេះមិនបានកែតម្រូវ។

រូបភាពទី 3.5: ការព្យាករពីលោក Wang et al ។ (ឆ្នាំ 2015) ។ គំរូ Xbox មិនបានកែតម្រូវបានផលិតប៉ាន់ស្មានមិនត្រឹមត្រូវ។ ប៉ុន្តែគំរូ Xbox ទម្ងន់ដែលត្រូវបានគេប៉ាន់ប្រមាណផលិតត្រឹមត្រូវជាងមធ្យមនៃការស្ទង់មតិដែលមានមូលដ្ឋានទូរស័ព្ទប្រូបាបដែរ។

រូបភាពទី 3.5: ការព្យាករពី Wang et al. (2015) ។ គំរូ Xbox មិនបានកែតម្រូវបានផលិតប៉ាន់ស្មានមិនត្រឹមត្រូវ។ ប៉ុន្តែគំរូ Xbox ទម្ងន់ដែលត្រូវបានគេប៉ាន់ប្រមាណផលិតត្រឹមត្រូវជាងមធ្យមនៃការស្ទង់មតិដែលមានមូលដ្ឋានទូរស័ព្ទប្រូបាបដែរ។

មានមេរៀនសំខាន់ពីរពីការសិក្សារបស់លោក Wang និងមិត្តរួមការងារនេះ។ ជាលើកដំបូង, ដែលមិនមែនប្រូគំរូអាចនាំឱ្យកែតម្រូវការប៉ាន់ប្រមាណអាក្រក់; នេះជាមេរៀនមួយដែលអ្នកស្រាវជ្រាវជាច្រើនបានឮមុន។ ទោះជាយ៉ាងណា, មេរៀនទីពីរគឺថាគំរូដែលមិនប្រូនៅពេលដែលទម្ងន់ឱ្យបានត្រឹមត្រូវ, អាចជាការពិតផលិតបានប៉ាន់ប្រមាណល្អណាស់។ នៅក្នុងការពិត, ការប៉ាន់ប្រមាណរបស់ពួកគេមានភាពត្រឹមត្រូវជាងការព្យាករពី pollster.com, សរុបនៃការស្ទង់មតិពីការបោះឆ្នោតតាមបែបប្រពៃណីជាច្រើនទៀតផងដែរ។

ទីបំផុត, មានដែនកំណត់សំខាន់អ្វីដែលយើងអាចរៀនពីការសិក្សាជាក់លាក់មួយនេះមាន។ គ្រាន់តែដោយសារក្រោយការ stratification បានធ្វើការយ៉ាងល្អនៅក្នុងករណីនេះអ្នកមានការធានាថាវានឹងធ្វើការបានយ៉ាងល្អនៅក្នុងករណីផ្សេងទៀតទេ។ នៅក្នុងការពិត, ការបោះឆ្នោតគឺមានប្រហែលជាមួយនៃការកំណត់ការងាយស្រួលបំផុតដោយសារតែគេបានសិក្សាពីអ្នកស្ទង់មតិការបោះឆ្នោតសម្រាប់ការជិត 100 ឆ្នាំ, មានមតិអ្នកប្រើធម្មតា (យើងអាចមើលឃើញអ្នកដែលបានឈ្នះឆ្នោត) និងការកំណត់អត្តសញ្ញាណនិងលក្ខណៈប្រជាសាស្រ្តគណបក្សមានទាក់ទងការព្យាករណ៍នៃការបោះឆ្នោត។ នៅចំណុចនេះ, យើងខ្វះបទពិសោធទ្រឹស្តីរឹងមាំនិងដើម្បីដឹងថានៅពេលជាក់ស្ដែងការលៃតម្រូវទៅនឹងគំរូទម្ងន់ដែលមិនមានការប៉ាន់ប្រមាណប្រហែលជានឹងមានភាពត្រឹមត្រូវគ្រប់គ្រាន់ផលិត។ រឿងមួយដែលច្បាស់ណាស់, ទោះជាយ៉ាងណាប្រសិនបើអ្នកត្រូវបានគេបង្ខំឱ្យធ្វើការជាមួយគំរូដែលមិនមែនជាប្រូបាប៊ីលីតេ, បន្ទាប់មកមានហេតុផលយ៉ាងខ្លាំងក្នុងការជឿថាការប៉ាន់ប្រមាណបានធ្វើការកែតម្រូវនឹងមានភាពប្រសើរជាងការព្យាករដែលមិនលៃតម្រូវបាន។