4.4.1 សុពលភាព

សុពលភាពសំដៅទៅលើរបៀបជាច្រើនលទ្ធផលនៃការពិសោធន៍មួយដែលបានជួយគាំទ្រដល់ការសន្និដ្ឋានទូទៅបន្ថែមទៀត។

គ្មានការពិសោធន៍គឺល្អឥតខ្ចោះនិងបានបង្កើតជាអ្នកស្រាវជ្រាវទូលំទូលាយដើម្បីរៀបរាប់អំពីវាក្យសព្ទបញ្ហាដែលអាចធ្វើបាន។ សុពលភាពសំដៅទៅទំហំដែលលទ្ធផលនៃការពិសោធន៍ជាក់លាក់មួយដែលបានជួយគាំទ្រដល់ការសន្និដ្ឋានទូទៅបន្ថែមទៀតមួយចំនួន។ សង្គមវិទ្យាសាស្រ្តបានរកឃើញវាមានប្រយោជន៍ដើម្បីបានចែកចេញជាបួនប្រភេទសុពលភាពចម្បង: សុពលភាពសន្និដ្ឋានស្ថិតិសុពលភាពផ្ទៃក្នុងសាងសង់សុពលភាពនិងមានសុពលភាពខាងក្រៅ (Shadish, Cook, and Campbell 2001, Ch 2) ។ គ្រូគំនិតទាំងនេះនឹងផ្ដល់ឱ្យអ្នកបញ្ជីផ្លូវចិត្តសម្រាប់ដោះនិងធ្វើឱ្យប្រសើរឡើងការរចនានិងការវិភាគនៃការពិសោធន៍មួយ, ហើយវានឹងជួយអ្នកក្នុងការទាក់ទងជាមួយក្រុមអ្នកស្រាវជ្រាវផ្សេងទៀត។

សុពលភាពសន្និដ្ឋានស្ថិតិផ្តោនៅជុំវិញថាតើការវិភាគស្ថិតិនៃការពិសោធន៍នេះត្រូវបានធ្វើត្រឹមត្រូវ។ នៅក្នុងបរិបទនៃការ Schultz et al. (2007) សំណួរបែបនេះប្រហែលជាមានមូលដ្ឋានលើថាតើគេបានគណនាតម្លៃទំរបស់ពួកគេឱ្យបានត្រឹមត្រូវ។ ការវិភាគស្ថិតិគឺហួសពីវិសាលភាពនៃសៀវភៅនេះទេប៉ុន្តែខ្ញុំអាចនិយាយបានថាគោលការណ៍ស្ថិតិដែលត្រូវការដើម្បីរៀបចំនិងវិភាគពិសោធន៍មិនបានផ្លាស់ប្តូរនៅក្នុងអាយុឌីជីថល។ ទោះជាយ៉ាងណា, បរិស្ថានទិន្នន័យផ្សេងគ្នានៅក្នុងការពិសោធន៍ឌីជីថលមិនបង្កើតឱកាសស្ថិតិថ្មី (ឧទាហរណ៍ដោយប្រើវិធីសាស្រ្តការរៀនម៉ាស៊ីនដើម្បីប៉ាន់ប្រមាណពីផលប៉ះពាល់ការព្យាបាលដូចគ្នា (Imai and Ratkovic 2013) ) និងបញ្ហាប្រឈមកុំព្យូទ័រថ្មី (ឧទាហរណ៍ការរារាំងក្នុងការពិសោធន៍ទ្រង់ទ្រាយធំ (Higgins, Sävje, and Sekhon 2016)

សុពលភាពផ្ទៃក្នុងផ្តោជុំវិញថាតើនីតិវិធីពិសោធន៍ត្រូវបានអនុវត្តឱ្យបានត្រឹមត្រូវ។ ដោយត្រឡប់ទៅបទពិសោធន៍របស់ Schultz et al. (2007) , ជាសំណួរអំពីសុពលភាពខាងក្នុងអាចដាក់នៅជុំវិញចៃដន្យ, ការចែកចាយនៃការព្យាបាលនិងការវាស់វែងនៃលទ្ធផល។ ឧទាហរណ៍អ្នកប្រហែលជាមានការព្រួយបារម្ភថាជំនួយការស្រាវជ្រាវនេះមិនបានអានម៉ែត្រអគ្គិសនីឿទុកចិត្ដ។ នៅក្នុងការពិតលោក Schultz និងមិត្តរួមការងារត្រូវបានគេព្រួយបារម្ភអំពីបញ្ហានេះហើយពួកគេមានគំរូនៃការម៉ែត្រអានពីរដងក្នុងមួយ! សំណាងល្អ, លទ្ធផលដូចគ្នាសំខាន់។ នៅក្នុងទូទៅ, Schultz បាននិងពិសោធន៍មិត្តរួមការងារ "ហាក់ដូចជាមានសុពលភាពផ្ទៃក្នុងខ្ពស់, ប៉ុន្តែនេះគឺមិនមែនតែងតែករណីនេះ; វាលស្មុគស្មាញនិងការពិសោធន៍លើបណ្តាញជាញឹកញាប់មានបញ្ហាពិតជាបានផ្តល់ជូននូវការព្យាបាលដែលត្រឹមត្រូវដល់ប្រជាជនដែលត្រឹមត្រូវនិងការវាយតំលៃលទ្ធផលសម្រាប់អ្នករាល់គ្នា។ ជាសំណាងល្អអាយុឌីជីថលអាចជួយកាត់បន្ថយក្តីបារម្ភអំពីសុពលភាពផ្ទៃក្នុងព្រោះវាធ្វើឱ្យវាងាយស្រួលក្នុងការធានាថាការព្យាបាលនេះត្រូវបានផ្តល់ជូនជាបានរចនាឡើងដល់អ្នកដែលត្រូវបានគេសន្មត់ថាដើម្បីទទួលបានវាដើម្បីវាស់លទ្ធផលនិងសម្រាប់អ្នកចូលរួមទាំងអស់។

សង់មជ្ឈមណ្ឌលសុពលភាពនៅជុំវិញការប្រកួតរវាងទិន្នន័យនិងការបង្កើតទ្រឹស្តីនេះ។ ដូចដែលបានពិភាក្សានៅក្នុងជំពូកទី 2 គឺជាគំនិតអរូបីសំណង់អ្នកវិទ្យាសាស្ត្រសង្គមហេតុផលអំពី។ ជាអកុសល, គំនិតអរូបីទាំងនេះមិនតែងតែមាននិយមន័យច្បាស់លាស់និងការវាស់។ ត្រឡប់មក Schultz et al. (2007) , ការអះអាងថា injunctive បទដ្ឋានសង្គមអាចកាត់បន្ថយការប្រើប្រាស់អគ្គិសនីនេះតម្រូវឱ្យមានការស្រាវជ្រាវរចនាព្យាបាលដែលនឹងរៀបចំ "បទដ្ឋានសង្គមសេចក្តីបង្គាប់" (ឧសញ្ញាអារម្មណ៍) និងដើម្បីវាស់ស្ទង់ "ការប្រើប្រាស់អគ្គិសនី" មួយ។ នៅក្នុងការពិសោធន៍អាណាឡូក, ក្រុមអ្នកស្រាវជ្រាវជាច្រើនបានរចនាឡើងការព្យាបាលរបស់ខ្លួននិងវាស់លទ្ធផលរបស់ខ្លួនផ្ទាល់។ វិធីសាស្រ្តនេះធានាថាជាច្រើនដូចជាអាចធ្វើទៅបានពិសោធន៍នេះផ្គូផ្គងសំណង់អរូបីដែលត្រូវបានសិក្សា។ នៅក្នុងការពិសោធន៍ឌីជីថលដែលជាកន្លែងដែលជាដៃគូជាមួយក្រុមហ៊ុនឬក្រុមអ្នកស្រាវជ្រាវដើម្បីផ្តល់នូវការព្យាបាលរដ្ឋាភិបាលនិងការប្រើនៅលើប្រព័ន្ធជានិច្ចដើម្បីវាស់លទ្ធផលទិន្នន័យដែលការប្រកួតរវាងពិសោធន៍និងសំណង់ទ្រឹស្តីនេះអាចជាតឹងតិច។ ដូច្នេះខ្ញុំរំពឹងថាសុពលភាពសាងសង់នឹងមាននិន្នាការក្លាយទៅជាក្តីបារម្ភធំជាងនៅក្នុងការពិសោធន៍ឌីជីថលអាណាឡូកពិសោធន៍ជាង។

ជាចុងក្រោយ, សុពលភាពខាងក្រៅផ្តោជុំវិញថាតើលទ្ធផលនៃការពិសោធន៍នេះនឹងទៅនឹងស្ថានភាពផ្សេងទៀតទូទៅ។ ត្រឡប់មក Schultz et al. (2007) , ម្នាក់អាចសួរថានឹងមានមនុស្សគំនិតនេះព-ការផ្តល់អំពីការប្រើថាមពលដូចគ្នានេះរបស់ពួកគេនៅក្នុងការទំនាក់ទំនងទៅកាន់មិត្តភក្តិរបស់ពួកគេនិងសញ្ញានៃបទដ្ឋានសេចក្តីបង្គាប់ (ឧទាហរណ៍សញ្ញាអារម្មណ៍មួយ) ការប្រើប្រាស់ថាមពល -reduce ប្រសិនបើវាត្រូវបានធ្វើរួចនៅក្នុងវិធីផ្សេងគ្នាមួយនៅក្នុង ការកំណត់ផ្សេង? សម្រាប់ភាគច្រើនបានរៀបចំយ៉ាងល្អនិងការពិសោធន៍ដំណើរការល្អក្តីបារម្ភអំពីសុពលភាពខាងក្រៅគឺជាការលំបាកបំផុតក្នុងការដោះស្រាយ។ ក្នុងពេលកន្លងមកបានពិភាក្សាអំពីសុពលភាពខាងក្រៅជាញឹកញាប់គ្រាន់តែ bunch នៃមនុស្សដែលអង្គុយនៅក្នុងបន្ទប់មួយដែលកំពុងព្យាយាមស្រមៃពីអ្វីដែលនឹងកើតឡើងប្រសិនបើការនីតិវិធីនេះត្រូវបានធ្វើរួចនៅក្នុងវិធីផ្សេងគ្នា, ឬនៅក្នុងកន្លែងផ្សេងគ្នា, ឬជាមួយនឹងមនុស្សផ្សេងគ្នា។ ជាសំណាងល្អអាយុឌីជីថលអាចឱ្យអ្នកស្រាវជ្រាវការឱ្យលើសពីការប៉ាន់ប្រមាណទិន្នន័យដោយឥតគិតថ្លៃទាំងនេះនិងការវាយតម្លៃសុពលភាពខាងក្រៅអាណាចក្រ។

ដោយសារតែលទ្ធផលដែលបានមកពី Schultz et al. (2007) ត្រូវបានគេគួរឱ្យរំភើបដូច្នេះក្រុមហ៊ុនដែលមានឈ្មោះថា Opower សហការជាមួយឧបករណ៍ប្រើប្រាស់មួយនៅសហរដ្ឋអាមេរិកក្នុងការដាក់ពង្រាយការព្យាបាលបន្ថែមទៀតយ៉ាងទូលំទូលាយ។ ដោយផ្អែកលើការរចនារបស់ Schultz et al. (2007) , Opower បង្កើតបានប្ដូរតាមបំណងរបាយការណ៍ដើមដែលមានថាមពលម៉ូឌុលសំខាន់ពីរគឺមួយបង្ហាញការប្រើអគ្គិសនីរបស់គ្រួសារមួយប្រទេសជិតខាងរបស់ខ្លួនដែលទាក់ទងទៅនិងការជាមួយសញ្ញាអារម្មណ៍មួយដែលផ្តល់នូវគន្លឹះសម្រាប់កាត់បន្ថយការប្រើប្រាស់ថាមពល (រូបភាពទី 4.6) ។ បន្ទាប់មកនៅក្នុងភាពជាដៃគូជាមួយក្រុមអ្នកស្រាវជ្រាវ Opower បាននាំគ្នារត់ចែកពិសោធន៍បានគ្រប់គ្រងដើម្បីវាយតម្លៃផលប៉ះពាល់នៃរបាយការណ៍ថាមពលទំព័រដើម។ បើទោះបីការព្យាបាលនៅក្នុងការពិសោធន៍ទាំងនេះត្រូវបានបញ្ជូនជាធម្មតាតាមរយៈការរាងកាយជាធម្មតាខ្យងម៉ូដែលចាស់អ៊ីមែលដែលលទ្ធផលត្រូវបានគេវាស់ដោយប្រើឧបករណ៍ឌីជីថលនៅក្នុងពិភពពិត (ឧទាហរណ៍ម៉ែត្រអំណាច) ។ ជាជាងការប្រមូលពជាមួយជំនួយការស្រាវជ្រាវដែលបានមកទស្សនាផ្ទះនេះដោយដៃគ្នានេះបានធ្វើពិសោធន៍ Opower ទាំងអស់នៅក្នុងភាពជាដៃគូជាមួយក្រុមហ៊ុនថាមពលធ្វើឱ្យក្រុមអ្នកស្រាវជ្រាវដើម្បីចូលដំណើរការអានអំណាច។ ដូច្នេះការពិសោធន៍ផ្នែកខ្លះវាលឌីជីថលរត់បានទាំងនេះត្រូវបានគេទ្រង់ទ្រាយធំមួយនៅក្នុងការចំណាយអថេរទាប។

រូបភាពទី 4.6: នេះជារបាយការណ៍ផ្ទះនៅក្នុង Allcott ថាមពល (ឆ្នាំ 201​​1) មានការប្រៀបធៀបជាមួយសង្គមម៉ូឌុលនិងម៉ូឌុលសកម្មភាពជំហាន។

រូបភាពទី 4.6: ការថាមពលផ្ទះនៅក្នុងរបាយការណ៍ Allcott (2011) មានការប្រៀបធៀបជាមួយសង្គមម៉ូឌុលនិងម៉ូឌុលសកម្មភាពជំហាន។

នៅក្នុងសំណុំដំបូងនៃការពិសោធន៍ដែលពាក់ព័ន្ធនឹង 600.000 គ្រួសារបានបម្រើដោយក្រុមហ៊ុនផ្គត់ផ្គង់ 10 នៅជុំវិញសហរដ្ឋអាមេរិក, Allcott (2011) ដែលបានរកឃើញរបាយការណ៍ថាមពលទំព័រដើមបន្ទាបការប្រើប្រាស់អគ្គិសនី 1,7% ។ នៅក្នុងពាក្យផ្សេងទៀត, លទ្ធផលដែលបានមកពីច្រើនមានទំហំធំ, ការសិក្សាជាច្រើនទៀតត្រូវបានគេចម្រុះទីតាំងភូមិសាស្រ្តស្រដៀងគ្នាទៅនឹងលទ្ធផលគុណភាពពី Schultz et al. (2007) ។ ប៉ុន្តែទំហំដែលមានប្រសិទ្ធិភាពកាន់តែតូចជាងមុន: នៅក្នុង Schultz et al. (2007) គ្រួសារនៅក្នុងស្ថានភាពពន្យល់និងចាក់បទដ្ឋាន (មួយជាមួយសញ្ញាអារម្មណ៍នេះ) បានកាត់បន្ថយការប្រើប្រាស់អគ្គិសនីរបស់ពួកគេ 5% ។ មូលហេតុច្បាស់លាស់សម្រាប់ភាពខុសគ្នានេះគឺមិនស្គាល់នោះទេប៉ុន្តែ Allcott (2011) បានសន្និដ្ឋានថាការទទួលបានសញ្ញាអារម្មណ៍សរសេរដោយដៃដែលជាផ្នែកមួយនៃការសិក្សាឧបត្ថម្ភដោយសាកលវិទ្យាល័យមួយអាចមានឥទ្ធិពលធំនៅលើឥរិយាបថជាងការទទួលសញ្ញាអារម្មណ៍ដែលបានបោះពុម្ពមួយដែលជាផ្នែកនៃរបាយការណ៍ម៉ាស់បានផលិតពី ក្រុមហ៊ុនថាមពល។

លើសពីនេះទៀត, នៅក្នុងការស្រាវជ្រាវជាបន្តបន្ទាប់, Allcott (2015) បានរាយការណ៍នៅលើការពិសោធន៍ 101 បន្ថែមទៀតពាក់ព័ន្ធនឹងការបន្ថែម 8 លានគ្រួសារ។ ក្នុងការពិសោធន៍ទៀតនេះ 101 របាយការណ៍ថាមពលបន្តទៀតដើម្បីបណ្តាលឱ្យដើមដើម្បីកាត់បន្ថយការប្រើប្រាស់ប្រជាជនអគ្គិសនីរបស់ពួកគេប៉ុន្តែផលប៉ះពាល់នេះត្រូវបានគេសូម្បីតែតូច។ មូលហេតុច្បាស់លាស់សម្រាប់ការធ្លាក់ចុះនេះគឺមិនត្រូវបានគេស្គាល់ទេប៉ុន្តែ Allcott (2015) បានសន្និដ្ឋានថាប្រសិទ្ធភាពនៃរបាយការណ៍នេះបានបង្ហាញខ្លួនឡើងដើម្បីត្រូវបានធ្លាក់ចុះនៅលើពេលវេលាដោយសារតែវាត្រូវបានគេពិតជាកំពុងត្រូវបានអនុវត្តទៅប្រភេទផ្សេងគ្នានៃអ្នកចូលរួម។ ពិសេសជាងនេះទៅទៀត, ឧបករណ៍ការពារបរិស្ថានកាន់តែច្រើននៅក្នុងវិស័យជាច្រើនទៀតទំនងជាអនុម័តនាក់ជាកម្មវិធីមុននេះនិងអតិថិជនរបស់ពួកគេត្រូវបានគេកាន់តែឆ្លើយតបទៅនឹងការព្យាបាល។ ក្នុងនាមជាឧបករណ៍ជាមួយអតិថិជនបរិស្ថានតិចអនុម័តកម្មវិធីនេះប្រសិទ្ធភាពរបស់វាបានលេចមកឱ្យធ្លាក់ចុះ។ ដូច្នេះគ្រាន់តែជាការចៃដន្យនៅក្នុងការពិសោធន៍ធានាថាក្រុមនៃការព្យាបាលនិងការត្រួតពិនិត្យគឺស្រដៀងចៃដន្យនៅក្នុងតំបន់ស្រាវជ្រាវធានាថាការប៉ាន់ប្រមាណនេះអាចត្រូវបានសរុបពីក្រុមមួយនៃអ្នកចូលរួមបានចំពោះប្រជាជនទូទៅបន្ថែមទៀត (គិតត្រឡប់មកវិញដើម្បីជំពូកទី 3 អំពីគំរូ) ។ ប្រសិនបើតំបន់បណ្ដាញស្រាវជ្រាវមិនត្រូវបានតំណាងដោយចៃដន្យ, បន្ទាប់មក generalization-សូម្បីតែពីការដែលបានរចនាឡើងយ៉ាងល្អឥតខ្ចោះនិងបានធ្វើការពិសោធន៍អាចជួបបញ្ហា។

រួមជាមួយគ្នាទាំងនេះ 111 ពិសោធន៍-10 នៅ Allcott (2011) និង 101 នៅ Allcott (2015) -involved ប្រហែល 8,5 លានគ្រួសារមកពីទូទាំងសហរដ្ឋអាមេរិក។ ពួកគាត់បានបង្ហាញថារបាយការណ៍ថាមពលកាត់បន្ថយការប្រើប្រាស់ដើមអគ្គិសនីជាមធ្យម, លទ្ធផលដែលគាំទ្រការរកឃើញដើមនៃ Schultz បាននិងសហការីពី 300 ផ្ទះនៅរដ្ឋ California ។ លើសពីចម្លងលទ្ធផលដើមគ្រាន់តែទាំងនោះការពិសោធន៍តាមដានបង្ហាញថាទំហំនៃផលប៉ះពាល់ប្រែប្រួលដោយទីតាំង។ សំណុំនៃការពិសោធន៍នេះផងដែរបានបង្ហាញពីពិន្ទុទូបន្ថែមអំពីបទពិសោធន៍ឌីជីថលវាលផ្នែកខ្លះ។ ដំបូង, អ្នកស្រាវជ្រាវនឹងអាច empirically ការព្រួយបារម្ភអំពីសុពលភាពខាងក្រៅអាសយដ្ឋានដែលការចំណាយនៃការរត់ពេលពិសោធន៍មានកម្រិតទាបហើយនេះអាចកើតឡើងប្រសិនបើលទ្ធផលនេះត្រូវបានវាស់រួចហើយដោយប្រព័ន្ធជានិច្ចទិន្នន័យ។ ដូច្នេះវាបានបង្ហាញថាការស្រាវជ្រាវគួរមាននៅលើមើលទៅចេញសម្រាប់ឥរិយាបថគួរឱ្យចាប់អារម្មណ៍និងមានសារៈសំខាន់ផ្សេងទៀតដែលកំពុងត្រូវបានកត់ត្រាទុករួចទៅហើយ, ហើយបន្ទាប់មកការរចនាការពិសោធន៍នៅលើកំពូលនៃហេដ្ឋារចនាសម្ព័ន្ធដែលមានស្រាប់នេះវាស់។ ទីពីរសំណុំនៃការពិសោធន៍នេះបានរំឭកយើងថាការពិសោធន៍វាលឌីជីថលគឺមិនមែនគ្រាន់តែនៅលើបណ្ដាញ; កាន់តែខ្លាំងឡើងខ្ញុំរំពឹងថាពួកគេនឹងមាននៅគ្រប់ទីកន្លែងជាមួយនឹងលទ្ធផលជាច្រើនបានវាស់ដោយឧបករណ៍ចាប់សញ្ញានៅក្នុងបរិស្ថានសង់។

នេះជាបួនប្រភេទនៃសុពលភាពសន្និដ្ឋានសុពលភាព-ស្ថិតិសុពលភាពផ្ទៃក្នុងសាងសង់សុពលភាពសុពលភាព-ផ្ដល់នូវខាងក្រៅបញ្ជីផ្លូវចិត្តដើម្បីជួយឱ្យក្រុមអ្នកស្រាវជ្រាវវាយតម្លៃថាតើលទ្ធផលដែលបានមកពីការពិសោធន៍ជាក់លាក់មួយគាំទ្រដល់ការសន្និដ្ឋានទូទៅបន្ថែមទៀត។ បើធៀបទៅនឹងការពិសោធន៍អាយុអាណាឡូកក្នុងការពិសោធន៍អាយុឌីជីថលវាគួរតែមានភាពងាយស្រួលក្នុងការដោះស្រាយសុពលភាពខាងក្រៅអាណាចក្រហើយវាគួរតែមានភាពងាយស្រួលក្នុងការធានាឱ្យបាននូវសុពលភាពផ្ទៃក្នុង។ នៅលើដៃផ្សេងទៀត, បញ្ហានៃការសុពលភាពបង្កើតប្រហែលជានឹងមានការប្រកួតប្រជែងកាន់តែច្រើននៅក្នុងការពិសោធន៍ដែលមានអាយុឌីជីថល (បើទោះបីថាមិនមែនជាករណីជាមួយការពិសោធន៍ Opower នេះ) ។