2.3.8 ក្បួន 2.3.8 បំភ័ន្ត

ឥរិយាបថក្នុងប្រព័ន្ធទិន្នន័យធំមិនមែនជាធម្មជាតិទេ។ វាត្រូវបានជំរុញដោយគោលដៅវិស្វកម្មនៃប្រព័ន្ធ។

ទោះបីជាប្រភពទិន្នន័យធំ ៗ ជាច្រើនមិនដំណើរការក៏ដោយព្រោះមនុស្សមិនដឹងទិន្នន័យរបស់ពួកគេកំពុងត្រូវបានកត់ត្រា (ផ្នែក 2.3.3) ក្រុមអ្នកស្រាវជ្រាវមិនគួរចាត់ទុកអាកប្បកិរិយានៅក្នុងប្រព័ន្ធអនឡាញទាំងនេះថា«កើតឡើងតាមធម្មជាតិ»ទេ។ តាមពិតប្រព័ន្ធឌីជីថលដែលកត់ត្រាអាកប្បកិរិយាគឺ ការរចនាយ៉ាងខ្ពស់ដើម្បីបង្កឱ្យមានឥរិយាបថជាក់លាក់ដូចជាការចុចលើការផ្សាយពាណិជ្ជកម្មឬប្រកាសមាតិកា។ វិធីដែលគោលដៅរបស់អ្នករចនាប្រព័ន្ធអាចណែនាំលំនាំទៅក្នុងទិន្នន័យត្រូវបានគេហៅថាការ បង្កប់ដោយក្បួនដោះស្រាយ ។ ការយល់ច្រឡំក្បួនដោះស្រាយមិនត្រូវបានគេស្គាល់ចំពោះអ្នកវិទ្យាសាស្ត្រសង្គមទេប៉ុន្តែវាគឺជាកង្វល់ដ៏សំខាន់មួយក្នុងចំណោមអ្នកវិទ្យាសាស្រ្តទិន្នន័យដែលប្រុងប្រយ័ត្ន។ ហើយមិនដូចបញ្ហាមួយចំនួនផ្សេងទៀតដែលមានដានឌីជីថលការយល់ច្រឡំតាមក្បួនដោះស្រាយគឺភាគច្រើនមិនអាចមើលឃើញ។

ឧទាហរណ៍សាមញ្ញមួយដែលទាក់ទងនឹងការចំលង algorithmic គឺជាការពិតដែលថានៅលើហ្វេសប៊ុកមានចំនួនអ្នកប្រើប្រាស់អនឡាញដែលមានចំនួនប្រហែល 20 នាក់ដូចដែលត្រូវបានរកឃើញដោយ Johan Ugander និងសហសេវិក (2011) ។ អ្នកវិទ្យាសាស្រ្តវិភាគទិន្នន័យនេះដោយគ្មានការយល់ដឹងពីរបៀបដែល Facebook ធ្វើការអាចនឹងបង្កើតរឿងជាច្រើនអំពីរបៀបដែល 20 គឺជាប្រភេទមួយចំនួននៃសង្គមលេខវេទមន្ត។ ជាសំណាងល្អលោក Ugander និងសហការីរបស់គាត់មានការយល់ដឹងច្រើនអំពីដំណើរការដែលបង្កើតទិន្នន័យហើយពួកគេដឹងថាហ្វេសប៊ុកបានលើកទឹកចិត្តអ្នកដែលមានទំនាក់ទំនងតិចតួចនៅលើហ្វេសប៊ុកដើម្បីបង្កើតមិត្តច្រើនរហូតដល់ពួកគេមានមិត្តភក្តិ 20 នាក់។ ទោះបីជាលោក Ugander និងសហសេវិកមិនបាននិយាយបែបនេះនៅក្នុងក្រដាសរបស់ខ្លួនគោលនយោបាយនេះត្រូវបានបង្កើតឡើងដោយ Facebook ដើម្បីលើកទឹកចិត្តដល់អ្នកប្រើថ្មីឱ្យកាន់តែសកម្ម។ ដោយមិនដឹងពីអត្ថិភាពនៃគោលនយោបាយនេះវាងាយស្រួលក្នុងការគូសចេញពីការសន្និដ្ឋានខុសពីទិន្នន័យ។ និយាយម្យ៉ាងទៀតចំនួនមនុស្សគួរឱ្យភ្ញាក់ផ្អើលដែលមានមិត្តភក្តិប្រហែល 20 នាក់ប្រាប់យើងអំពីហ្វេសប៊ុកជាងអំពីអាកប្បកិរិយារបស់មនុស្ស។

នៅក្នុងឧទាហរណ៏មុននេះការធ្វើសកម្មភាពដែលធ្វើឱ្យមានការភ័ន្តច្រឡំបានបង្កើតលទ្ធផលដ៏គួរឱ្យភ្ញាក់ផ្អើលមួយដែលអ្នកស្រាវជ្រាវដ៏ប្រុងប្រយ័ត្នអាចរកឃើញនិងធ្វើការស៊ើបអង្កេតបន្ថែមទៀត។ ទោះជាយ៉ាងណាក៏ដោយក៏មានវិធីសាស្ត្រចំលងនៃក្បួនដោះស្រាយដែលកើតឡើងនៅពេលដែលអ្នករចនានៃប្រព័ន្ធអ៊ីនធឺណែតយល់ដឹងអំពីទ្រឹស្ដីសង្គមហើយបន្ទាប់មកបង្កើតទ្រឹស្ដីទាំងនេះទៅក្នុងប្រព័ន្ធរបស់ពួកគេ។ អ្នកវិទ្យាសាស្រ្តសង្គមហៅការ សម្តែង នេះថានៅពេលដែលទ្រឹស្ដីមួយផ្លាស់ប្តូរពិភពលោកក្នុងរបៀបមួយដែលនាំឱ្យពិភពលោកកាន់តែស្របតាមទ្រឹស្ដី។ នៅក្នុងករណីនៃការធ្វើសកម្មភាព algorithmic confounding, ធម្មជាតិស្មុគ្រស្មាញនៃទិន្នន័យគឺមានការលំបាកខ្លាំងណាស់ក្នុងការរកឃើញ។

ឧទាហរណ៏មួយនៃគំរូមួយដែលបង្កើតឡើងដោយការសម្តែងគឺឆ្លងកាត់បណ្តាញសង្គមតាមអ៊ីនធឺណែត។ នៅទសវត្សឆ្នាំ 1970 និង 1980 ក្រុមអ្នកស្រាវជ្រាវជាច្រើនបានរកឃើញថាប្រសិនបើអ្នកជាមិត្តភក្តិជាមួយអាលីសនិងប៊ែលនោះអាលីសនិងបូបទំនងជាមិត្ដភក្ដិជាមួយគ្នាទៅវិញទៅមកជាងប្រសិនបើពួកគេជ្រើសរើសមនុស្សពីរនាក់ដោយចៃដន្យ។ លំនាំដូចគ្នានេះត្រូវបានរកឃើញនៅក្នុងក្រាហ្វិចសង្គមនៅលើ Facebook (Ugander et al. 2011) ។ ដូច្នេះអាចសន្និដ្ឋានថាគំរូនៃមិត្តភាពនៅលើហ្វេសប៊ុកអាចបង្កើតគំរូនៃមិត្តភាពក្រៅប្រព័ន្ធយ៉ាងហោចណាស់ទាក់ទងនឹងការឆ្លងឆ្លើយ។ ទោះជាយ៉ាងណាក៏ដោយទំហំនៃភាពផ្លាស់ប្តូរក្នុងក្រាហ្វិចសង្គមហ្វេសប៊ុកត្រូវបានជម្រុញដោយផ្នែកមួយដោយការបង្កប់នៃក្បួនដោះស្រាយ។ នោះគឺអ្នកវិទ្យាសាស្ត្រទិន្នន័យនៅហ្វេសប៊ុកបានដឹងអំពីការស្រាវជ្រាវពិសោធនិងទ្រឹស្ដីអំពីការឆ្លងឆ្លើយហើយបន្ទាប់មកបានដុតវាចូលទៅក្នុងរបៀបដែលហ្វេសប៊ុកធ្វើការ។ ហ្វេសប៊ុកមាន "មនុស្សដែលអ្នកអាចដឹង" លក្ខណៈពិសេសដែលបង្ហាញពីមិត្តភក្តិថ្មីហើយវិធីមួយដែល Facebook សំរេចថាអ្នកណាក៏ដោយដែលអ្នកចង់ឱ្យអ្នកឆ្លងកាត់។ នោះមានន័យថាហ្វេសប៊ុកទំនងជាបង្ហាញថាអ្នកក្លាយជាមិត្តភក្តិជាមួយមិត្តភក្តិរបស់មិត្តភក្តិ។ លក្ខណៈពិសេសនេះមានប្រសិទ្ធិភាពនៃការបង្កើនភាពផ្លាស់ប្តូរនៅក្នុងក្រាហ្វិច Facebook ។ ទ្រឹស្តីមួយទៀតទ្រឹស្តីនៃការផ្លាស់ប្តូរនេះនាំឱ្យពិភពលោកស្របតាមការព្យាករណ៍នៃទ្រឹស្តី (Zignani et al. 2014; Healy 2015) ។ ដូច្នេះនៅពេលប្រភពទិន្នន័យធំ ៗ លេចឡើងដើម្បីបង្កើតការព្យាករណ៍អំពីទ្រឹស្ដីសង្គមយើងត្រូវប្រាកដថាទ្រឹស្ដីមិនត្រូវបានដុតក្នុងរបៀបដែលប្រព័ន្ធដំណើរការនោះទេ។

ជាជាងគិតពីប្រភពទិន្នន័យដ៏ធំដែលជាការសង្កេតមើលមនុស្សនៅក្នុងបរិបទធម្មជាតិការនិយាយប្រៀបធៀបបន្ថែមទៀតគឺការសង្កេតមើលមនុស្សនៅក្នុងកាស៊ីណូ។ កាស៊ីណូគឺជាបរិយាកាសដែលបង្កើតឡើងដើម្បីបង្កើតអាកប្បកិរិយាជាក់លាក់ហើយអ្នកស្រាវជ្រាវម្នាក់មិនដែលរំពឹងថាឥរិយាបថក្នុងកាស៊ីណូនឹងផ្តល់នូវបង្អួចដែលមិនមានភាពងាយស្រួលក្នុងអាកប្បកិរិយារបស់មនុស្សឡើយ។ ពិតណាស់អ្នកអាចរៀនអ្វីមួយអំពីឥរិយាបថរបស់មនុស្សដោយសិក្សាមនុស្សនៅក្នុងកាស៊ីណូប៉ុន្តែប្រសិនបើអ្នកមិនអើពើនឹងការពិតដែលថាទិន្នន័យត្រូវបានបង្កើតនៅក្នុងកាស៊ីណូនោះអ្នកអាចសន្និដ្ឋានមិនល្អ។

ជាអកុសលការដោះស្រាយជាមួយការចំលង algorithmic គឺមានការពិបាកជាពិសេសដោយសារតែលក្ខណៈពិសេសជាច្រើននៃប្រព័ន្ធអនឡាញគឺមានកម្មសិទ្ធិចងក្រងជាឯកសារនិងមានការផ្លាស់ប្តូរជានិច្ច។ ឧទាហរណ៍ដូចដែលខ្ញុំនឹងពន្យល់នៅពេលក្រោយនៅក្នុងជំពូកនេះការយល់ច្រឡំតាមក្បួនដោះស្រាយគឺជាការពន្យល់ដែលអាចធ្វើបានសម្រាប់ការវិភាគនៃជម្ងឺគ្រុនផ្តាសាយ Google ជាដំណាក់កាលបន្តិចម្តង (ផ្នែក 2.4.2) ប៉ុន្តែពាក្យបណ្តឹងនេះពិបាកក្នុងការវាយតម្លៃដោយសារដំណើរការខាងក្នុងនៃក្បួនដោះស្រាយការស្វែងរករបស់ Google គឺ កម្មសិទ្ធិ។ ធម្មជាតិថាមវន្តនៃការចំលង algorithmic គឺជាទម្រង់មួយនៃការរសាត់ប្រព័ន្ធ។ ការច្រឡំក្បួនដោះស្រាយមានន័យថាយើងគួរតែមានការប្រុងប្រយ័ត្នអំពីពាក្យបណ្តឹងណាមួយទាក់ទងនឹងឥរិយាបថរបស់មនុស្សដែលមកពីប្រព័ន្ធឌីជីថលមួយមិនថាធំប៉ុនណា។