2.5 សេចក្តីសន្និដ្ឋាន

ទិន្នន័យធំគឺនៅគ្រប់ទីកន្លែងប៉ុន្តែការប្រើវានិងទំរង់ដទៃទៀតនៃទិន្នន័យដែលអង្កេតសម្រាប់ការស្រាវជ្រាវក្នុងសង្គមគឺជាការលំបាក។ នៅក្នុងបទពិសោធរបស់ខ្ញុំមានអ្វីមួយដូចជាមិនមានទ្រព្យសម្បត្តិអាហារថ្ងៃត្រង់ដោយឥតគិតថ្លៃសម្រាប់ការស្រាវជ្រាវ: ប្រសិនបើអ្នកមិនបានដាក់នៅក្នុងជាច្រើននៃការងារប្រមូលទិន្នន័យមួយបន្ទាប់មកអ្នកត្រូវបានគេប្រហែលជានឹងត្រូវដាក់នៅក្នុងជាច្រើននៃការងារការវិភាគទិន្នន័យរបស់អ្នកឬនៅក្នុងការគិតអំពី អ្វីដែលជាការគួរឱ្យចាប់អារម្មណ៍នៅក្នុងសំណួរដើម្បីសួរនៃទិន្នន័យ។ ដោយផ្អែកលើគំនិតនៅក្នុងជំពូកនេះខ្ញុំគិតថាមានវិធីបីយ៉ាងសំខាន់ដែលប្រភពទិន្នន័យធំនឹងមានតម្លៃបំផុតសម្រាប់ការស្រាវជ្រាវសង្គមគឺ:

  • អាណាចក្រសម្រេចសេចក្តីរវាងប្រកួតប្រជែងការព្យាករទ្រឹស្តី។ ឧទាហរណ៍នៃប្រភេទនៃការងារនេះរួមបញ្ចូលទាំងការ Farber (2015) (កម្មវិធីបញ្ជាញូវយ៉កតាក់ស៊ី) និង King, Pan, and Roberts (2013) (ការគាបសង្កត់នៅប្រទេសចិន)
  • ធ្វើឱ្យប្រសើរឡើងសម្រាប់ការវាស់សង្គមតាមរយៈការ nowcasting គោលនយោបាយ។ ឧទាហរណ៍នៃប្រភេទនៃការងារនេះគឺជាការ Ginsberg et al. (2009) (Google Flu Trends) ។
  • ការប៉ាន់ប្រមាណផលប៉ះពាល់ធ្វើអោយការពិសោធន៍ធម្មជាតិនិងការផ្គូផ្គង។ ឧទាហរណ៍នៃប្រភេទនៃការងារ។ នេះ Mas and Moretti (2009) (ពិនិត្យមើលផលប៉ះពាល់លើផលិតភាព) និង Einav et al. (2015) (ផលប៉ះពាល់នៃតម្លៃចាប់ផ្តើមនៅលើការដេញថ្លៃនៅរបស់ eBay) ។

សំណួរសំខាន់ជាច្រើននៅក្នុងការស្រាវជ្រាវសង្គមត្រូវបានបង្ហាញថាជាផ្នែកមួយនៃការទាំងបីនេះ។ ទោះជាយ៉ាងណា, ជាទូទៅវិធីសាស្រ្តទាំងនេះតម្រូវឱ្យក្រុមអ្នកស្រាវជ្រាវដើម្បីនាំយកមកនូវជាច្រើនក្នុងការទិន្នន័យ។ អ្វីដែលធ្វើឱ្យ Farber (2015) គឺជាការលើកទឹកចិត្តដែលគួរឱ្យចាប់អារម្មណ៍ទ្រឹស្តីវាស់វែង។ ការលើកទឹកចិត្តទ្រឹស្តីនេះបានមកពីក្រៅទិន្នន័យ។ ដូច្នេះសម្រាប់អ្នកដែលមានល្អនៅបានសួរប្រភេទមួយចំនួននៃសំណួរស្រាវជ្រាវប្រភពទិន្នន័យធំអាចត្រូវបានជាផ្លែផ្កាខ្លាំងណាស់។

ជាចុងក្រោយជាជាងទ្រឹស្តីជំរុញស្រាវជ្រាវជាក់ស្ដែង (ដែលត្រូវបានគេផ្តោតលើជំពូកនេះ) យើងអាចត្រឡប់ស្គ្រីបនិងការបង្កើតបង្កើតទ្រឹស្ដីជំរុញអាណាចក្រ។ ដែលត្រូវបានតាមរយៈការប្រមូលផ្តុំការប្រុងប្រយ័ត្ននៃអង្គហេតុជាក់ស្ដែង, គំរូនិងល្បែងផ្គុំរូប, យើងអាចកសាងទ្រឹស្តីថ្មី។

ជំនួសវិធីសាស្រ្តទិន្នន័យដំបូងនេះដើម្បីទ្រឹស្តីមិនមែនជាថ្មីហើយវាត្រូវបានបញ្ជាក់យ៉ាងច្បាស់ដោយបង្ខំបំផុតដោយ Glaser and Strauss (1967) ជាមួយនឹងការហៅរបស់ពួកគេសម្រាប់ទ្រឹស្តីមូលដ្ឋាន។ វិធីសាស្រ្តទិន្នន័យដំបូងនេះទោះយ៉ាងណាមិនបានបញ្ជាក់ "ចុងបញ្ចប់នៃទ្រឹស្តីនេះ," ដូចដែលត្រូវបានអះអាងដោយមានច្រើននៃការស្រាវជ្រាវរបស់អ្នកកាសែតថានៅជុំវិញនៅក្នុងអាយុឌីជីថល (Anderson 2008) ។ ផ្ទុយទៅវិញដែលជាការផ្លាស់ប្តូរបរិស្ថានទិន្នន័យដែលយើងត្រូវតែរំពឹងថានឹងមានតុល្យភាពឡើងវិញទំនាក់ទំនងរវាងក្នុងទ្រឹស្តីនិងការទិន្នន័យ។ នៅក្នុងពិភពលោកដែលជាកន្លែងដែលការប្រមូលទិន្នន័យមានតម្លៃថ្លៃមួយ, វាធ្វើឱ្យយល់ក្នុងការប្រមូលតែទិន្នន័យដែលទ្រឹស្តីបានបង្ហាញថានឹងក្លាយជាមានប្រយោជន៍ច្រើនបំផុត។ ប៉ុន្តែនៅក្នុងពិភពលោកដែលជាកន្លែងដែលបរិមាណយ៉ាងច្រើននៃទិន្នន័យគឺអាចប្រើបានដោយឥតគិតថ្លៃរួចទៅហើយ, វាធ្វើឱ្យយល់បានផងដែរដើម្បីព្យាយាមវិធីសាស្រ្តមួយដែលទិន្នន័យដំបូង (Goldberg 2015)

ដូចដែលខ្ញុំបានបង្ហាញនៅក្នុងជំពូកនេះ, អ្នកស្រាវជ្រាវអាចរៀនបានច្រើនដោយមើលមនុស្ស។ នៅក្នុងបីជំពូកបន្ទាប់ខ្ញុំនឹងរៀបរាប់អំពីរបៀបដែលយើងអាចរៀនអ្វីដែលកាន់តែច្រើននិងខុសគ្នាប្រសិនបើយើងនូវការប្រមូលទិន្នន័យរបស់យើងនិងធ្វើអន្តរកម្មជាមួយមនុស្សដោយផ្ទាល់ដោយអោយគេសួរសំណួរ (ជំពូកទី 3) ការរត់ការពិសោធន៍ (ជំពូកទី 4) និងសូម្បីតែពាក់ព័ន្ធនឹងពួកគេ នៅក្នុងដំណើរការស្រាវជ្រាវដោយផ្ទាល់ (ជំពូកទី 5) ។