2.5 ສະຫຼຸບ

ຂໍ້ມູນຂະຫນາດໃຫຍ່ແມ່ນຢູ່ທົ່ວທຸກແຫ່ງ, ແຕ່ວ່າການນໍາໃຊ້ມັນແລະຮູບແບບອື່ນໆຂອງຂໍ້ມູນການສັງເກດການສໍາລັບການຄົ້ນຄ້ວາສັງຄົມແມ່ນມີຄວາມຫຍຸ້ງຍາກ. ໃນປະສົບການຂອງຂ້າພະເຈົ້າມີບາງສິ່ງບາງຢ່າງເຊັ່ນ: ທີ່ບໍ່ມີຄຸນສົມບັດອາຫານທ່ຽງຟຣີສໍາລັບການຄົ້ນຄວ້າ: ຖ້າວ່າທ່ານບໍ່ເອົາໃຈໃສ່ໃນຢ່າງຫຼາຍຂອງການເຮັດວຽກເກັບກໍາຂໍ້ມູນ, ຫຼັງຈາກນັ້ນທ່ານອາດຈະບໍ່ມີການເອົາໃຈໃສ່ໃນຢ່າງຫຼາຍຂອງການເຮັດວຽກວິເຄາະຂໍ້ມູນຂອງທ່ານຫຼືຢູ່ໃນຄິດກ່ຽວກັບການ ສິ່ງທີ່ຢູ່ໃນຄໍາຖາມທີ່ຫນ້າສົນໃຈທີ່ຈະຂໍໃຫ້ຂໍ້ມູນໄດ້. ໂດຍອີງໃສ່ແນວຄວາມຄິດໃນບົດນີ້, ຂ້າພະເຈົ້າຄິດວ່າມີສາມວິທີທີ່ສໍາຄັນທີ່ແຫລ່ງຂໍ້ມູນຂະຫນາດໃຫຍ່ຈະມີຄຸນຄ່າທີ່ສຸດສໍາລັບການຄົ້ນຄວ້າທາງດ້ານສັງຄົມ:

  • ສັງເກດສົມຄວນລະຫວ່າງການແຂ່ງຂັນຄາດຄະເນທິດສະດີ. ຕົວຢ່າງຂອງປະເພດຂອງການເຮັດວຽກນີ້ປະກອບມີ Farber (2015) (ຄົນຂັບ New York Taxi) ແລະ King, Pan, and Roberts (2013) (Censorship ໃນປະເທດຈີນ)
  • ການວັດແທກທາງສັງຄົມທີ່ດີຂຶ້ນສໍາລັບນະໂຍບາຍໂດຍຜ່ານການ Nowcasting. ຕົວຢ່າງຂອງປະເພດຂອງການເຮັດວຽກນີ້ແມ່ນ Ginsberg et al. (2009) (ກູໂກ Trends ໄຂ້ຫວັດໃຫຍ່).
  • ການຄາດຄະເນຜົນກະທົບ causal ມີປະສົບການທໍາມະຊາດແລະມູນ. ຕົວຢ່າງຂອງປະເພດຂອງການເຮັດວຽກ. ນີ້ Mas and Moretti (2009) (ມິດສະຫາຍຜົນກະທົບຕໍ່ຜະລິດຕະພັນ) ແລະ Einav et al. (2015) (ຜົນກະທົບຂອງລາຄາເລີ່ມຕົ້ນກ່ຽວກັບການປະມູນໃນ eBay).

ຄໍາຖາມທີ່ສໍາຄັນຫຼາຍໃນການຄົ້ນຄວ້າທາງດ້ານສັງຄົມສາມາດໄດ້ຮັບການສະແດງອອກເປັນຫນຶ່ງໃນສາມຄົນນັ້ນ. ຢ່າງໃດກໍຕາມ, ວິທີການເຫຼົ່ານີ້ໂດຍທົ່ວໄປແລ້ວຮຽກຮ້ອງໃຫ້ນັກຄົ້ນຄວ້າເພື່ອເຮັດໃຫ້ຫຼາຍຂໍ້ມູນໄດ້. ສິ່ງທີ່ເຮັດໃຫ້ Farber (2015) ທີ່ຫນ້າສົນໃຈຄືແຮງກະຕຸ້ນທາງທິດສະດີສໍາລັບມາດຕະການ. ນີ້ສິ່ງລະດົມໃຈທິດສະດີມາຈາກພາຍນອກຂໍ້ມູນ. ດັ່ງນັ້ນ, ສໍາລັບຜູ້ທີ່ມີດີຢູ່ທີ່ການສະເຫນີຂໍບາງປະເພດຂອງຄໍາຖາມຄົ້ນຄ້ວາ, ແຫຼ່ງຂໍ້ມູນຂໍ້ມູນຂະຫນາດໃຫຍ່ສາມາດໄດ້ຮັບຜົນດີຫລາຍ.

ສຸດທ້າຍ, ແທນທີ່ຈະກ່ວາທິດສະດີ, ການຂັບເຄື່ອນການຄົ້ນຄວ້າຕົວຈິງ (ທີ່ເປັນຈຸດສຸມຢູ່ໃນບົດນີ້), ພວກເຮົາສາມາດ flip script ແລະສ້າງ theorizing ສັງເກດທີ່ຜັກດັນ. ນັ້ນແມ່ນ, ໂດຍຜ່ານການສະສົມລະມັດລະວັງຂອງຂໍ້ເທັດຈິງຕົວຈິງ, ຮູບແບບການ, ແລະແຂ່ງລົດ, ພວກເຮົາສາມາດສ້າງທິດສະດີໃຫມ່.

ທາງເລືອກ, ວິທີການຂໍ້ມູນຄັ້ງທໍາອິດ, ນີ້ກັບທິດສະດີບໍ່ແມ່ນການໃຫມ່, ແລະໄດ້ມີການລົດຫຼາຍທີ່ສຸດ forcefully ໂດຍ Glaser and Strauss (1967) ທີ່ມີການໂທຂອງເຂົາເຈົ້າສໍາລັບທິດສະດີພື້ນຖານ. ວິທີການຂໍ້ມູນຄັ້ງທໍາອິດນີ້, ຢ່າງໃດກໍຕາມ, ບໍ່ໄດ້ຫມາຍຄວາມວ່າ "ທີ່ສຸດຂອງທິດສະດີ," ຕາມທີ່ໄດ້ອ້າງເອົາຄວາມໂດຍຫຼາຍຂອງວາລະສານປະມານການຄົ້ນຄວ້າໃນອາຍຸສູງສຸດດິຈິຕອນ (Anderson 2008) . ແນ່ນອນວ່າ, ການປ່ຽນແປງສະພາບແວດລ້ອມຂໍ້ມູນ, ພວກເຮົາຕ້ອງໄດ້ຄາດຫວັງວ່າການເປັນ Re: ການດຸ່ນດ່ຽງໃນການພົວພັນລະຫວ່າງທິດສະດີແລະຂໍ້ມູນ. ໃນໂລກທີ່ເກັບກໍາຂໍ້ມູນແມ່ນລາຄາແພງ, ມັນເຮັດໃຫ້ຄວາມຮູ້ສຶກທີ່ຈະເກັບກໍາມີພຽງແຕ່ຂໍ້ມູນທີ່ທິດສະດີແນະນໍາຈະເປັນປະໂຫຍດທີ່ສຸດ. ແຕ່ວ່າ, ໃນໂລກບ່ອນທີ່ປະລິມານມະຫາສານຂອງຂໍ້ມູນທີ່ມີຢູ່ແລ້ວສາມາດໃຊ້ໄດ້ສໍາລັບການຟຣີ, ມັນເຮັດໃຫ້ຄວາມຮູ້ສຶກທີ່ຍັງພະຍາຍາມວິທີການຂໍ້ມູນຄັ້ງທໍາອິດ (Goldberg 2015) .

ໃນຖານະເປັນຂ້າພະເຈົ້າໄດ້ສະແດງໃຫ້ເຫັນຢູ່ໃນພາກນີ້, ນັກຄົ້ນຄວ້າສາມາດຮຽນຮູ້ຫຼາຍໂດຍການສັງເກດເບິ່ງປະຊາຊົນ. ໃນສາມບົດຕໍ່ໄປ, ຂ້າພະເຈົ້າຈະອະທິບາຍວິທີການທີ່ພວກເຮົາສາມາດຮຽນຮູ້ຫຼາຍສິ່ງຫຼາຍຢ່າງທີ່ແຕກຕ່າງກັນແລະຖ້າຫາກວ່າພວກເຮົາປັບປຸງການເກັບຂໍ້ມູນຂອງພວກເຮົາແລະການພົວພັນກັບປະຊາຊົນໂດຍກົງຈາກຂໍໃຫ້ເຂົາເຈົ້າຄໍາຖາມ (ພາກທີ 3), ການເຮັດວຽກປະສົບການ (ພາກທີ 4), ແລະແມ້ກະທັ້ງທີ່ກ່ຽວຂ້ອງກັບພວກເຂົາ ໃນຂະບວນການຄົ້ນຄ້ວາໄດ້ໂດຍກົງ (ບົດທີ 5).