2.1 ການນໍາສະເຫນີ

ໃນອາຍຸສູງສຸດທີ່ຄ້າຍຄືກັນ, ການເກັບກໍາຂໍ້ມູນກ່ຽວກັບພຶດຕິກໍາ - ຜູ້ທີ່ເຮັດສິ່ງທີ່, ແລະເວລາທີ່ລາຄາແພງ, ແລະເພາະສະນັ້ນທີ່ຫາຍາກ. ໃນປະຈຸບັນ, ໃນອາຍຸສູງສຸດຂອງດິຈິຕອນ, ພຶດຕິກໍາຂອງບັນດາຄົນຫຼາຍພັນລ້ານຄົນໄດ້ຖືກບັນທຶກໄວ້, ເກັບຮັກສາໄວ້ແລະສາມາດວິເຄາະໄດ້. ຕົວຢ່າງເຊັ່ນທຸກໆຄັ້ງທີ່ທ່ານຄລິກໃສ່ເວັບໄຊທ໌, ໂທຢູ່ໃນໂທລະສັບມືຖືຂອງທ່ານ, ຫຼືຈ່າຍເງິນສໍາລັບບາງສິ່ງບາງຢ່າງທີ່ມີບັດເຄຣດິດຂອງທ່ານ, ບັນທຶກດິຈິຕອນຂອງພຶດຕິກໍາຂອງທ່ານກໍ່ຖືກສ້າງຂຶ້ນແລະເກັບໄວ້ໂດຍທຸລະກິດ. ເນື່ອງຈາກວ່າປະເພດເຫຼົ່ານີ້ແມ່ນຂໍ້ມູນທີ່ເປັນປະໂຫຍດຕໍ່ການປະຕິບັດປະຈໍາວັນຂອງປະຊາຊົນ, ພວກມັນຖືກເອີ້ນວ່າ ດັກດິຈິຕອນ . ນອກເຫນືອໄປຈາກຂີ້ເຫຍື້ອເຫຼົ່ານີ້ຈັດຂຶ້ນໂດຍທຸລະກິດ, ລັດຖະບານຍັງມີຂໍ້ມູນອຸດົມສົມບູນກ່ຽວກັບປະຊາຊົນແລະທຸລະກິດ. ບັນດາລາຍການທຸລະກິດແລະການບໍລິການເຫຼົ່ານີ້ຮ່ວມກັນເອີ້ນວ່າ ຂໍ້ມູນຂະຫນາດໃຫຍ່ .

ນ້ໍາຖ້ວມໃຫຍ່ຂອງຂໍ້ມູນຂະຫນາດໃຫຍ່ຫມາຍຄວາມວ່າພວກເຮົາໄດ້ຍ້າຍໄປຈາກໂລກທີ່ຂໍ້ມູນກ່ຽວກັບພຶດຕິກໍາທີ່ມີຄວາມຫຍຸ້ງຍາກໃນໂລກທີ່ມີຂໍ້ມູນກ່ຽວກັບພຶດຕິກໍາທີ່ມີຄວາມອຸດົມສົມບູນ. ຂັ້ນຕອນທໍາອິດທີ່ຈະຮຽນຮູ້ຈາກຂໍ້ມູນທີ່ໃຫຍ່ແມ່ນຮັບຮູ້ວ່າມັນເປັນສ່ວນຫນຶ່ງຂອງຂໍ້ມູນທີ່ກວ້າງກວ່າຂອງຂໍ້ມູນທີ່ໄດ້ນໍາໃຊ້ສໍາລັບການຄົ້ນຄວ້າທາງດ້ານສັງຄົມເປັນເວລາຫລາຍປີ: ຂໍ້ມູນການສັງເກດ . ຂໍ້ມູນກ່ຽວກັບການສັງເກດການແມ່ນຂໍ້ມູນໃດໆທີ່ເປັນຜົນມາຈາກການສັງເກດເບິ່ງລະບົບສັງຄົມໂດຍບໍ່ມີການແຊກແຊງໃນບາງທາງ. ເປັນວິທີທີ່ດີທີ່ສຸດທີ່ຈະຄິດກ່ຽວກັບມັນແມ່ນວ່າຂໍ້ມູນການສັງເກດການແມ່ນທຸກສິ່ງທຸກຢ່າງທີ່ບໍ່ພົວພັນກັບຄົນ (ຕົວຢ່າງ, ການສໍາຫຼວດ, ຫົວຂໍ້ຂອງພາກທີ 3) ຫຼືການປ່ຽນແປງສະພາບແວດລ້ອມຂອງຜູ້ຄົນ (ຕົວຢ່າງ, ປະສົບການ, ຫົວຂໍ້ຂອງພາກ 4). ດັ່ງນັ້ນ, ນອກເຫນືອໄປຈາກບັນທຶກທຸລະກິດແລະລັດຖະບານ, ຂໍ້ມູນການສັງເກດການຍັງປະກອບມີສິ່ງຕ່າງໆເຊັ່ນຂໍ້ຄວາມຂອງບົດລາຍງານແລະຫນັງສືດາວທຽມ.

ບົດນີ້ມີສາມສ່ວນ. ຫນ້າທໍາອິດ, ໃນພາກ 2.2, ຂ້າພະເຈົ້າໄດ້ອະທິບາຍແຫຼ່ງຂໍ້ມູນທີ່ມີລາຍລະອຽດເພີ່ມເຕີມແລະຊີ້ແຈງຄວາມແຕກຕ່າງລະຫວ່າງພວກເຂົາແລະຂໍ້ມູນທີ່ຖືກນໍາໃຊ້ສໍາລັບການຄົ້ນຄ້ວາທາງສັງຄົມໃນໄລຍະຜ່ານມາ. ຫຼັງຈາກນັ້ນ, ໃນພາກ 2.3, ຂ້າພະເຈົ້າໄດ້ອະທິບາຍເຖິງລັກສະນະທົ່ວໄປຂອງສິບຂໍ້ມູນໃຫຍ່. ການເຂົ້າໃຈຄຸນລັກສະນະເຫຼົ່ານີ້ຊ່ວຍໃຫ້ທ່ານສາມາດຮັບຮູ້ຄວາມເຂັ້ມແຂງແລະຈຸດອ່ອນຂອງແຫຼ່ງທີ່ມີຢູ່ແລະຊ່ວຍໃຫ້ທ່ານນໍາໃຊ້ແຫລ່ງໃຫມ່ທີ່ຈະມີໃນອະນາຄົດ. ສຸດທ້າຍ, ໃນພາກ 2.4, ຂ້ອຍອະທິບາຍສາມຍຸດທະສາດການຄົ້ນຄວ້າຕົ້ນຕໍທີ່ທ່ານສາມາດນໍາໃຊ້ເພື່ອຮຽນຮູ້ຈາກຂໍ້ມູນການສັງເກດ: ການນັບສິ່ງຕ່າງໆ, ສິ່ງທີ່ຄາດເດົາແລະການປະມານທົດລອງ.