2.1 ການນໍາສະເຫນີ

ໃນອາຍຸສູງສຸດການປຽບທຽບ, ການເກັບກໍາຂໍ້ມູນກ່ຽວກັບພຶດຕິກໍາທີ່ບໍ່ສິ່ງທີ່ໃນເວລາທີ່ມີລາຄາແພງ, ແລະເພາະສະນັ້ນ, ທີ່ຂ້ອນຂ້າງຫາຍາກ. ໃນປັດຈຸບັນ, ໃນອາຍຸສູງສຸດດິຈິຕອນ, ພຶດຕິກໍາຂອງຫຼາຍຕື້ຂອງປະຊາຊົນໄດ້ຖືກບັນທຶກ, ເກັບຮັກສາໄວ້, ແລະການວິເຄາະ. ສໍາລັບການຍົກຕົວຢ່າງ, ໃຊ້ເວລາທີ່ທ່ານຄລິກໃສ່ເວັບໄຊທ໌, ເຮັດໃຫ້ໂທຫາໂທລະສັບມືຖືຂອງທ່ານ, ຫຼືຈ່າຍສໍາລັບບາງສິ່ງບາງຢ່າງດ້ວຍບັດເຄຣດິດຂອງທ່ານ, ການບັນທຶກດິຈິຕອນຂອງພຶດຕິກໍາຂອງທ່ານໄດ້ຖືກສ້າງຕັ້ງຂື້ນແລະເກັບຮັກສາໄວ້ໂດຍທຸລະກິດ. ເນື່ອງຈາກວ່າຂໍ້ມູນເຫຼົ່ານີ້ແມ່ນໂດຍການຜະລິດຕະພັນຂອງທຸກການປະຕິບັດວັນຂອງປະຊາຊົນ, ເຂົາເຈົ້າໄດ້ຖືກເອີ້ນວ່າມັກຕາມຮອຍດິຈິຕອນ. ນອກຈາກການຕິດຕາມເຫຼົ່ານີ້ໄດ້ຈັດຂຶ້ນໂດຍນັກທຸລະກິດ, ລັດຖະບານຍັງມີຂໍ້ມູນທີ່ອຸດົມສົມບູນ incredibly ກ່ຽວກັບປະຊາຊົນແລະທຸລະກິດ, ຂໍ້ມູນຊຶ່ງມັກຈະເປັນດິຈິຕອນແລະການວິເຄາະ. ຮ່ວມກັນເຫຼົ່ານີ້ການບັນທຶກການທຸລະກິດແລະລັດຖະບານມັກຈະເອີ້ນວ່າຂໍ້ມູນຂະຫນາດໃຫຍ່.

ນ້ໍາທີ່ເຄີຍເພີ່ມຂຶ້ນຂອງຂໍ້ມູນຂະຫນາດໃຫຍ່ຫມາຍຄວາມວ່າພວກເຮົາໄດ້ຍ້າຍຈາກໂລກທີ່ບ່ອນທີ່ຂໍ້ມູນການປະພຶດແມ່ນຫາຍາກໃນໂລກທີ່ມີຂໍ້ມູນການປະພຶດແມ່ນອຸດົມສົມບູນໄດ້. ແຕ່, ເນື່ອງຈາກວ່າຂໍ້ມູນປະເພດເຫຼົ່ານີ້ແມ່ນຂ້ອນຂ້າງໃຫມ່, ຈໍານວນເງິນທີ່ໂຊກບໍ່ດີຂອງການຄົ້ນຄວ້າການນໍາໃຊ້ໃຫ້ເຂົາເຈົ້າເບິ່ງຄືວ່າວິທະຍາສາດ blindly chasing ມີຂໍ້ມູນ. ໃນພາກນີ້, ແທນທີ່ຈະເປັນ, ນໍາສະເຫນີວິທີການຫລັກການທີ່ຈະເຂົ້າໃຈແຫຼ່ງຂໍ້ມູນທີ່ແຕກຕ່າງກັນຂອງຂໍ້ມູນແລະວິທີການທີ່ເຂົາເຈົ້າສາມາດຖືກນໍາໃຊ້. ນີ້ຄວາມເຂົ້າໃຈອຸດົມສົມບູນຄວນຈະຊ່ວຍໃຫ້ທ່ານດີກວ່າຄໍາວ່າຄໍາຖາມຄົ້ນຄ້ວາຂອງທ່ານຫາແຫຼ່ງຂໍ້ມູນທີ່ເຫມາະສົມຂອງຂໍ້ມູນ. ຫຼື, ຖ້າຫາກວ່າແຫຼ່ງຂໍ້ມູນດັ່ງກ່າວແມ່ນຂາດ, ໃຫ້ທ່ານສາມາດເກັບກໍາຂໍ້ມູນຂອງທ່ານເອງໂດຍນໍາໃຊ້ແນວຄວາມຄິດໃນບົດໃນອະນາຄົດ.

A ຂັ້ນຕອນທໍາອິດທີ່ຈະຮຽນຮູ້ຈາກຂໍ້ມູນຂະຫນາດໃຫຍ່ແມ່ນເພື່ອຮັບຮູ້ວ່າມັນເປັນສ່ວນຫນຶ່ງຂອງປະເພດຂອງທີ່ກ້ວາງຂວາງຂອງຂໍ້ມູນທີ່ໄດ້ຮັບການນໍາໃຊ້ສໍາລັບການຄົ້ນຄວ້າທາງດ້ານສັງຄົມສໍາລັບເວລາຫຼາຍປີ: ຂໍ້ມູນການສັງເກດການ. ປະມານ, ຂໍ້ມູນການສັງເກດການແມ່ນຂໍ້ມູນໃດໆທີ່ເກີດຈາກການສັງເກດເບິ່ງລະບົບສັງຄົມໂດຍບໍ່ມີການແຊກແຊງໃນ​​ວິທີການບາງ. A ວິທີການມັນຈະຄິດກ່ຽວກັບມັນແມ່ນວ່າຂໍ້ມູນການສັງເກດການແມ່ນທຸກສິ່ງທຸກຢ່າງທີ່ບໍ່ກ່ຽວຂ້ອງກັບການໂອ້ລົມກັບປະຊາຊົນ (ຕົວຢ່າງ, ການສໍາຫຼວດ, ຫົວຂໍ້ຂອງບົດທີ 3) ຫຼືການປ່ຽນແປງສະພາບແວດລ້ອມຂອງປະຊາຊົນ (ຕົວຢ່າງ, ການທົດລອງ, ຫົວຂໍ້ຂອງບົດທີ 4). ດັ່ງນັ້ນ, ໃນນອກຈາກນັ້ນກັບທຸລະກິດແລະລັດຖະບານການບັນທຶກການ, ຂໍ້ມູນການສັງເກດການຍັງປະກອບມີສິ່ງຕ່າງໆເຊັ່ນວ່າຂໍ້ຄວາມຂອງບົດຄວາມໃນຫນັງສືພິມແລະຮູບພາບດາວທຽມ.

ພາກນີ້ຈະມີສາມພາກສ່ວນ. ຄັ້ງທໍາອິດ, ໃນພາກທີ 22, ຂ້າພະເຈົ້າອະທິບາຍຂໍ້ມູນຂະຫນາດໃຫຍ່ໃນລາຍລະອຽດເພີ່ມເຕີມແລະອະທິບາຍຄວາມແຕກຕ່າງກັນລະຫວ່າງພື້ນຖານແລະຂໍ້ມູນທີ່ໄດ້ຮັບໂດຍທົ່ວໄປການນໍາໃຊ້ used ສໍາລັບການຄົ້ນຄ້ວາສັງຄົມໃນໄລຍະຜ່ານມາ. ຫຼັງຈາກນັ້ນ, ໃນພາກທີ 23, ຂ້າພະເຈົ້າອະທິບາຍສິບລັກສະນະທົ່ວໄປຂອງແຫຼ່ງຂໍ້ມູນຂະຫນາດໃຫຍ່. ຄວາມເຂົ້າໃຈລັກສະນະການເຫຼົ່ານີ້ເຮັດໃຫ້ພວກເຮົາໄດ້ຢ່າງວ່ອງໄວຮັບຮູ້ຄວາມເຂັ້ມແຂງແລະຈຸດອ່ອນຂອງແຫຼ່ງຂໍ້ມູນທີ່ມີຢູ່ແລ້ວແລະຈະຊ່ວຍໃຫ້ພວກເຮົາໄດ້ harness ແຫຼ່ງຂໍ້ມູນໃຫມ່ທີ່ຈະໄດ້ຮັບການສ້າງຕັ້ງຂື້ນໃນອະນາຄົດ. ສຸດທ້າຍ, ໃນພາກທີ 24, ຂ້າພະເຈົ້າອະທິບາຍສາມຍຸດທະສາດການຄົ້ນຄວ້າຕົ້ນຕໍທີ່ທ່ານສາມາດໃຊ້ເພື່ອຮຽນຮູ້ຈາກຂໍ້ມູນການສັງເກດການ: ສິ່ງທີ່ນັບ, ສິ່ງທີ່ຄາດການ, ແລະ approximating ການທົດລອງ.