2.3 ລັກສະນະສາມັນຂອງຂໍ້ມູນຂະຫນາດໃຫຍ່

ແຫຼ່ງຂໍ້ມູນຂະຫນາດໃຫຍ່ມີແນວໂນ້ມທີ່ຈະມີລັກສະນະສິບ; ບາງແມ່ນດີສໍາລັບການຄົ້ນຄວ້າທາງສັງຄົມແລະບໍ່ດີ.

ຖ້າຫາກວ່ານັກຄົ້ນຄວ້າຈະຕ້ອງຮຽນຮູ້ຈາກຂໍ້ມູນຂະຫນາດໃຫຍ່ທີ່ພວກເຂົາເຈົ້າບໍ່ໄດ້ສ້າງຫຼືການເກັບກໍາ, ຫຼັງຈາກນັ້ນເຂົາເຈົ້າຕ້ອງໄດ້ເຂົ້າໃຈລັກສະນະທົ່ວໄປຂອງຕົນ. ແທນທີ່ຈະກ່ວາກິນເວທີໂດຍວິທີການເວທີ (ຕົວຢ່າງ, ໃນທີ່ນີ້ແມ່ນສິ່ງທີ່ທ່ານຈໍາເປັນຕ້ອງຮູ້ກ່ຽວກັບ Twitter, ທີ່ນີ້ແມ່ນສິ່ງທີ່ທ່ານຈໍາເປັນຕ້ອງຮູ້ກ່ຽວກັບຂໍ້ມູນຄົ້ນຫາກູໂກ, ແລະອື່ນໆ), ຂ້າພະເຈົ້າຈະອະທິບາຍສິບລັກສະນະທົ່ວໄປຂອງຂໍ້ມູນຂະຫນາດໃຫຍ່, ລັກສະນະທີ່ເກີດຂຶ້ນ ເນື່ອງຈາກວ່າຂໍ້ມູນແມ່ນບໍ່ໄດ້ສ້າງຕັ້ງສໍາລັບຈຸດປະສົງຂອງການຄົ້ນຄວ້າທາງສັງຄົມ. ໂດຍ stepping ກັບໄປຈາກລາຍລະອຽດຂອງລະບົບໂດຍສະເພາະແຕ່ລະຄົນແລະຊອກຫາຢູ່ໃນຄຸນສົມບັດໂດຍທົ່ວໄປເຫຼົ່ານີ້, ນັກຄົ້ນຄວ້າຢ່າງວ່ອງໄວສາມາດຮຽນຮູ້ເພີ່ມເຕີມກ່ຽວກັບແຫລ່ງຂໍ້ມູນທີ່ມີຢູ່ແລ້ວແລະມີກໍານົດໄວ້ຂອງບໍລິສັດແນວຄວາມຄິດທີ່ຈະນໍາໃຊ້ແຫຼ່ງຂໍ້ມູນຂໍ້ມູນໃນອະນາຄົດ.

ຂ້າພະເຈົ້າເຫັນວ່າມັນເປັນປະໂຫຍດກັບກຸ່ມລັກສະນະເປັນສອງປະເພດໄດ້:

  • ໂດຍທົ່ວໄປທີ່ດີສໍາລັບການຄົ້ນຄວ້າ: ຂະຫນາດໃຫຍ່, ສະເຫມີໄປ, ໃນ, ທີ່ບໍ່ແມ່ນ reactive
  • ໂດຍທົ່ວໄປແລ້ວບໍ່ດີສໍາລັບການຄົ້ນຄວ້າ: ບໍ່ຄົບຖ້ວນ, ສາມາດເຂົ້າເຖິງ, ທີ່ບໍ່ແມ່ນຜູ້ຕາງຫນ້າ, ພຽງການລອຍລົມ, ເຮັດໃຫ້ຈໍານົນສູດການຄິດໄລ່, ສາມາດເຂົ້າເຖິງ, ເປື້ອນ, ແລະທີ່ສໍາຄັນ

ເວົ້າລວມແລ້ວ, ການບັນທຶກການບໍລິຫານຂອງລັດຖະບານແມ່ນມີຫນ້ອຍບໍ່ແມ່ນຜູ້ຕາງຫນ້າ, ເຮັດໃຫ້ຈໍານົນຫນ້ອຍສູດການຄິດໄລ່, ແລະພຽງການລອຍລົມຫນ້ອຍ. ໃນອີກດ້ານຫນຶ່ງ, ການບັນທຶກການບໍລິຫານທຸລະກິດແນວໂນ້ມທີ່ຈະຂະຫນາດໃຫຍ່ແລະຫຼາຍເຫມີໄປ, ສຸດ.