2.3.8 Algorithmically confounded

ພຶດຕິກໍາໃນລະບົບຂໍ້ມູນທີ່ໃຫຍ່ແມ່ນບໍ່ທໍາມະດາ; ມັນຖືກຂັບເຄື່ອນໂດຍເປົ້າຫມາຍດ້ານວິສະວະກໍາຂອງລະບົບ.

ເຖິງແມ່ນວ່າແຫຼ່ງຂໍ້ມູນທີ່ໃຫຍ່ຫຼວງຫຼາຍແມ່ນບໍ່ເປັນປະໂຫຍດເນື່ອງຈາກວ່າປະຊາຊົນບໍ່ຮູ້ວ່າຂໍ້ມູນຂອງເຂົາເຈົ້າຖືກບັນທຶກ (ພາກ 2.3.3), ນັກວິໄຈຄວນບໍ່ຄິດວ່າພຶດຕິກໍາໃນລະບົບອອນລາຍເຫຼົ່ານີ້ແມ່ນ "ເກີດຂຶ້ນຕາມທໍາມະຊາດ". ສ້າງສູງເພື່ອສ້າງປະຕິບັດຕົວຈິງເຊັ່ນ: ການຄລິກໃສ່ການໂຄສະນາຫຼືການເຜີຍແຜ່ເນື້ອຫາ. ວິທີທີ່ເປົ້າຫມາຍຂອງຜູ້ອອກແບບລະບົບສາມາດນໍາຮູບແບບເຂົ້າໄປໃນຂໍ້ມູນໄດ້ຖືກເອີ້ນວ່າ ສັບສົນລະບົບວິທະຍາສາດ . ການຂັດແຍ້ງທາງ algorithmic ແມ່ນບໍ່ຄ່ອຍຈະຮູ້ຈັກກັບນັກວິທະຍາສາດສັງຄົມ, ແຕ່ມັນເປັນຄວາມກັງວົນທີ່ສໍາຄັນໃນບັນດານັກວິທະຍາສາດຂໍ້ມູນທີ່ລະມັດລະວັງ. ແລະ, ບໍ່ເຫມືອນກັບບາງບັນຫາອື່ນໆທີ່ມີຮອຍດິຈິຕອນ, ສັບສົນ algorithmic ສ່ວນໃຫຍ່ແມ່ນບໍ່ເບິ່ງເຫັນ.

ຕົວຢ່າງງ່າຍດາຍຂອງການສັບສົນ algorithmic ແມ່ນຄວາມຈິງທີ່ວ່າກ່ຽວກັບເຟສບຸກມີຈໍານວນຜູ້ທີ່ມີຄວາມຜິດປົກກະຕິຫຼາຍທີ່ມີປະມານ 20 ຫມູ່ເພື່ອນ, ດັ່ງທີ່ໄດ້ຄົ້ນພົບໂດຍ Johan Ugander ແລະເພື່ອນຮ່ວມງານ (2011) . ນັກວິທະຍາສາດການວິເຄາະຂໍ້ມູນນີ້ໂດຍບໍ່ມີຄວາມເຂົ້າໃຈກ່ຽວກັບວິທີການເຮັດວຽກຂອງເຟສບຸກຈະເຮັດໃຫ້ເກີດບັນດາເລື່ອງຈໍານວນຫຼາຍກ່ຽວກັບວິທີການ 20 ແມ່ນປະເພດໃດຫນຶ່ງຂອງຈໍານວນສັງຄົມທີ່ມີປັນຍາ. ໂຊກດີ, Ugander ແລະເພື່ອນຮ່ວມງານຂອງລາວໄດ້ມີຄວາມເຂົ້າໃຈກ່ຽວກັບຂະບວນການທີ່ຜະລິດຂໍ້ມູນແລະພວກເຂົາຮູ້ວ່າເຟສບຸກໄດ້ຊຸກຍູ້ໃຫ້ຜູ້ທີ່ມີສາຍພົວພັນບໍ່ຫຼາຍປານໃດກ່ຽວກັບເຟສບຸກເພື່ອເຮັດໃຫ້ເພື່ອນຫຼາຍກວ່າຫມູ່ຈົນເຖິງ 20 ຄົນ. ເຖິງແມ່ນວ່າ Ugander ແລະເພື່ອນຮ່ວມງານບໍ່ໄດ້ກ່າວວ່ານີ້ຢູ່ໃນເອກະສານຂອງພວກເຂົາ, ນະໂຍບາຍນີ້ກໍ່ຖືກສ້າງຂື້ນໂດຍເຟສບຸກເພື່ອຊຸກຍູ້ໃຫ້ຜູ້ໃຊ້ໃຫມ່ມີຄວາມເຂົ້າໃຈຫຼາຍ. ແຕ່ບໍ່ຮູ້ກ່ຽວກັບການມີນະໂຍບາຍນີ້ຢ່າງໃດກໍ່ຕາມ, ມັນງ່າຍທີ່ຈະສະຫຼຸບຂໍ້ຜິດພາດທີ່ຜິດພາດຈາກຂໍ້ມູນ. ໃນຄໍາສັບຕ່າງໆອື່ນໆ, ຈໍານວນຜູ້ທີ່ມີປະມານ 20 ຄົນທີ່ຫນ້າປະຫລາດໃຈບອກພວກເຮົາກ່ຽວກັບ Facebook ຫຼາຍກວ່າກ່ຽວກັບພຶດຕິກໍາຂອງມະນຸດ.

ໃນຕົວຢ່າງທີ່ຜ່ານມານີ້, ການສັບສົນຂອງລະບົບວິທະຍາສາດໄດ້ເຮັດໃຫ້ຜົນທີ່ເກີດຂື້ນທີ່ນັກຄົ້ນຄວ້າຢ່າງລະມັດລະວັງອາດກວດພົບແລະສືບສວນຕື່ມອີກ. ເຖິງຢ່າງໃດກໍ່ຕາມ, ມີການໂຕ້ແຍ້ງລະບົບ algorithmic ທີ່ເກີດຂື້ນໃນເວລາທີ່ນັກອອກແບບຂອງລະບົບອອນລາຍມີຄວາມຮູ້ກ່ຽວກັບທິດສະດີສັງຄົມແລະຫຼັງຈາກນັ້ນກໍ່ສ້າງທິດສະດີເຫຼົ່ານີ້ເຂົ້າໃນການເຮັດວຽກຂອງລະບົບຂອງເຂົາເຈົ້າ. ນັກວິທະຍາສາດສັງຄົມເອີ້ນວ່າການ ປະຕິບັດ ນີ້: ເມື່ອທິດສະດີປ່ຽນແປງໂລກໃນທາງທີ່ມັນເຮັດໃຫ້ໂລກເພີ່ມທະວີຂຶ້ນກັບທິດສະດີ. ໃນກໍລະນີທີ່ມີຄວາມສັບສົນກ່ຽວກັບລະບົບປະຕິບັດງານ, ລັກສະນະສັບສົນຂອງຂໍ້ມູນແມ່ນມີຄວາມຫຍຸ້ງຍາກຫຼາຍທີ່ຈະກວດພົບ.

ຕົວຢ່າງຫນຶ່ງຂອງຮູບແບບທີ່ສ້າງຂື້ນໂດຍ performativity ແມ່ນການປ່ຽນແປງໃນເຄືອຂ່າຍສັງຄົມອອນໄລນ໌. ໃນຊຸມປີ 1970 ແລະ 1980, ນັກຄົ້ນຄ້ວາພົບວ່າຖ້າທ່ານເປັນເພື່ອນທີ່ມີທັງ Alice ແລະ Bob, Alice ແລະ Bob ມັກຈະເປັນມິດກັບຄົນອື່ນຖ້າຫາກວ່າພວກເຂົາເປັນຜູ້ທີ່ເລືອກທີ່ສອງຄົນ. ຮູບແບບດຽວກັນນີ້ໄດ້ຖືກພົບເຫັນຢູ່ໃນຕາຕະລາງສັງຄົມເທິງ Facebook (Ugander et al. 2011) . ດັ່ງນັ້ນ, ຫນຶ່ງອາດຈະສະຫຼຸບວ່າຮູບແບບຂອງມິດຕະພາບໃນເຟສບຸກ replicate ຮູບແບບຂອງມິດຕະພາບອອບໄລນ໌, ຢ່າງຫນ້ອຍໃນດ້ານ transitivity. ຢ່າງໃດກໍ່ຕາມ, ຄວາມກວ້າງຂອງຄວາມກ້າວຫນ້າໃນເຟສບຸກຂອງສັງຄົມໄດ້ຖືກຂັບເຄື່ອນບາງສ່ວນໂດຍສັບສົນ algorithmic. ນັ້ນແມ່ນ, ນັກວິທະຍາສາດຂໍ້ມູນຢູ່ເຟສບຸກໄດ້ຮູ້ກ່ຽວກັບການຄົ້ນຄວ້າທາງດ້ານທິດສະດີແລະທິດສະດີກ່ຽວກັບຄວາມກ້າວຫນ້າແລະຫຼັງຈາກນັ້ນມັນກໍ່ສ້າງແບບຟອມຂອງເຟສບຸກ. Facebook ມີ "ຄົນທີ່ທ່ານສາມາດຮູ້ໄດ້" ລັກສະນະທີ່ແນະນໍາໃຫ້ຫມູ່ເພື່ອນໃຫມ່, ແລະວິທີຫນຶ່ງທີ່ Facebook ຕັດສິນໃຈທີ່ຈະແນະນໍາໃຫ້ທ່ານເປັນໄລຍະເວລາ. ນັ້ນແມ່ນ, Facebook ມັກຈະແນະນໍາວ່າທ່ານກາຍເປັນເພື່ອນມິດກັບຫມູ່ເພື່ອນຂອງຫມູ່ຂອງທ່ານ. ຄຸນນະສົມບັດນີ້ດັ່ງນັ້ນຈຶ່ງມີຜົນກະທົບຂອງຄວາມກ້າວຫນ້າໃນເຟສບຸກສັງຄົມ; ໃນຄໍາສັບຕ່າງໆອື່ນໆ, ທິດສະດີຂອງການປ່ຽນແປງໄດ້ນໍາໂລກເຂົ້າໃນການຄາດຄະເນຂອງທິດສະດີ (Zignani et al. 2014; Healy 2015) . ດັ່ງນັ້ນ, ໃນເວລາທີ່ແຫຼ່ງຂໍ້ມູນຂະຫນາດໃຫຍ່ປາກົດຂື້ນກັບການຄິດໄລ່ການຄາດຄະເນຂອງທິດສະດີສັງຄົມ, ພວກເຮົາຕ້ອງແນ່ໃຈວ່າທິດສະດີຕົວຂອງມັນເອງບໍ່ໄດ້ຖືກ baked ໃນວິທີການເຮັດວຽກຂອງລະບົບ.

ແທນທີ່ຈະຄິດກ່ຽວກັບແຫລ່ງຂໍ້ມູນທີ່ໃຫຍ່ທີ່ສຸດເປັນການສັງເກດເບິ່ງຄົນທີ່ຢູ່ໃນສະຖານທີ່ທໍາມະຊາດ, ການປຽບທຽບທີ່ເຫມາະສົມແມ່ນການສັງເກດເບິ່ງຄົນໃນຄາສິໂນ. ຄາສິໂນແມ່ນສະພາບແວດລ້ອມທີ່ຖືກສ້າງຂື້ນສູງທີ່ຖືກອອກແບບມາເພື່ອເຮັດໃຫ້ມີພຶດຕິກໍາທີ່ແນ່ນອນແລະນັກຄົ້ນຄວ້າບໍ່ເຄີຍຄາດຫວັງວ່າຈະມີພຶດຕິກໍາໃນຄາສິໂນໃຫ້ເປັນປະຕູທີ່ບໍ່ເປີດເຜີຍໃນພຶດຕິກໍາຂອງມະນຸດ. ແນ່ນອນ, ທ່ານສາມາດຮຽນຮູ້ບາງສິ່ງບາງຢ່າງກ່ຽວກັບພຶດຕິກໍາຂອງມະນຸດໂດຍການສຶກສາຄົນທີ່ຢູ່ໃນຄາສິໂນ, ແຕ່ຖ້າທ່ານບໍ່ສົນໃຈຄວາມຈິງທີ່ວ່າຂໍ້ມູນຖືກສ້າງຂື້ນໃນຄາສິໂນ, ທ່ານອາດຈະສະຫຼຸບບາງຢ່າງທີ່ບໍ່ດີ.

ແຕ່ຫນ້າເສຍດາຍ, ການພົວພັນກັບການສັບສົນລະບົບວິທະຍາສາດແມ່ນມີຄວາມຫຍຸ້ງຍາກໂດຍສະເພາະແມ່ນຫຼາຍໆລັກສະນະຂອງລະບົບອອນໄລນແມ່ນ proprietary, documented ບໍ່ດີ, ແລະ constantly ການປ່ຽນແປງ. ຕົວຢ່າງເຊັ່ນ, ຂ້ອຍຈະອະທິບາຍໃນບົດຕໍ່ໄປນີ້, ການໂຕ້ແຍ້ງທາງ algorithmic ແມ່ນຄໍາອະທິບາຍທີ່ເປັນໄປໄດ້ສໍາລັບການລະອຽດຂອງ Google Flu Trends (ພາກ 2.4.2), ແຕ່ຄໍາຮ້ອງຂໍນີ້ແມ່ນຍາກທີ່ຈະປະເມີນເພາະວ່າການເຮັດວຽກພາຍໃນຂອງລະບົບການຊອກຫາຂອງ Google ແມ່ນ proprietary ລັກສະນະແບບເຄື່ອນໄຫວຂອງການສັບສົນລະບົບວິທະຍາສາດແມ່ນຫນຶ່ງໃນຮູບແບບຂອງການຫຼີກລ້ຽງຂອງລະບົບ. ການສັບສົນລະບົບວິໄນແມ່ນຫມາຍຄວາມວ່າພວກເຮົາຄວນຈະລະມັດລະວັງກ່ຽວກັບການຮຽກຮ້ອງກ່ຽວກັບພຶດຕິກໍາຂອງມະນຸດທີ່ມາຈາກລະບົບດິຈິຕອນດຽວ, ບໍ່ວ່າຈະເປັນຂະຫນາດໃຫຍ່.