5.3.1 ລາງວັນ Netflix

ໄດ້ຮັບລາງວັນ Netflix ໃຊ້ເອີ້ນເປີດການຄາດຄະເນທີ່ຮູບເງົາປະຊາຊົນຈະມັກ.

ໂຄງການໂທຫາທີ່ຮູ້ຈັກກັນດີທີ່ສຸດແມ່ນ Netflix Prize. Netflix ເປັນບໍລິສັດເຊົ່າຫນັງອອນໄລນ໌, ແລະໃນປີ 2000 ມັນໄດ້ເປີດຕົວ Cinematch, ການບໍລິການທີ່ແນະນໍາໃຫ້ຮູບເງົາກັບລູກຄ້າ. ຍົກຕົວຢ່າງ, Cinematch ອາດສັງເກດເຫັນວ່າທ່ານມັກ Star Wars ແລະ Empire Strikes Back ແລ້ວແນະນໍາໃຫ້ທ່ານເບິ່ງ Return of the Jedi . ໃນເບື້ອງຕົ້ນ, Cinematch ໄດ້ເຮັດວຽກບໍ່ດີ. ແຕ່, ໃນໄລຍະຫຼາຍປີ, ມັນຍັງສືບຕໍ່ປັບປຸງຄວາມສາມາດຂອງຕົນທີ່ຈະຄາດຄະເນວ່າຮູບເງົາທີ່ລູກຄ້າຈະມີຄວາມສຸກ. ແຕ່ປີ 2006, ຢ່າງໃດກໍຕາມ, ຄວາມຄືບຫນ້າໃນ Cinematch ໄດ້ສູງຂຶ້ນ. ນັກຄົ້ນຄວ້າຂອງ Netflix ໄດ້ພະຍາຍາມທຸກສິ່ງທຸກຢ່າງທີ່ພວກເຂົາອາດຈະຄິດ, ແຕ່ໃນເວລາດຽວກັນ, ພວກເຂົາສົງໃສວ່າມີແນວຄວາມຄິດອື່ນໆທີ່ອາດຊ່ວຍໃຫ້ພວກເຂົາປັບປຸງລະບົບຂອງພວກເຂົາ. ດັ່ງນັ້ນ, ພວກເຂົາເຈົ້າໄດ້ເກີດຂຶ້ນກັບສິ່ງທີ່, ໃນເວລານັ້ນ, ເປັນການແກ້ໄຂຢ່າງຮຸນແຮງ: ການໂທເປີດ.

ຄວາມສໍາຄັນກັບຜົນສໍາເລັດສຸດທ້າຍຂອງລາງວັນ Netflix ແມ່ນວິທີການໂທເປີດໄດ້ຖືກອອກແບບແລະການອອກແບບນີ້ມີບົດຮຽນທີ່ສໍາຄັນສໍາລັບວິທີການເປີດສາຍສາມາດໃຊ້ສໍາລັບການຄົ້ນຄວ້າທາງສັງຄົມ. Netflix ບໍ່ພຽງແຕ່ຮຽກຮ້ອງໃຫ້ຄໍາຄິດຄໍາເຫັນທີ່ບໍ່ມີໂຄງສ້າງທີ່ເປັນສິ່ງທີ່ປະຊາຊົນຈໍານວນຫຼາຍຄິດວ່າເມື່ອພິຈາລະນາໂທເປີດ. ແທນທີ່ຈະ, Netflix posed ບັນຫາທີ່ຈະແຈ້ງກ່ຽວກັບຂັ້ນຕອນການປະເມີນແບບງ່າຍໆ: ພວກເຂົາໄດ້ປະທ້ວງໃຫ້ຜູ້ຊົມໃຊ້ໃຊ້ເວລາ 100 ລ້ານຄົນໃນການຄາດຄະເນການຄາດຄະເນ 3 ລ້ານຄົນ. ບຸກຄົນທໍາອິດທີ່ສ້າງລະຫັດທີ່ຄາດຄະເນວ່າ 3 ລ້ານຄົນຈັດລຽງອອກ 10% ດີກວ່າ Cinematch ຈະຊະນະຫຼຽນລ້ານໂດລາ. ນີ້ແມ່ນຈະແຈ້ງແລະງ່າຍທີ່ຈະນໍາໃຊ້ຂັ້ນຕອນການປະເມີນຜົນທີ່ປຽບທຽບກັບການຄາດຄະເນທີ່ຄາດຄະເນໄວ້ດ້ວຍການຈັດອັນດັບທີ່ຈັດໄວ້ - ເຊິ່ງຫມາຍຄວາມວ່າລາງວັນ Netflix ແມ່ນຖືກກໍານົດໃນວິທີການແກ້ໄຂງ່າຍກວ່າການສ້າງ; ມັນໄດ້ຫັນຄວາມທ້າທາຍຂອງການປັບປຸງ Cinematch ເປັນບັນຫາທີ່ເຫມາະສົມສໍາລັບການເປີດສາຍ.

ໃນເດືອນຕຸລາປີ 2006, Netflix ເຜີຍແຜ່ຂໍ້ມູນທີ່ມີ 100 ລ້ານຮູບເງົາຈາກປະມານ 500.000 ຄົນ (ພວກເຮົາຈະພິຈາລະນາຜົນກະທົບດ້ານຄວາມເປັນສ່ວນຕົວຂອງການປ່ອຍຂໍ້ມູນນີ້ໃນພາກ 6). ຂໍ້ມູນ Netflix ສາມາດຖືກ conceptualized ເປັນ matrix huge ທີ່ມີປະມານ 500,000 ລູກຄ້າໂດຍ 20,000 ຮູບເງົາ. ພາຍໃນຕາຕະລາງນີ້ມີປະມານ 100 ລ້ານຄົນໃນລະດັບຫນຶ່ງຫາຫ້າດາວ (ຕາຕະລາງ 5.2). ສິ່ງທ້າທາຍແມ່ນການນໍາໃຊ້ຂໍ້ມູນທີ່ສັງເກດເຫັນຢູ່ໃນຕາຕະລາງເພື່ອຄາດຄະເນການຄາດຄະເນທີ່ມີການຈັດເກັບ 3 ລ້ານ.

ຕາຕະລາງ 5.2: ແຜນການຂອງຂໍ້ມູນຈາກລາງວັນ Netflix
ຮູບເງົາ 1 Movie 2 Movie 3 ... Movie 20,000
ລູກຄ້າ 1 2 5 ... ?
ລູກຄ້າ 2 2 ? ... 3
ລູກຄ້າ 3 ? 2 ...
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
ລູກຄ້າ 500,000 ? 2 ... 1

ນັກຄົ້ນຄວ້າແລະແຮກເກີໃນທົ່ວໂລກໄດ້ຮັບຄວາມທ້າທາຍແລະໃນປີ 2008 ມີຫຼາຍກວ່າ 30,000 ຄົນໄດ້ເຮັດວຽກກັບມັນ (Thompson 2008) . ໃນໄລຍະການແຂ່ງຂັນ, Netflix ໄດ້ຮັບຫຼາຍກວ່າ 40,000 ຄໍາແນະນໍາທີ່ໄດ້ຮັບຈາກຫຼາຍກວ່າ 5,000 ທີມງານ (Netflix 2009) . ແນ່ນອນ, Netflix ບໍ່ສາມາດອ່ານແລະເຂົ້າໃຈທັງຫມົດເຫຼົ່ານີ້ການແກ້ໄຂການສະເຫນີ. ສິ່ງທັງຫມົດແລ່ນມົນ, ຢ່າງໃດກໍຕາມ, ເນື່ອງຈາກວ່າວິທີແກ້ໄຂແມ່ນງ່າຍທີ່ຈະກວດສອບ. Netflix ພຽງແຕ່ສາມາດມີຄອມພິວເຕີ້ປຽບທຽບການຄາດຄະເນທີ່ມີການຄາດຄະເນທີ່ມີການຈັດປະເພດອອກໂດຍໃຊ້ຕົວ metric ທີ່ໄດ້ກໍານົດໄວ້ (metric ໂດຍສະເພາະແມ່ນພວກເຂົາໃຊ້ຮາກຮຽບຮ້ອຍຂອງຄວາມຜິດພາດຂອງຕົວກາງ). ມັນແມ່ນຄວາມສາມາດທີ່ຈະປະເມີນຜົນໄດ້ອຍ່າງລວດໄວໃນການແກ້ໄຂບັນຫາທີ່ເຮັດໃຫ້ Netflix ຍອມຮັບການແກ້ໄຂຈາກທຸກໆຄົນ, ເຊິ່ງໄດ້ກາຍເປັນສິ່ງທີ່ສໍາຄັນເພາະວ່າຄວາມຄິດທີ່ດີມາຈາກບາງບ່ອນທີ່ຫນ້າປະຫລາດໃຈ. ໃນຄວາມເປັນຈິງ, ການແກ້ໄຂຊະນະໄດ້ຖືກສົ່ງໂດຍທີມງານທີ່ເລີ່ມຕົ້ນໂດຍນັກຄົ້ນຄວ້າສາມຄົນທີ່ບໍ່ເຄີຍມີຄວາມຮູ້ຄວາມສາມາດໃນການສ້າງລະບົບການແນະນໍາພາພະຍົນ (Bell, Koren, and Volinsky 2010) .

ຫນຶ່ງໃນລັກສະນະທີ່ສວຍງາມຂອງລາງວັນ Netflix ແມ່ນວ່າມັນສາມາດຊ່ວຍໃຫ້ທຸກວິທີແກ້ໄຂທີ່ສະເຫນີໄດ້ຮັບການປະເມີນຢ່າງຖືກຕ້ອງ. ດັ່ງນັ້ນ, ເມື່ອປະຊາຊົນອັບໂຫຼດອັດຕາການຄາດຄະເນຂອງພວກເຂົາ, ພວກເຂົາບໍ່ຈໍາເປັນຕ້ອງອັບໂຫລດຂໍ້ມູນກ່ຽວກັບວິຊາການ, ອາຍຸ, ເຊື້ອຊາດ, ເພດ, ການກໍາເນີດທາງເພດ, ຫຼືສິ່ງໃດກ່ຽວກັບຕົວຂອງເຂົາເອງ. ການຄາດຄະເນການຄາດຄະເນຂອງວິທະຍາສາດທີ່ມີຊື່ສຽງຈາກສະແຕນຟອດໄດ້ຮັບການປິ່ນປົວຢ່າງແທ້ຈິງຄືກັນກັບຜູ້ທີ່ມາຈາກໄວລຸ້ນຢູ່ໃນຫ້ອງນອນຂອງນາງ. ແຕ່ຫນ້າເສຍດາຍ, ນີ້ບໍ່ແມ່ນຄວາມຈິງໃນການຄົ້ນຄວ້າສັງຄົມສ່ວນຫຼາຍ. ນັ້ນແມ່ນ, ສໍາລັບການຄົ້ນຄ້ວາທາງດ້ານສັງຄົມສ່ວນໃຫຍ່, ການປະເມີນຜົນແມ່ນໃຊ້ເວລາຫຼາຍແລະເປັນເລື່ອງສ່ວນຫນຶ່ງ. ດັ່ງນັ້ນ, ແນວຄວາມຄິດໃນການຄົ້ນຄວ້າສ່ວນຫຼາຍແມ່ນບໍ່ໄດ້ຖືກປະເມີນຢ່າງຮຸນແຮງ, ແລະໃນເວລາທີ່ຄວາມຄິດເຫັນຖືກປະເມີນ, ມັນຍາກທີ່ຈະຕັດການປະເມີນຜົນເຫຼົ່ານັ້ນຈາກຜູ້ສ້າງສັນແນວຄວາມຄິດ. ອີກດ້ານຫນຶ່ງ, ບັນດາໂຄງການໂທຫາເປີດແມ່ນການປະເມີນຜົນງ່າຍດາຍແລະຍຸດຕິທໍາເພື່ອໃຫ້ພວກເຂົາສາມາດຄົ້ນພົບແນວຄວາມຄິດທີ່ຈະຫລີກລ້ຽງບໍ່ໄດ້.

ຕົວຢ່າງເຊັ່ນ, ໃນເວລາຫນຶ່ງໃນໄລຍະລາງວັນ Netflix, ຄົນທີ່ມີຊື່ຫນ້າຈໍ Simon Funk ໄດ້ຂຽນກ່ຽວກັບ blog ຂອງຕົນກ່ຽວກັບການແກ້ໄຂທີ່ສະເຫນີໂດຍອີງໃສ່ການສະຫຼຸບຄ່າເສີຍໆ, ວິທີການຈາກ algebra linear ທີ່ບໍ່ໄດ້ຖືກນໍາໃຊ້ກ່ອນຫນ້ານີ້ໂດຍຜູ້ເຂົ້າຮ່ວມອື່ນໆ. ຕໍາແຫນ່ງ blog ຂອງ Funk ແມ່ນພ້ອມໆກັນທາງດ້ານເຕັກນິກແລະແປກປະຫຼາດ. ບົດຂຽນບລັອກນີ້ອະທິບາຍການແກ້ໄຂທີ່ດີຫຼືມັນເປັນສິ່ງທີ່ເສຍເວລາ? ພາຍນອກຂອງໂຄງການໂທເປີດ, ການແກ້ໄຂອາດຈະບໍ່ໄດ້ຮັບການປະເມີນຜົນຢ່າງຮຸນແຮງ. ຫຼັງຈາກທີ່ທັງຫມົດ, Simon Funk ບໍ່ໄດ້ເປັນອາຈານທີ່ MIT ໄດ້; ລາວເປັນນັກພັດທະນາຊໍແວທີ່ໃນເວລານັ້ນແມ່ນການເດີນທາງໄປປະເທດນິວຊີແລນ (Piatetsky 2007) . ຖ້າວ່າລາວໄດ້ສົ່ງອີເມວໄປຫາວິສະວະກອນທີ່ Netflix ໂດຍອີເມລ໌, ມັນເກືອບຈະບໍ່ໄດ້ອ່ານ.

ໂຊກດີເພາະວ່າເງື່ອນໄຂການປະເມີນຜົນໄດ້ຊັດເຈນແລະງ່າຍຕໍ່ການນໍາໃຊ້, ການຄາດຄະເນການຄາດຄະເນຂອງລາວໄດ້ຖືກປະເມີນແລະມັນທັນທີທີ່ຊັດເຈນວ່າວິທີການຂອງລາວມີອໍານາດຫຼາຍ: ລາວໄດ້ເຂົ້າໄປໃນສະຖານທີ່ທີ 4 ໃນການແຂ່ງຂັນ, ເຮັດວຽກສໍາລັບເດືອນໃນບັນຫາ. ໃນທີ່ສຸດ, ສ່ວນຫນຶ່ງຂອງວິທີການຂອງລາວໄດ້ຖືກນໍາໃຊ້ໂດຍຄູ່ແຂ່ງທີ່ເກືອບທັງຫມົດ (Bell, Koren, and Volinsky 2010) .

ຄວາມຈິງທີ່ວ່າ Simon Funk ເລືອກທີ່ຈະຂຽນຂໍ້ຄວາມ blog ທີ່ອະທິບາຍວິທີການຂອງຕົນ, ແທນທີ່ຈະພະຍາຍາມເກັບຮັກສາມັນ, ຍັງສະແດງໃຫ້ເຫັນວ່າຜູ້ເຂົ້າຮ່ວມຈໍານວນຫຼາຍໃນລາງວັນ Netflix ບໍ່ໄດ້ຮັບຜົນກະທົບໂດຍສະເພາະລາງວັນລ້ານໂດລາ. ແທນທີ່ຜູ້ເຂົ້າຮ່ວມຈໍານວນຫຼາຍຍັງຄົງມີຄວາມສຸກກັບສິ່ງທ້າທາຍດ້ານສິນທາງປັນຍາແລະຊຸມຊົນທີ່ພັດທະນາກ່ຽວກັບບັນຫາ (Thompson 2008) , ຄວາມຮູ້ສຶກທີ່ຂ້ອຍຄາດຫວັງວ່ານັກຄົ້ນຄວ້າຈໍານວນຫຼາຍສາມາດເຂົ້າໃຈໄດ້.

ລາງວັນ Netflix ແມ່ນເປັນຕົວຢ່າງຄລາສສິກຂອງການໂທເປີດ. Netflix posed ຄໍາຖາມທີ່ມີເປົ້າຫມາຍສະເພາະ (ຄາດຄະເນການຈັດອັນດັບຮູບເງົາ) ແລະແກ້ໄຂບັນຫາຈາກປະຊາຊົນຈໍານວນຫຼາຍ. Netflix ສາມາດປະເມີນຜົນການແກ້ໄຂບັນຫາເຫຼົ່ານີ້ຍ້ອນວ່າພວກເຂົາງ່າຍຕໍ່ການກວດສອບກວ່າການສ້າງ, ແລະສຸດທ້າຍ Netflix ເກັບເອົາຄໍາແກ້ຕົວທີ່ດີທີ່ສຸດ. ຕໍ່ໄປ, ຂ້າພະເຈົ້າຈະສະແດງວິທີການວິທີດຽວກັນນີ້ສາມາດນໍາໃຊ້ໃນຊີວະວິທະຍາແລະກົດຫມາຍ, ແລະບໍ່ມີລາງວັນລ້ານໂດລາ.