5.3.1 ລາງວັນ Netflix

ການແປພາສານີ້ໄດ້ສ້າງຕັ້ງຂື້ນໂດຍຄອມພິວເຕີ. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

5.3.1 ລາງວັນ Netflix

ໄດ້ຮັບລາງວັນ Netflix ໃຊ້ເອີ້ນເປີດການຄາດຄະເນທີ່ຮູບເງົາປະຊາຊົນຈະມັກ.

ເປັນທີ່ຮູ້ຈັກດີທີ່ສຸດໂຄງການເອີ້ນເປີດແມ່ນໄດ້ຮັບລາງວັນ Netflix. Netflix ເປັນບໍລິສັດບໍລິການຮູບເງົາອອນໄລນ໌, ແລະໃນປີ 2000 ທີ່ຈະເປີດຕົວ Cinematch, ການບໍລິການແນະນໍາຮູບເງົາໃຫ້ແກ່ລູກຄ້າ. ສໍາລັບການຍົກຕົວຢ່າງ, Cinematch ອາດຈະສັງເກດເຫັນວ່າທ່ານ liked Star Wars ແລະການໂຈມຕີ Empire ກັບຄືນໄປບ່ອນແລະຫຼັງຈາກນັ້ນແນະນໍາໃຫ້ທ່ານສັງເກດເບິ່ງກັບຄືນຂອງ Jedi. ໃນເບື້ອງຕົ້ນ, Cinematch ເຮັດວຽກບໍ່ດີພໍ. ແຕ່ວ່າ, ໃນໄລຍະຂອງເວລາຫຼາຍປີ, Cinematch ສືບຕໍ່ປັບປຸງຄວາມສາມາດຂອງຕົນໃນການຄາດຄະເນສິ່ງທີ່ຮູບເງົາລູກຄ້າຈະມີຄວາມສຸກ. ໂດຍ 2006, ຢ່າງໃດກໍຕາມ, ຄວາມຄືບຫນ້າ Cinematch plateaued. ນັກວິໄຈທີ່ Netflix ໄດ້ພະຍາຍາມທຸກສິ່ງທຸກຢ່າງ pretty ຫຼາຍພວກເຂົາເຈົ້າສາມາດຄິດວ່າ, ແຕ່ໃນເວລາດຽວກັນ, ພວກເຂົາເຈົ້າສົງໄສວ່າມີແນວຄວາມຄິດອື່ນໆທີ່ອາດຈະຊ່ວຍໃຫ້ເຂົາເຈົ້າປັບປຸງລະບົບຂອງເຂົາເຈົ້າ. ດັ່ງນັ້ນ, ພວກເຂົາເຈົ້າມີສິ່ງທີ່ມີ, ໃນເວລານັ້ນ, ການແກ້ໄຂຮາກ: ການເອີ້ນເປີດ.

ທີ່ສໍາຄັນເພື່ອຄວາມສໍາເລັດໃນທີ່ສຸດຂອງລາງວັນ Netflix ແມ່ນວິທີການທີ່ເອີ້ນເປີດຖືກອອກແບບແລະການອອກແບບນີ້ມີບົດຮຽນທີ່ສໍາຄັນສໍາລັບວິທີການໂທເປີດສາມາດໄດ້ຮັບການນໍາໃຊ້ສໍາລັບການຄົ້ນຄວ້າທາງສັງຄົມ. Netflix ບໍ່ພຽງແຕ່ເອົາໃຈໃສ່ການຮ້ອງຂໍບໍ່ມີໂຄງສ້າງສໍາລັບແນວຄວາມຄິດ, ຊຶ່ງເປັນສິ່ງທີ່ຈໍານວນຫຼາຍປະຊາຊົນຈິນຕະນາການໃນເວລາທີ່ພວກເຂົາເຈົ້າທໍາອິດທີ່ພິຈາລະນາເອີ້ນເປີດ. ແນ່ນອນວ່າ, Netflix ເກີດເປັນບັນຫາທີ່ຈະແຈ້ງທີ່ມີເງື່ອນໄຂການປະເມີນຜົນງ່າຍດາຍ: ພວກເຂົາເຈົ້າໄດ້ທ້າທາຍປະຊາຊົນທີ່ຈະນໍາໃຊ້ທີ່ກໍານົດໄວ້ຂອງ 100 ລ້ານອັດຕາການຮູບເງົາເປັນການຄາດຄະເນ 3 ລ້ານອັດຕາການຈັດຂຶ້ນໃນວັນອອກ (ອັດຕາການທີ່ຜູ້ໃຊ້ໄດ້ເຮັດໃຫ້ແຕ່ວ່າ Netflix ບໍ່ໄດ້ປ່ອຍ). ໃຜກໍ່ຕາມທີ່ສາມາດສ້າງເປັນວິທີການທີ່ຈະສາມາດຄາດຄະເນໄດ້ 3 ລ້ານອັດຕາການຈັດຂຶ້ນໃນວັນອອກ 10% ດີກ່ວາ Cinematch ຈະຊະນະ 1 ລ້ານໂດລາ. ນີ້ຊັດເຈນແລະງ່າຍທີ່ຈະນໍາໃຊ້ການປະເມີນຜົນເງື່ອນໄຂ, ການປຽບທຽບການຈັດອັນດັບຄາດຄະເນທີ່ຈະຈັດຂຶ້ນໃນວັນອອກອັດຕາການຫມາຍຄວາມວ່າໄດ້ຮັບລາງວັນ Netflix ໄດ້ framed ໃນວິທີທາງທີ່ແກ້ໄຂບັນຫາແມ່ນງ່າຍທີ່ຈະກວດສອບກ່ວາການຜະລິດເປັນ; ມັນໄດ້ຫັນສິ່ງທ້າທາຍຂອງການປັບປຸງ Cinematch ເຂົ້າໄປໃນບັນຫາທີ່ເຫມາະສົມສໍາລັບການໂທເປີດ.

ໃນເດືອນຕຸລາຂອງ 2006, Netflix ປ່ອຍອອກມາເມື່ອຂໍ້ມູນທີ່ປະກອບດ້ວຍ 100 ລ້ານອັດຕາການຮູບເງົາຈາກປະມານປະມານ 500,000 ລູກຄ້າ (ພວກເຮົາຈະພິຈາລະນາຜົນສະທ້ອນຄວາມເປັນສ່ວນຕົວຂອງການປ່ອຍຂໍ້ມູນນີ້ໃນບົດທີ 6). ຂໍ້ມູນ Netflix ສາມາດໄດ້ຮັບແນວຄວາມຄິດທີ່ເປັນມາ huge ວ່າແມ່ນປະມານລູກຄ້າ 500,000 by 20,000 ຮູບເງົາ. ພາຍໃນມາຕຣິກເບື້ອງນີ້, ມີປະມານ 100 ລ້ານອັດຕາການໃນລະດັບຈາກ 1 ຫາ 5 ດາວ (ຕາຕະລາງ 5.2) ໄດ້. ສິ່ງທີ່ທ້າທາຍແມ່ນເພື່ອນໍາໃຊ້ຂໍ້ມູນໄດ້ສັງເກດເຫັນໃນຕາຕະລາງໃນການຄາດຄະເນ 3 ລ້ານອັດຕາການຈັດຂຶ້ນໃນວັນອອກ.

ຕາຕະລາງ 5.2: Schematic ຂອງຂໍ້ມູນຈາກໄດ້ຮັບລາງວັນ Netflix. Netflix ປ່ອຍອອກມາເມື່ອປະມານ 100 ລ້ານອັດຕາການ (1 ດາວເຖິງ 5 ດາວ) ສະຫນອງໃຫ້ໂດຍລູກຄ້າ 500,000 on 20,000 ຮູບເງົາ. ເປົ້າຫມາຍຂອງລາງວັນ Netflix ແມ່ນເພື່ອນໍາໃຊ້ການຈັດອັນດັບການເຫຼົ່ານີ້ການຄາດຄະເນການຈັດອັນດັບຈັດຂຶ້ນໃນວັນອອກຂອງ 3 ລ້ານຮູບເງົາ, ສະແດງໃຫ້ເຫັນເປັນ "?". ການຈັດອັນດັບຄາດຄະເນໂດຍຜູ້ເຂົ້າຮ່ວມໃນລາງວັນ Netflix ໄດ້ເມື່ອປຽບທຽບກັບການຈັດອັນດັບຈັດຂຶ້ນໃນວັນອອກ. ຂ້າພະເຈົ້າຈະປຶກສາຫາລືບັນຫາດ້ານຈັນຍາບັນອ້ອມຂ້າງການປ່ອຍຂໍ້ມູນນີ້ໃນບົດທີ 6.
	ຮູບເງົາ 1	ຮູບເງົາ 2	ຮູບເງົາ 3	. . .	ຮູບເງົາ 20,000
ລູກຄ້າ 1	2	5		.	?
ລູກຄ້າ 2		2	?	.	3
ລູກຄ້າ 3		?	2	.
. . .	.	.	.	.	.
ລູກຄ້າ 500,000	?		2	.	1

ນັກຄົ້ນຄວ້າແລະແຮກເກີໃນທົ່ວໂລກໄດ້ຖືກກັນກັບສິ່ງທີ່ທ້າທາຍ, ແລະໃນປີ 2008 ຫລາຍກວ່າ 30,000 ຄົນໄດ້ຮັບການເຮັດວຽກກ່ຽວກັບມັນ (Thompson 2008) . ໃນໄລຍະຂອງການແຂ່ງຂັນນັ້ນ, Netflix ໄດ້ຮັບຫຼາຍກ່ວາ 40,000 ວິທີແກ້ໄຂການສະເຫນີຈາກຫຼາຍກ່ວາ 5,000 ທີມ (Netflix 2009) . ແນ່ນອນ, Netflix ບໍ່ສາມາດອ່ານແລະເຂົ້າໃຈວິທີແກ້ໄຂທັງຫມົດທີ່ສະເຫນີເຫຼົ່ານີ້. ການທົດສອບທັງຫມົດ ran ມົນ, ຢ່າງໃດກໍຕາມ, ເນື່ອງຈາກວ່າວິທີແກ້ໄຂແມ່ນງ່າຍດາຍເພື່ອກວດກາເບິ່ງ. Netflix ພຽງແຕ່ສາມາດມີຄອມພິວເຕີປຽບທຽບອັດຕາການຄາດຄະເນອັດຕາການຖືອອກໂດຍການເປັນ metric (metric ໂດຍສະເພາະຂອງພວກເຂົາເຈົ້ານໍາໃຊ້ເປັນຮາກຂອງຄວາມຜິດພາດຫມາຍຄວາມວ່າ, ມົນທົນໄດ້) ທາງສ່ວນຫນ້າຂອງກໍານົດໄວ້. ມັນແມ່ນຄວາມສາມາດຢ່າງວ່ອງໄວປະເມີນຜົນແກ້ໄຂບັນຫາທີ່ເຮັດໃຫ້ Netflix ທີ່ຈະຍອມຮັບການແກ້ໄຂຈາກທຸກຄົນ, ຊຶ່ງໄດ້ຫັນອອກຈະເປັນສິ່ງສໍາຄັນເນື່ອງຈາກວ່າຄວາມຄິດທີ່ດີມາຈາກສະຖານທີ່ແປກບາງ. ໃນຄວາມເປັນຈິງ, ການແກ້ໄຂຊະນະໄດ້ສະເຫນີໂດຍທີມງານທີ່ຕັ້ງຂຶ້ນໂດຍສາມນັກຄົ້ນຄວ້າທີ່ບໍ່ມີກ່ອນການກໍ່ສ້າງປະສົບການລະບົບການສະເຫນີຮູບເງົາ (Bell, Koren, and Volinsky 2010) .

ແຕ່ລັກສະນະທີ່ສວຍງາມຂອງໄດ້ຮັບລາງວັນ Netflix ແມ່ນວ່າມັນເຮັດໃຫ້ທຸກຄົນໃນໂລກທີ່ຈະມີການແກ້ໄຂຂອງພວກເຂົາປະເມີນຜົນພົບທົ່ວໄປ. ໃນເວລາທີ່ປະຊາຊົນການອັບ ratings ຄາດຄະເນຂອງເຂົາເຈົ້າ, ພວກເຂົາເຈົ້າບໍ່ຈໍາເປັນຕ້ອງອັບໂຫລດຂໍ້ມູນທາງວິຊາການຂອງເຂົາເຈົ້າ, ອາຍຸສູງສຸດ, ເຊື້ອຊາດ, ບົດບາດຍິງຊາຍ, ປະຖົມນິເທດທາງເພດ, ຫຼືສິ່ງໃດແດ່ຂອງເຂົາເຈົ້າກ່ຽວກັບຕົນເອງ. ດັ່ງນັ້ນ, ອັດຕາການຄາດຄະເນຂອງວິ famous ຈາກ Stanford ໄດ້ຮັບການຮັກແທ້ຄືກັນກັບຜູ້ທີ່ມາຈາກໄວຫນຸ່ມໃນຫ້ອງນອນຂອງນາງໄດ້. ແຕ່ຫນ້າເສຍດາຍ, ນີ້ບໍ່ແມ່ນຄວາມຈິງໃນການວິໄຈທາງສັງຄົມທີ່ສຸດ. ນັ້ນແມ່ນ, ສໍາລັບການຄົ້ນຄ້ວາສັງຄົມຫຼາຍທີ່ສຸດ, ການປະເມີນຜົນແມ່ນໃຊ້ເວລາຫຼາຍບໍລິສຸດແລະວິຊາການບາງສ່ວນ. ດັ່ງນັ້ນ, ແນວຄວາມຄິດການຄົ້ນຄວ້າທີ່ສຸດຈະບໍ່ມີວັນປະເມີນຜົນຢ່າງຮຸນແຮງ, ແລະໃນເວລາທີ່ແນວຄວາມຄິດແມ່ນການປະເມີນຜົນ, ມັນເປັນການຍາກທີ່ຈະຖອດປະເມີນຜົນຈາກເພື່ອນ E- ຂອງກົດຫມາຍ IDEA. ເນື່ອງຈາກວ່າວິທີແກ້ໄຂແມ່ນງ່າຍທີ່ຈະກວດສອບ, ການໂທເປີດອະນຸຍາດໃຫ້ນັກຄົ້ນຄວ້າໃນການເຂົ້າເຖິງທັງຫມົດວິທີແກ້ໄຂທີ່ມີທ່າແຮງທີ່ປະເສີດທີ່ຈະຫຼຸດລົງໂດຍຜ່ານການ Crack ໄດ້ຖ້າຫາກວ່າພວກເຂົາເຈົ້າພິຈາລະນາພຽງແຕ່ແກ້ໄຂບັນຫາຈາກອາຈານທີ່ມີຊື່ສຽງ.

ສໍາລັບການຍົກຕົວຢ່າງ, ຢູ່ໃນຈຸດຫນຶ່ງໃນລະຫວ່າງການຜູ້ໃດຜູ້ຫນຶ່ງຮັບລາງວັນ Netflix ທີ່ມີຊື່ຫນ້າຈໍ Simon Funk ຈັດພີມມາກ່ຽວກັບການເປັນການແກ້ໄຂຂອງຕົນສະເຫນີອີງໃສ່ການສະຫລາຍຕົວມູນຄ່າປະເພດ, ວິທີການຈາກພຶດຊະຄະນິດ, ຮູບແຂບທີ່ບໍ່ໄດ້ໃຊ້ມາຜູ້ເຂົ້າຮ່ວມອື່ນໆ. ຕອບ blog Funk ນີ້ພ້ອມໆກັນດ້ານວິຊາການແລະຂໍ້ມູນຂ່າວສານ weirdly. ໄດ້ຕອບ blog ນີ້ອະທິບາຍການແກ້ໄຂທີ່ດີຫຼືວ່າມັນສິ່ງເສດເຫຼືອຂອງທີ່ໃຊ້ເວລາ? ພາຍນອກຂອງໂຄງການເອີ້ນເປີດ, ການແກ້ໄຂອາດຈະບໍ່ໄດ້ຮັບການປະເມີນຜົນທີ່ຮ້າຍແຮງ. ຫຼັງຈາກທັງຫມົດ Simon Funk ບໍ່ໄດ້ເປັນອາຈານສອນຢູ່ Cal Tech ຫລື MIT; ເຂົາເປັນນັກພັດທະນາຊອຟແວທີ່, ໃນເວລານັ້ນ, ໄດ້ backpacking ປະມານນິວຊີແລນ (Piatetsky 2007) . ຖ້າຫາກວ່າລາວໄດ້ສົ່ງອີເມວຄວາມຄິດນີ້ຈະເປັນວິສະວະກອນ Netflix, ມັນເກືອບແນ່ນອນວ່າຈະບໍ່ໄດ້ຮັບການປະຕິບັດຢ່າງຮຸນແຮງ.

ໂຊກດີ, ເພາະວ່າເງື່ອນໄຂການປະເມີນຜົນໄດ້ຢ່າງຈະແຈ້ງແລະງ່າຍທີ່ຈະນໍາໃຊ້, ອັດຕາການຄາດຄະເນຂອງຕົນໄດ້ຮັບການປະເມີນຜົນ, ແລະມັນແມ່ນການທັນທີທີ່ຈະແຈ້ງວ່າວິທີການຂອງຕົນໄດ້ມີອໍານາດຫຼາຍມີ: ເຂົາ rocketed ກັບສະຖານທີ່ສີ່ໃນການແຂ່ງຂັນ, ຜົນໄດ້ຮັບທີ່ຍິ່ງໃຫຍ່ໃດຫນຶ່ງທີ່ທີມງານອື່ນໆໄດ້ຮັບການແລ້ວ ເຮັດວຽກສໍາລັບເດືອນທີ່ກ່ຽວກັບບັນຫາ. ໃນທີ່ສຸດ, ພາກສ່ວນຂອງວິທີການ Simon Funk ຂອງໄດ້ຖືກນໍາໃຊ້ໂດຍຄູ່ແຂ່ງທີ່ຮ້າຍແຮງ virtually ທັງຫມົດ (Bell, Koren, and Volinsky 2010) .

ຄວາມຈິງທີ່ວ່າ Simon Funk ເລືອກທີ່ຈະຂຽນຕອບ blog ໄດ້ອະທິບາຍວິທີການຂອງຕົນ, ແທນທີ່ຈະກ່ວາຄວາມພະຍາຍາມທີ່ຈະຮັກສາເປັນຄວາມລັບ, ຍັງສະແດງໃຫ້ເຫັນວ່າຜູ້ເຂົ້າຮ່ວມຈໍານວນຫຼາຍໃນລາງວັນ Netflix ບໍ່ໄດ້ຖືກກະຕຸ້ນໂດຍເສພາະໄດ້ຮັບລາງວັນລ້ານໂດລາ. ແນ່ນອນວ່າ, ເຂົ້າຮ່ວມຈໍານວນຫຼາຍຍັງເບິ່ງຄືວ່າຈະມີຄວາມສຸກສິ່ງທີ່ທ້າທາຍສິນທາງປັນຍາແລະຊຸມຊົນທີ່ພັດທະນາແກ້ໄຂບັນຫາໄດ້ (Thompson 2008) , ຄວາມຮູ້ສຶກທີ່ຂ້າພະເຈົ້າຄາດຫວັງວ່າການຄົ້ນຄ້ວາຫຼາຍຄົນສາມາດເຂົ້າໃຈ.

ໄດ້ຮັບລາງວັນ Netflix ແມ່ນເປັນຕົວຢ່າງຫມູ່ຂອງການໂທໄດ້. Netflix ຖາມທີ່ມີເປົ້າຫມາຍສະເພາະ (ການຄາດການຈັດອັນດັບຮູບເງົາ) ແລະການຮ້ອງຂໍການແກ້ໄຂຈາກຫລາຍ ໆ ຄົນ. Netflix ແມ່ນສາມາດທີ່ຈະປະເມີນຜົນແກ້ໄຂບັນຫາທັງຫມົດເຫຼົ່ານີ້ເນື່ອງຈາກວ່າພວກເຂົາເຈົ້າໄດ້ງ່າຍທີ່ຈະກວດສອບກ່ວາການສ້າງ, ແລະສຸດທ້າຍແລ້ວ Netflix ເກັບໄດ້ການແກ້ໄຂທີ່ດີທີ່ສຸດ. ຕໍ່ໄປ, ຂ້າພະເຈົ້າຈະສະແດງໃຫ້ທ່ານວິທີການວິທີການດຽວກັນນີ້ສາມາດຖືກນໍາໃຊ້ໃນຊີວະສາດແລະກົດຫມາຍ.