5.3.1 Netflix Ödülü

Netflix Ödülü insanlar gibi hangi filmler tahmin açık çağrısını kullanır.

en iyi bilinen açık çağrı projesi Netflix Ödülü olduğunu. Netflix bir online film kiralama şirketi olduğunu ve 2000 yılında müşterilerine filmleri tavsiye Cinematch, bir hizmet başlattı. Örneğin, Cinematch Back ve sonra Jedi geri izlemenizi tavsiye ederiz Star Wars Empire Strikes sevdim fark edebilirsiniz. Başlangıçta, Cinematch kötü çalıştı. Ancak, uzun yıllar boyunca, Cinematch müşterilerin zevk ne filmleri tahmin kabiliyetini geliştirmeye devam. 2006 yılına gelindiğinde, Cinematch ilerleme plato. Netflix araştırmacılar onlar düşünebildiğim hemen hemen her şeyi denedim, ama aynı zamanda, onları kendi sistemini geliştirmeye yardımcı olabilecek diğer fikirler olduğunu şüphelendim. Açık çağrı: Böylece, o zamanlar, ne radikal bir çözüm geldi.

Netflix Ödülü nihai başarısı için kritik açık çağrı tasarlanmıştır nasıl oldu ve bu tasarım, sosyal araştırmalar için nasıl kullanılabileceğini açık çağrılar için önemli dersler vardır. Netflix sadece ilk açık çağrıyı düşünün birçok kişi hayal ne fikirler için yapılandırılmamış isteği, koymadı. Aksine, Netflix, basit bir değerlendirme kriterlerine açık bir sorun teşkil: Onlar 3 milyon tutulan çıkış derecelendirme tahmin etmek 100 milyon film değerlendirmesi bir dizi kullanmak için insanları meydan (kullanıcılar yapmıştı derecelendirme ama Netflix serbest vermedi). Cinematch, 1 milyon dolar kazanacaktı% 10 daha iyi 3 milyon tutulan dışarı derecelendirme tahmin edebiliyordu bir algoritma oluşturabilir herkes. Bu açık ve kolay değerlendirme tutulacak dışarı tahmin derecelendirme kriterleri-karşılaştırarak uygulamak için Netflix Ödülü çözümler üretmek daha kontrol etmek kolay şekilde çerçeveli olduğu değerlendirmesi niyetli; açık bir çağrı için uygun bir sorun haline Cinematch iyileştirilmesi meydan döndü.

2006 yılının Ekim ayında, Netflix (biz 6. Bölümde bu veriler sürüm gizlilik etkileri dikkate alacaktır) yaklaşık yaklaşık 500.000 müşterilerden 100 milyon film derecelendirme içeren bir veri kümesi yayınladı. Netflix veriler 20,000 film tarafından yaklaşık 500.000 müşteriler büyük bir matris olarak kavramsallaştırılabilir. Bu matriks içinde, 1 ile 5 yıldızlı (Tablo 5.2) arasında bir ölçekte yaklaşık 100 milyon değerlendirme vardı. meydan 3 milyon tutulan çıkış derecelendirme tahmin etmek matris içinde gözlemlenen verileri kullanmak olmuştur.

Tablo 5.2: Netflix Ödülü verilerin şematik. Netflix 20,000 filmler 500.000 müşteriler tarafından sağlanan yaklaşık 100 milyon derecelendirme (1 yıldız 5 yıldız) yayınladı. Netflix Ödülü amacı "?" Olarak gösterilen 3 milyon filmleri, düzenlenen dışarı derecelendirme tahmin etmek bu derecelendirme kullanmak olmuştur. Netflix Ödülü katılımcılar tarafından sunulan Öngörülen derecelendirme tutulacak dışarı değerlendirmesi ile karşılaştırıldı. Ben Bölüm 6 bu veri serbest çevreleyen etik sorunları ele alacak.
Film 1 Film 2 Film 3 . . . Film 20,000
Müşteri 1 2 5 . ?
Müşteri 2 2 ? . 3
Müşteri 3 ? 2 .
. . . . . . . .
Müşteri 500.000 ? 2 . 1

Dünyada Araştırmacılar ve korsanlara mücadeleye çizildi ve 2008 yılına kadar 30.000 'den fazla kişi üzerinde çalışıyorlardı (Thompson 2008) . Yarışmanın boyunca, Netflix 5.000 'den fazla ekipleri 40.000' den fazla önerilen çözümler alınan (Netflix 2009) . Açıkçası, Netflix okumak ve tüm bu önerilen çözüm anlayamadık. çözümler kontrol etmek kolay çünkü her şey, ancak, sorunsuz çalıştı. Netflix sadece bir bilgisayar önceden belirlenmiş metrik (onlar ortalama karesel hata karekökü oldu kullanılan belirli metrik) tarafından düzenlenen dışarı değerlendirmesi tahmin derecelendirme karşılaştırmak olabilir. Hızla iyi fikirler bazı şaşırtıcı yerlerden geldi çünkü önemli olduğu ortaya çıktı herkes, çözümler kabul etmek Netflix özellikli çözümler değerlendirmek için bu yeteneği oldu. Aslında, kazanan çözüm no önceden deneyim bina movie öneri sistemlerine olan üç araştırmacı tarafından başlatılmış bir ekip tarafından sunuldu (Bell, Koren, and Volinsky 2010) .

Netflix Ödülü birinin güzel yönü çözüm oldukça değerlendirilmelidir var dünyada herkesin etkin olmasıdır. insanların tahmin derecelendirme yükledi, onların akademik kimlik bilgilerini, kendileri hakkında yaşları, ırk, cinsiyet, cinsel yönelim, ya da bir şey yüklemek gerek yoktu. Böylece, Stanford ünlü bir profesör tahmin derecelendirme tam onu ​​yatak odasında bir genç gelenler aynı tedavi edildi. Ne yazık ki, bu en sosyal araştırmalarda doğru değildir. Bu en sosyal araştırma için, değerlendirme çok zaman alıcı ve kısmen sübjektif olduğunu. Yani, çoğu araştırma fikirleri ciddiye değerlendirilir asla ve fikirlerin değerlendirildiği zaman, fikirlerin yaratıcısı bu değerlendirmeler ayırmak zordur. çözümler kontrol etmek kolay olduğundan, açık çağrılar araştırmacılar sadece ünlü hocalardan çözümler görüldüğü takdirde çatlaklar aracılığıyla düşeceği tüm potansiyel harika çözümler erişmesine izin.

Örneğin, ekran adı ile Netflix Ödülü birisi sırasında bir noktada Simon Funk bir tekil değer ayrışımı dayalı onun blog önerilen çözümün yayınlanan, diğer katılımcılar tarafından daha önce kullanılmış olmasaydı lineer cebir bir yaklaşım. Funk blog yazısı aynı anda teknik ve esrarlı gayrı oldu. Bu blog yazısı iyi bir çözüm açıklayan ya da zaman kaybı oldu? Açık çağrı projesinin dışında, çözümü ciddi değerlendirme almış asla olabilir. Tüm Simon Funk Cal Tech ya da MIT'de profesör değildi sonra; O anda, Yeni Zelanda etrafında backpacking, bir yazılım geliştiricisi oldu (Piatetsky 2007) . O Netflix bir mühendis bu fikri gönderilecektir olsaydı, neredeyse kesinlikle ciddiye alınması olmazdı.

Değerlendirme kriterleri açık ve kolay uygulanabilir olması nedeniyle Neyse, onun tahmin derecelendirme değerlendirildi ve onun yaklaşımı çok güçlü olduğunu anında açıktı: o yarışmada dördüncü sıraya fırladı, muazzam bir sonuç diğer takım zaten olmuştu verilen sorun üzerinde aylarca çalışarak. Sonunda, Simon Funk yaklaşımının parçaları hemen hemen tüm ciddi rakipleri tarafından kullanıldı (Bell, Koren, and Volinsky 2010) .

Simon Funk oldukça gizli tutmak için çalışmak yerine, onun yaklaşımı açıklayan bir blog yazısı yazmak için seçtim olması, ayrıca Netflix Ödülü birçok katılımcı sadece milyon dolarlık ödül ile motive olmadığını göstermektedir. Aksine, pek çok katılımcı da entelektüel meydan okuma ve problem etrafında gelişen topluluk zevk gibiydi (Thompson 2008) , birçok araştırmacı anlayabiliyorum bekliyoruz duygular.

Netflix Ödülü açık çağrı klasik bir örneğidir. Netflix (film derecelendirme tahmin), belirli bir hedefi olan bir soru yöneltilen ve birçok kişi çözümler İstenen. onlar oluşturmak için daha doğrulamak için kolay çünkü Netflix tüm bu çözümleri değerlendirme başardı ve sonuçta Netflix en iyi çözümü aldı. Bu aynı yaklaşım biyoloji ve hukuk nasıl kullanılabileceğini Sonra, ben size göstereceğim.