5.3.1 Netflix的奖

这种翻译是由一个计算机创建。 ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

5.3.1 Netflix的奖

Netflix的奖采用公开征集来预测人们会喜欢这电影。

最广为人知的公开征集项目是Netflix的奖。 Netflix公司是一个在线电影租赁公司，并于2000年它推出Cinematch，服务推荐电影给客户。例如，Cinematch可能会注意到，你喜欢星球大战 帝国反击 ，然后推荐你看绝地归来 。最初，Cinematch不好的工作。但是，经过多年的历程，Cinematch继续提高其预测客户喜欢什么样的电影的能力。到2006年，但是，在Cinematch进度趋于稳定。 Netflix的研究人员曾尝试他们能想到的几乎一切，但在同一时间，他们怀疑还有其他的想法来帮助他们提高他们的系统。于是，他们想出了什么，在那个时候，根本的解决办法：公开征集。

关键Netflix的奖的最终成功是公开征集是如何设计的，这种设计有如何打开调用可用于社会研究重要的教训。 Netflix的不只是放出来的想法非结构化的请求，这是很多人的想象时，他们首先考虑公开征集。相反，Netflix公司提出了一个简单的评价标准明确的问题：他们挑战的人是使用一套亿电影等级的预测3000000持有评级出来（用户取得了收视率，但认为Netflix公司没有公布）。任何人谁可以创建一种算法，可以预测300万的持有评级从10％优于Cinematch将赢得1万块钱。这个清晰的，易于使用的评估标准，对比预测评级持有评级出来，意味着Netflix的奖是在这样一种方式，解决方案易于检查不是生成框架;原来提高Cinematch成适合公开征集问题的挑战。

在2006年10月，Netflix公司公布的含亿的电影收视率从大约50万左右的客户（我们会考虑这个数据发布的第6章中的隐私问题）的数据集。 Netflix的数据可以被概括为这是大约500,000客户20000电影的巨大的矩阵。在这个矩阵中，有从1到5星（见表5.2）规模约100万的收视。面临的挑战是要使用的观测到的数据中的矩阵来预测300万持有出的评分。

表5.2：从Netflix大奖的数据示意图。 Netflix公司公布了50万客户20,000电影提供了约100万的收视（1星到5星）。 Netflix的奖的目的是利用这些评级来预测300万的电影，显示为“？”的持有评级出来。在Netflix的奖与会者提交预测收视率进行了比较，持有了评级。我将讨论围绕在第6章这个数据发布的伦理问题。
	电影1	电影2	电影3	。。。	电影20000
客户1	2	五		。	？
客户2		2	？	。	3
客户3		？	2	。
。。。	。	。	。	。	。
客户50万	？		2	。	1

世界各地的研究人员和黑客被吸引到这一挑战，并于2008年超过3万人的工作就可以了(Thompson 2008) 。在比赛的过程中，Netflix公司收到4万多提出的解决方案，从5000多的球队(Netflix 2009) 。显然，Netflix公司无法阅读和理解所有这些提出的解决方案。整个事情顺利运行，但是，因为解决方案很容易检查。 Netflix的可能只是有一台电脑通过预先指定的度量标准（具体他们使用是均方误差的平方根指标）比较预测评级至持有评级出来。正是这种能力，快速评估的启用Netflix的接受大家，这竟然是重要的，因为好的创意一些令人惊讶的地方就解决方案。事实上，成功的解决方案提交由三名研究人员说有没有现成的经验建设电影推荐系统开始一队(Bell, Koren, and Volinsky 2010)

Netflix的奖的一个美丽的方面是，它使世界上每个人都有自己的解决方案进行评估比较。当人们上传自己的预测收视率，他们并不需要上传自己的学历，年龄，种族，性别，性取向，或对自己的东西。因此，从斯坦福大学著名教授的预测评级被视为完全一样，那些在她的卧室一个少年。不幸的是，这是不是在大多数社会研究真。也就是说，对于大多数的社会研究，评估是非常耗时和部分主观的。所以，大多数研究的想法是从来没有认真评估，而当想法进行评估，这是很难从思想的创造者分离这些评估。由于解决方案易于检查，请打开调用允许研究人员访问所有的潜在精彩的解决方案，会漏掉，如果他们只考虑从知名教授的解决方案。

例如，在Netflix的奖有人用网名在一个点西门芬克在他的博客中提议的解决方案发布基于奇异值分解，线性代数是没有被其他参与者以前使用的方法。芬克的博客文章是同时技术和古怪非正式的。在这个博客帖子描述了一个好的解决方案，抑或是在浪费时间？公开征集的项目之外，该解决方案可能永远不会收到认真的评估。毕竟西蒙芬克是不是在加州理工学院或者麻省理工学院的教授;他是一名软件开发人员是谁，在当时，围绕新西兰背包(Piatetsky 2007)如果他通过电子邮件发送这个想法在Netflix公司的工程师，它几乎肯定不会被重视。

幸运的是，由于评价标准清晰，容易申请，他的预测收视率进行了评价，这是瞬间清晰，他的做法是非常强大的，他以火箭般的在竞争第四名，一个巨大的结果给其他球队早已经被工作的问题月。最终，西蒙芬克的做法部分是由几乎所有的严重竞争对手使用的(Bell, Koren, and Volinsky 2010)

西蒙芬克选择写博客文章，解释他的做法，而不是试图保持它的秘密，这一事实也说明，在Netflix的奖很多参与者并没有被百万美元的奖金完全激发。相反，许多与会者似乎也享受智力挑战和解决该问题制定的社会(Thompson 2008) ，我想到许多研究人员能够理解的心情。

Netflix的奖是一个开放调用的一个典型的例子。 Netflix公司提出了一个问题与特定的目标（预测电影等级），并从许多人征求解决方案。 Netflix公司能够评估所有这些解决方案，因为他们更容易验证，而不是创造，最终Netflix的选择了最佳的解决方案。接下来，我将告诉你如何同样的方法可以在生物学和法的规定使用。