4.6.1创建零可变成本数据

运行大型实验的关键是将可变成本降至零。实现这一目标的最佳方法是自动化和设计愉快的实验。

数字实验可以具有截然不同的成本结构,这使研究人员能够进行过去不可能进行的实验。考虑这种差异的一种方法是注意实验通常有两种类型的成本:固定成本和可变成本。 固定成本是指无论参与人数多少都保持不变的成本。例如,在实验室实验中,固定成本可能是租用空间和购买家具的成本。另一方面, 可变成本根据参与者的数量而变化。例如,在实验室实验中,可变成本可能来自支付员工和参与者。通常,模拟实验具有低固定成本和高可变成本,而数字实验具有高固定成本和低可变成本(图4.19)。尽管数字实验具有较低的可变成本,但当您将可变成本一直推向零时,您可以创造许多令人兴奋的机会。

图4.19:模拟和数字实验中的成本结构示意图。通常,模拟实验具有低固定成本和高可变成本,而数字实验具有高固定成本和低可变成本。不同的成本结构意味着数字实验可以以模拟实验无法实现的规模运行。

图4.19:模拟和数字实验中的成本结构示意图。通常,模拟实验具有低固定成本和高可变成本,而数字实验具有高固定成本和低可变成本。不同的成本结构意味着数字实验可以以模拟实验无法实现的规模运行。

向员工支付可变成本支付和向参与者支付有两个主要因素 - 使用不同的策略可以将这些元素中的每一个驱动为零。对员工的付款源于研究助理确实招募参与者,提供治疗和衡量结果的工作。例如,Schultz及其同事(2007)关于用电的模拟现场实验要求研究助理前往每个家庭进行治疗并阅读电表(图4.3)。研究助理的所有这些努力意味着在研究中增加一个新家庭会增加成本。另一方面,对于Restivo和van de Rijt (2012)关于奖项对维基百科编辑的影响的数字现场实验,研究人员可以几乎免费增加更多参与者。减少可变管理成本的一般策略是用计算机工作(廉价)取代人类工作(这是昂贵的)。粗略地说,你可以问问自己:当我的研究团队中的每个人都在睡觉时,这个实验能够运行吗?如果答案是肯定的,那么您在自动化方面做得很好。

第二种主要的可变成本是向参与者付款。一些研究人员使用亚马逊机械土耳其人和其他在线劳动力市场来减少参与者所需的付款。然而,为了将可变成本一直推向零,需要采用不同的方法。很长一段时间,研究人员设计的实验非常无聊,他们必须付钱给人们参与。但是如果你能创造一个人们想要进入的实验呢?这可能听起来很牵强,但我会从我自己的工作中给出一个例子,表4.4中有更多的例子。请注意,这种设计愉快实验的想法与第3章中关于设计更有趣的调查和第5章关于大规模协作设计的一些主题相呼应。因此,我认为参与者的享受 - 也可能被称为用户体验 - 将成为数字时代研究设计中越来越重要的一部分。

表4.4:零可变成本的实验示例,用于补偿具有有价值服务或愉快体验的参与者。
赔偿金 参考
有健康信息的网站 Centola (2010)
锻炼计划 Centola (2011)
免费音乐 Salganik, Dodds, and Watts (2006) ; Salganik and Watts (2008) ; Salganik and Watts (2009b)
好玩的游戏 Kohli et al. (2012)
电影推荐 Harper and Konstan (2015)

如果您想创建零可变成本数据的实验,您需要确保一切都是完全自动化的,并且参与者不需要任何付款。为了说明这是如何可能的,我将描述我对文化产品成败的论文研究。

我的论文的动机是文化产品成功的令人费解的本质。热门歌曲,畅销书籍和大片电影比普通电影更成功。因此,这些产品的市场通常被称为“赢家通吃”市场。然而,与此同时,哪些特定的歌曲,书籍或电影将成功是令人难以置信的不可预测的。编剧威廉·戈德曼(1989) William Goldman (1989)优雅地总结了许多学术研究,他说,在预测成功时,“没有人知道任何事情。”赢家通吃市场的不可预测性使我想知道结果取得多大成功质量和运气多少。或者,表达方式略有不同,如果我们可以创建并行世界并让它们全部独立发展,那么相同的歌曲会在每个世界中变得流行吗?而且,如果没有,可能是导致这些差异的机制是什么?

为了回答这些问题,我们 - Peter Dodds,Duncan Watts(我的论文顾问)和我进行了一系列在线实地试验。特别是,我们建立了一个名为MusicLab的网站,人们可以在那里发现新的音乐,我们将其用于一系列实验。我们通过在青少年兴趣网站上运行横幅广告(图4.20)并通过媒体提及来招募参与者。到达我们网站的参与者提供了知情同意书,完成了一份简短的背景调查问卷,并被随机分配到两个实验条件中的一个 - 独立和社会影响。在独立的条件下,参与者只决定乐队的名字和歌曲,决定听哪些歌曲。在听一首歌时,参与者被要求对其进行评分,之后他们有机会(但没有义务)下载这首歌。在社交影响条件下,参与者具有相同的体验,除了他们还可以看到先前参与者下载了多首歌。此外,社会影响条件的参与者被随机分配到八个平行世界中的一个,每个世界独立进化(图4.21)。使用这种设计,我们进行了两个相关的实验。在第一部分中,我们以未分类的网格向参与者展示了歌曲,这为他们提供了一个微弱的流行信号。在第二个实验中,我们将这些歌曲列在排名列表中,这提供了一个更强大的受欢迎信号(图4.22)。

图4.20:我和我的同事用来为MusicLab实验招募参与者的横幅广告示例(Salganik,Dodds和Watts 2006)。经Salganik(2007)许可转载,图2.12。

图4.20:我和我的同事用来为MusicLab实验招募参与者的横幅广告示例(Salganik, Dodds, and Watts 2006) Salganik (Salganik, Dodds, and Watts 2006) 。经Salganik (2007)许可转载,图2.12。

图4.21:MusicLab实验的实验设计(Salganik,Dodds和Watts 2006)。参与者被随机分配到两个条件之一:独立和社会影响。处于独立状态的参与者做出了他们的选择,而没有任何其他人做过的信息。社交影响条件下的参与者被随机分配到八个平行世界中的一个,在那里他们可以看到他们世界中每首歌曲的先前参与者的下载所衡量的受欢迎程度,但他们看不到任何有关的信息,也没有看到甚至知道任何其他世界的存在。改编自Salganik,Dodds和Watts(2006),图s1。

图4.21:MusicLab实验的实验设计(Salganik (Salganik, Dodds, and Watts 2006) 。参与者被随机分配到两个条件之一:独立和社会影响。处于独立状态的参与者做出了他们的选择,而没有任何其他人做过的信息。社交影响条件下的参与者被随机分配到八个平行世界中的一个,在那里他们可以看到他们世界中每首歌曲的先前参与者的下载所衡量的受欢迎程度,但他们看不到任何有关的信息,也没有看到甚至知道任何其他世界的存在。改编自Salganik, Dodds, and Watts (2006) ,图s1。

我们发现这些歌曲的受欢迎程度在世界各地不同,这表明运气在成功中发挥了重要作用。例如,在一个世界中,52Metro的歌曲“Lockdown”在48首歌曲中排名第一,而在另一个世界中,它排在第40位。这是与同一首其他歌曲竞争的完全相同的歌曲,但在一个世界中它很幸运,而在其他世界中则没有。此外,通过比较两个实验的结果,我们发现社会影响力增加了这些市场的赢者通吃性质,这可能暗示了技能的重要性。但是,纵观世界(在这种平行世界的实验之外无法做到),我们发现社会影响实际上增加了运气的重要性。此外,令人惊讶的是,这是最具吸引力的歌曲,其中运气最重要(图4.23)。

图4.22:MusicLab实验中社会影响条件的截图(Salganik,Dodds和Watts 2006)。在实验1中的社交影响条件中,将歌曲以及先前下载的数量呈现给以16×3矩形网格排列的参与者,其中为每个参与者随机分配歌曲的位置。在实验2中,社交影响条件的参与者被显示具有下载计数的歌曲,以当前流行度的降序呈现在一列中。

图4.22:MusicLab实验中社会影响条件的截图(Salganik, Dodds, and Watts 2006) Salganik (Salganik, Dodds, and Watts 2006) 。在实验1的社交影响条件下,歌曲以及先前下载的数量被呈现给排列在16 \(\times\) 3矩形网格中的参与者,其中歌曲的位置被随机分配给每个参与者。在实验2中,社交影响条件的参与者被显示具有下载计数的歌曲,以当前流行度的降序呈现在一列中。

图4.23:MusicLab实验的结果显示了吸引力与成功之间的关系(Salganik,Dodds和Watts 2006)。 x轴是独立世界中歌曲的市场份额,它可以衡量歌曲的吸引力,y轴是八个社会影响世界中同一首歌的市场份额。作为歌曲成功的衡量标准。我们发现,增加参与者所经历的社会影响 - 特别是从实验1到实验2(图4.22)的布局变化 - 成功变得更加难以预测,特别是对于具有最高吸引力的歌曲。改编自Salganik,Dodds和Watts(2006),图3。

图4.23:MusicLab实验的结果显示了吸引力与成功之间的关系(Salganik, Dodds, and Watts 2006)\(x\) axis是独立世界中歌曲的市场份额,它可以衡量歌曲的吸引力,而\(y\) axis是同一首歌的市场份额。八个社会影响世界,它们可以衡量歌曲的成功。我们发现,增加参与者所经历的社会影响 - 特别是从实验1到实验2(图4.22)的布局变化 - 成功变得更加难以预测,特别是对于具有最高吸引力的歌曲。改编自Salganik, Dodds, and Watts (2006) ,图3。

由于设计的方式,MusicLab能够以基本为零的可变成本运行。首先,一切都是完全自动化的,所以它能够在我睡觉时运行。其次,补偿是免费音乐,因此没有可变的参与者补偿费用。使用音乐作为补偿也说明了有时在固定成本和可变成本之间进行权衡。使用音乐增加了固定成本,因为我不得不花时间获得乐队的许可,并为他们准备关于参与者对音乐的反应的报道。但在这种情况下,增加固定成本以降低变量成本是正确的做法;这使我们能够进行比标准实验室实验大约100倍的实验。

此外,MusicLab实验表明零可变成本本身并不一定是目的;相反,它可以成为运行新实验的一种手段。请注意,我们并未使用所有参与者进行100次标准社交影响实验室实验。相反,我们做了一些不同的事情,您可以将其视为从心理学实验转向社会学实验(Hedström 2006) 。我们不是专注于个人决策,而是将我们的实验集中在受欢迎程度上,这是一个集体结果。这转换为集体结果意味着我们需要大约700名参与者来生成单个数据点(每个并行世界中有700人)。由于实验的成本结构,这种规模才有可能实现。一般而言,如果研究人员想要研究集体结果是如何从个人决策中产生的,那么像MusicLab这样的小组实验非常令人兴奋。过去,它们在后勤方面很困难,但由于零可变成本数据的可能性,这些困难正在逐渐消失。

除了说明零可变成本数据的好处之外,MusicLab实验还显示了这种方法的挑战:高固定成本。就我而言,我非常幸运能够与一位名叫Peter Hausel的有才华的网络开发人员一起工作大约六个月来构建实验。这是唯一可能的,因为我的顾问Duncan Watts已经获得了许多资助来支持这种研究。自2004年我们建立MusicLab以来,技术已有所改进,因此现在建立这样的实验要容易得多。但是,高固定成本策略实际上只有能够以某种方式弥补这些成本的研究人员才有可能。

总之,数字实验可以具有与模拟实验截然不同的成本结构。如果你想进行非常大的实验,你应该尝试尽可能地降低可变成本,理想情况下一直到零。你可以通过自动化实验的机制(例如,用计算机时间替换人类时间)和设计人们想要进入的实验来做到这一点。能够设计具有这些功能的实验的研究人员将能够运行新的实验。过去不可能。然而,创建零可变成本实验的能力可以引发新的道德问题,我现在将讨论这个问题。