4.2 آزمایش چیست؟

آزمایش های کنترل شده تصادفی چهار مواد تشکیل دهنده اصلی: استخدام شرکت کنندگان، تصادفی از درمان، تحویل از درمان، و اندازه گیری نتایج.

آزمایش های تصادفی کنترل شامل چهار ماده اصلی است: استخدام شرکت کنندگان، تصادفی سازی درمان، تحویل درمان و اندازه گیری نتایج. عصر دیجیتال ماهیت بنیادی آزمایشات را تغییر نمی دهد، اما از لحاظ منطقی آسان تر می شود. برای مثال، در گذشته، ممکن است دشوار است که رفتار میلیونها نفر را اندازه گیری کند، اما اکنون در بسیاری از سیستم های دیجیتال به طور مرتب اتفاق می افتد. محققانی که می توانند چگونگی استفاده از این فرصت های جدید را بیاموزند قادر خواهند بود تا آزمایشاتی را انجام دهند که قبلا غیر ممکن بود.

برای این که همه چیز کمی بیشتر بتن باشد، هر چه همان چیزی باقی می ماند و آنچه تغییر کرده است، بگذارید یک آزمایش مایکل Restito و Arnout van de Rijt (2012) بگیریم. آنها می خواستند تا اثر پاداش های غیررسمی همکارانه را در مورد کمک های سرمقاله به ویکی پدیا درک کنند. به ویژه، آنها به بررسی اثرات barnstars ، یک جایزه که هر یک از ویکی پدیا می تواند به هر ویکیپدیا دیگر به رسمیت شناختن کار سخت و due diligence. Restivo و Van de Rijt به 100 برنده ویکی پدیا کمک کردند. سپس، آنها بعد از دریافت کمکهای بعدی به ویکیپدیا طی 90 روز آینده ردیابی کردند. به خاطر تعجب آنها، افرادی که به آنها اهدا کرد، تمایل داشتند که پس از دریافت یک ویرایش، کمتر ویرایش کنند. به عبارت دیگر، barnstars به ​​جای تشویق سهم به نظر می رسد دلسرد کننده است.

خوشبختانه Restivo و Van de Rijt آزمایش "تحریک و رعب و وحشت" را اجرا نکردند؛ آنها یک آزمایش تصادفی کنترل شده را اجرا کردند. بنابراین، علاوه بر انتخاب 100 همکاران برتر برای دریافت یک برنشتار، آنها همچنین 100 عضو برتر را انتخاب کردند که به آنها آنها را نداده است. این 100 نفر به عنوان یک گروه کنترل خدمت کردند. و به طور انتقادی، که در گروه درمان بود و در گروه کنترل بود به صورت تصادفی تعیین شد.

وقتی Restivo و ون د رییت به رفتار افراد در گروه کنترل نگاه کردند، آنها دریافتند که مشارکت آنها نیز کاهش می یابد. علاوه بر این، هنگامی که Restivo و Van de Rijt مردم را در گروه درمان (به عنوان مثال، دریافت barnstars) را به افراد در گروه کنترل مقایسه کردند، آنها دریافتند که افراد در گروه درمان حدود 60٪ بیشتر کمک می کنند. به عبارت دیگر، مشارکت هر دو گروه فریب خوردگی بود، اما گروه کنترل خیلی سریعتر انجام دادند.

همانطور که این مطالعه نشان می دهد، گروه کنترل در آزمایش ها به گونه ای است که تقریبا پارادوکسانه است. Restivo و Van de Rijt به منظور دقیق اندازه گیری اثر barnstars مورد نیاز برای مشاهده افرادی که barnstars دریافت نکرده بودند. بسیاری از محققان که با آزمایش ها آشنا نیستند، ارزش باورنکردنی گروه کنترل را درک نمی کنند. اگر Restivo و Van de Rijt گروه کنترل نداشته باشند، آنها دقیقا نتیجه نادرستی را به دست خواهند آورد. گروه های کنترل بسیار مهم هستند که مدیر عامل شرکت بزرگ کازینو گفته است که تنها سه راه وجود دارد که کارکنان را از شرکت خود اخراج می کنند: برای سرقت، آزار و اذیت جنسی، یا برای اجرای آزمایش بدون گروه کنترل (Schrage 2011) .

مطالعه Restivo و ون د ریت چهار عامل اصلی آزمایش را نشان می دهد: استخدام، تصادفی، مداخله و نتایج. با هم، این چهار ماده می تواند دانشمندان را به سمت فراتر از همبستگی حرکت دهد و اثر علمی درمان را اندازه گیری کند. به طور خاص، تصادفی بدان معنی است که افراد در گروه درمان و کنترل مشابه خواهند بود. این مهم است زیرا به این معنی است که هر گونه تفاوت در نتایج بین دو گروه می تواند به درمان و نه مخدوش شود.

علاوه بر اینکه یک تصویر خوب از مکانیک آزمایش هاست، مطالعه Restivo و ون د ریت نیز نشان می دهد که تدارکات آزمایش های دیجیتال می تواند کاملا متفاوت از آزمایشات آنالوگ باشد. در آزمایش Restivo و ون د ریت، آسان ساختن برنستار به هر کسی بود، و آسان شدن پیگیری تعداد نتایج ویرایشها در مدت زمان طولانی (به دلیل تاریخ ویرایش به طور خودکار توسط ویکیپدیا ثبت شده است). این توانایی برای ارائه درمان و اندازه گیری نتایج بدون هیچ هزینه ای کیفیتی متفاوت با آزمایشات گذشته است. اگر چه این آزمایش 200 نفر را شامل می شد، می توانست با 2000 یا حتی 20،000 نفر اجرا شود. نکته اصلی این است که محققان از افزایش تجربه خود با فاکتور 100 هزینه ای نداشته باشند؛ اخلاق بود به این ترتیب، Restivo و ون د رییت نمیخواستند به مرورگرها اجازه ندهند که ویرایشگرها را نادیده بگیرند و نمیخواستند تجربه خود را برای برهم زدن جامعه ویکیپدیا (Restivo and Rijt 2012, 2014) . من به برخی از ملاحظات اخلاقی مطرح شده توسط آزمایشات بعد در این فصل و در فصل 6 بازگشت.

در نتیجه، آزمایش Restivo و ون د ریت به وضوح نشان می دهد که در حالی که منطق پایه آزمایشات تغییر نکرده است، تدارکات آزمایش های دیجیتال سن می تواند به طور چشمگیری متفاوت باشد. بعد، به منظور واضح تر شدن فرصت های ایجاد شده توسط این تغییرات، من امتحان هایی را که محققان می توانند در حال حاضر با انواع آزمایش هایی که در گذشته انجام می شود، مقایسه کنند.