4.2 Kio estas eksperimentoj?

Randomigitaj kontrolitaj eksperimentoj havas kvar ĉefajn ingrediencojn: reclutamiento de partoprenantoj, aleatorización de traktado, livero de kuracado, kaj mezurado de rezultoj.

Hazarde kontrolitaj eksperimentoj havas kvar ĉefajn ingrediencojn: reclutado de partoprenantoj, hazardigo de traktado, liverado de traktado kaj mezurado de rezultoj. La cifereca aĝo ne ŝanĝas la fundamentan naturon de la eksperimentado, sed ĝi faras ĝin pli facile logike. Ekzemple, en la pasinteco, eble estus malfacile mezuri la konduton de milionoj da homoj, sed tio nun okazas rutine en multaj ciferecaj sistemoj. Esploristoj, kiuj povas eltrovi kiel plibonigi ĉi tiujn novajn ŝancojn, povos ekzekuti eksperimentojn, kiuj antaŭe neeblis.

Por fari ĉi tion iom pli konkrete - ambaŭ, kio restis same kaj kio ŝanĝis - ni konsideras eksperimenton fare de Michael Restivo kaj Arnout van de Rijt (2012) . Ili volis kompreni la efikon de senkonsideraj samaj rekompencoj en redaktaraj kontribuoj al Vikipedio. En aparta, ili studis la efikojn de greka stratoj , premio, ke iu Vikipio povas doni al iu alia Vikipedio agnoski malfacilan laboron kaj diligentecon. Restivo kaj kamioneto de Rijt donis vazojn al 100 merecedaj Vikipianoj. Tiam, ili spuris la sekvajn kontribuojn al la adresatoj al Vikipedio dum la sekvaj 90 tagoj. Multe al ilia surprizo, la homoj, al kiuj ili premiis la stratojn, inklinis fari malpli redaktojn post ricevi unu. Alivorte, la garbejoj ŝajnis esti malhelpanta prefere ol kuraĝiga kontribuo.

Feliĉe, Restivo kaj van de Rijt ne funkciis "perturb kaj observi" eksperimenton; ili kuracis kontroligitan eksperimenton. Do, krom elekti 100 ĉefajn kontribuantojn por ricevi barnstelon, ili ankaŭ elektis 100 ĉefajn kontribuantojn al kiuj ili ne donis unu. Ĉi tiuj 100 funkciis kiel grupo de kontrolo. Kaj, kritike, kiu estis en la traktado-grupo kaj kiu estis en la komando-grupo estis determinita hazarde.

Kiam Restivo kaj van de Rijt rigardis la konduton de homoj en la grupo de kontrolo, ili trovis, ke iliaj kontribuoj ankaŭ malpliiĝis. Plie, kiam Restivo kaj van de Rijt komparis homojn en la traktado-grupon (te ricevitaj vostoj) al homoj en la grupo de kontrolo, ili trovis, ke homoj en la traktado-grupo kontribuis proksimume 60% pli. Alivorte, la kontribuoj de ambaŭ grupoj falis, sed tiuj de la grupo kontrolis tiom multe pli rapide.

Kiel ĉi tiu studo ilustras, la grupo de kontrolo en eksperimentoj estas kritika laŭ maniero iom paradokse. Por precize mezuri la efikon de la stratoj, Restivo kaj van de Rijt bezonis observi homojn, kiuj ne ricevis stratojn. Multaj fojoj, esploristoj, kiuj ne konas la eksperimentojn, ne povas estimi la nekredeblan valoron de la grupo de kontrolo. Se Restivo kaj van de Rijt ne havis grupon de kontrolo, ili estus desegnintaj ĝuste la malĝustan konkludon. Grupoj de kontrolo estas tiel gravaj, ke la CEO de grava kazino-kompanion diris, ke ekzistas nur tri manieroj, kiujn dungitoj povas esti forigitaj de sia kompanio: por ŝtelo, por seksa persekutado aŭ por ekzekuti eksperimenton sen kontrolo (Schrage 2011) .

La studo de Restivo kaj van de Rijt ilustras la kvar ĉefajn ingrediencojn de eksperimento: reclutamiento, hazardo, interveno kaj rezultoj. Kune ĉi tiuj kvar ingrediencoj permesas al scienculoj transirante korelaciojn kaj mezuri la kaŭzan efikon de traktadoj. Specife, hazardigo signifas, ke homoj en la traktado kaj kontrolo-grupoj estos similaj. Ĉi tio estas grava ĉar ĝi signifas, ke iu diferenco en rezultoj inter la du grupoj povas esti atribuata al la traktado kaj ne konflikto.

Krom esti bela ilustrado de la mekaniko de eksperimentoj, la studo de Restivo kaj van de Rijt ankaŭ montras, ke la loĝistiko de ciferecaj eksperimentoj povas esti tute malsama al tiuj de analogaj eksperimentoj. En la eksperimento de Restivo kaj van de Rijt, ĝi estis facile doni al la greka stelo al iu ajn, kaj estis facile spuri la rezulton-nombro da redaktoj-super plilongigita tempo (ĉar redakti historion aŭtomate estas registrita de Vikipedio). Ĉi tiu kapablo transdoni traktadojn kaj mezuri rezultojn senkoste estas kvalite kontraste kun eksperimentoj en la pasinteco. Kvankam ĉi tiu eksperimento okupis 200 homojn, ĝi povus esti ekzekutita kun 2,000 aŭ eĉ 20,000 homoj. La ĉefa afero malhelpante al la esploristoj malpliigi sian eksperimenton per faktoro de 100 ne kostis; ĝi estis etika. Tio estas, Restivo kaj van de Rijt ne volis doni stratojn al nedervaj redaktantoj, kaj ili ne volis, ke ilia eksperimento interrompas la Vikipedio-komunumon (Restivo and Rijt 2012, 2014) . Mi revenos al iuj de la etikaj konsideroj levitaj de eksperimentoj poste en ĉi tiu ĉapitro kaj en ĉapitro 6.

En konkludo, la eksperimento de Restivo kaj van de Rijt klare montras, ke dum la baza logiko de eksperimentado ne ŝanĝis, la loĝistiko de ciferecaj eksperimentoj povas esti draste malsama. Poste, por pli klare izoli la ŝancojn kreitajn de ĉi tiuj ŝanĝoj, mi komparos la eksperimentojn, kiujn esploristoj nun povas fari kun la specoj de eksperimentoj, kiuj okazis en la pasinteco.