4.5.1.1 entorns d'ús existents

Podeu executar experiments dins dels entorns existents, sovint sense cap tipus de codificació o societat.

Punt de vista logístic, la manera més fàcil de fer experiments digitals és fusionar amb l'experiment en la part superior d'un entorn existent, el que li permet executar un experiment de camp digital. Aquests experiments es poden executar en una escala raonablement gran i no requereixen associació amb una empresa o un ampli desenvolupament de programari.

Per exemple, Jennifer Doleac i Lucas Stein (2013) es van aprofitar d'un mercat en línia (per exemple, craigslist) per executar un experiment que mesura la discriminació racial. Doleac i Stein anuncien milers d'iPods, i variant sistemàticament les característiques d'aquest venedor, que van ser capaços d'estudiar l'efecte de la raça sobre les transaccions econòmiques. A més, Doleac i Stein utilitzen l'escala del seu experiment per estimar quan l'efecte és més gran (heterogeneïtat dels efectes del tractament) i oferir algunes idees sobre per què l'efecte podria ocórrer (mecanismes).

Abans de l'estudi de Doleac i Stein, hi havia hagut dos enfocaments principals per mesurar experimentalment la discriminació. En correspondència estudis dels investigadors a crear fulls de vida de les persones de diferents races de ficció i l'ús d'aquests fulls de vida de, per exemple, s'apliquen per a diferents llocs de treball. Bertrand i de Mullainathan (2004) de paper amb el títol memorable "Són Emily i Greg més ocupables Que Lakisha i Jamal? Un experiment de camp en el mercat laboral per discriminació "és un meravellós exemple d'un estudi per correspondència. Els estudis per correspondència tenen un cost relativament baix i per observació, que permet a un sol investigador per recollir milers d'observacions en un estudi típic. No obstant això, els estudis per correspondència de discriminació racial han estat qüestionats perquè els noms de senyal potencialment moltes coses més de la carrera del sol·licitant. És a dir, noms com Greg, Emily, Lakisha, i Jamal pot ser senyal de la classe social a més de la raça. Per tant, qualsevol diferència en el tractament de fulles de vida de Greg i Jamal podria ser degut a més de les diferències de raça presumptes dels sol·licitants. Estudis d'auditoria, per contra, impliquen la contractació d'actors de diferents races per aplicar en persona per llocs de treball. Tot i que els estudis d'auditoria proporcionen un senyal clar de raça sol·licitant, que són molt cars i per observació, el que significa que en general només tenen centenars d'observacions.

En el seu experiment de camp digital, Doleac i Stein van ser capaços de crear un híbrid atractiu. Ells van ser capaços de recollir dades a un cost relativament baix i per observació-resultant en milers d'observacions (com en un estudi per correspondència) -i que van ser capaços d'assenyalar carrera usant fotografies-que resulta en un senyal clar uncounfounded de raça (com en un estudi d'auditoria ). Per tant, l'entorn en línia permet als investigadors a vegades per crear nous tractaments que tenen propietats que són difícils de construir d'una altra manera.

Els anuncis d'iPod Doleac i Stein van variar al llarg de tres dimensions principals. En primer lloc, es van variar les característiques del venedor, que va ser assenyalat per la mà fotografiat sostenint l'iPod [blanc, negre, blanc amb el tatuatge] (Figura 4.12). En segon lloc, van variar el preu de venda [$ 90, $ 110, $ 130]. En tercer lloc, van variar la qualitat del text de l'anunci [d'alta qualitat i de baixa qualitat (per exemple, errors i errors de capitalització spelin)]. Per tant, els autors van tenir un disseny de 3 x 3 x 2 que es va desplegar a través de més de 300 mercats locals que van des de les ciutats (per exemple, Kokomo, IN i North Platte, NE) per les mega-ciutats (per exemple, Nova York i Los Angeles).

Figura 4.12: Mans utilitzats en l'experiment de Doleac i Stein (2013). iPods van ser venuts pels venedors amb característiques diferents per mesurar la discriminació en un mercat electrònic.

Figura 4.12: Mans utilitzats en l'experiment de Doleac and Stein (2013) . iPods van ser venuts pels venedors amb característiques diferents per mesurar la discriminació en un mercat electrònic.

Mitjana en totes les condicions, els resultats van ser millors per al venedor que el venedor blanc negre, amb el venedor tatuat tenir resultats intermedis. Per exemple, els venedors blancs rebut més ofertes i tenia els majors preus de venda finals. Més enllà d'aquests efectes mitjana, Doleac i Stein va estimar la heterogeneïtat dels efectes. Per exemple, una predicció de la teoria anterior és que la discriminació seria menor en els mercats que són més competitius. Utilitzant el nombre d'ofertes rebudes com a substitut de la competència en el mercat, els autors van trobar que els venedors negres de fet reben ofertes pitjors en els mercats amb un baix grau de competència. A més, mitjançant la comparació dels resultats dels anuncis amb alta qualitat i un text de baixa qualitat, Doleac i Stein va trobar que la qualitat de l'anunci no afecta el desavantatge que enfronten els venedors negres i tatuats. Finalment, aprofitant el fet que els anuncis van ser col·locats en més de 300 mercats, els autors troben que els venedors negres són més desfavorits en ciutats amb alts índexs de criminalitat i alta segregació residencial. Cap d'aquests resultats ens donen una comprensió precisa de exactament per què els venedors negres tenien pitjors resultats, però, quan es combina amb els resultats d'altres estudis, es pot començar a informar les teories sobre les causes de la discriminació racial en diferents tipus de transaccions econòmiques.

Un altre exemple que mostra la capacitat dels investigadors per dur a terme experiments de camp digitals en els sistemes existents és la investigació per Arnout van de Rijt i els seus col·legues (2014) sobre les claus de l'èxit. En molts aspectes de la vida, la gent aparentment similars acaben amb resultats molt diferents. Una possible explicació d'aquest patró és que els petits i essencialment aleatoris avantatges poden lock-in i créixer amb el temps, un procés que els investigadors anomenen avantatge acumulativa. Per tal de determinar si els petits èxits inicials lock-in o s'esvaeixen, van de Rijt i els seus col·legues (2014) han intervingut en quatre sistemes diferents que concedeixen l'èxit de participants seleccionats a l'atzar, i després van mesurar els efectes a llarg termini d'aquest èxit arbitrària.

Més específicament, van de Rijt i col·legues 1) es van comprometre diners per als projectes seleccionats a l'atzar en kickstarter.com , un lloc web de crowdfunding; 2) puntuació positiva opinions seleccionats a l'atzar en el lloc web epinions ; 3) va donar premis a triades a l'atzar i col·laboradors de Wikipedia ; i 4) signat seleccionada aleatòriament peticions en change.org . Els investigadors van trobar resultats molt similars en els quatre sistemes: en cada cas, els participants que van rebre a l'atzar una certa èxit d'hora va passar a tenir més èxit posterior que els seus companys d'una altra manera completament indistingibles (Figura 4.13). El fet que el mateix patró va aparèixer en molts sistemes augmenta la validesa externa d'aquests resultats, ja que redueix la possibilitat que aquest patró és un artefacte de qualsevol sistema particular.

Figura 4.13: Efectes a llarg termini d'èxit conferit a l'atzar en quatre sistemes socials diferents. Arnout van de Rijt i els seus col·legues (2014) 1) es van comprometre diners per a projectes en kickstarter.com, un lloc web de crowdfunding seleccionats a l'atzar; 2) puntuació positiva opinions seleccionats a l'atzar en els epinions lloc web; 3) va donar premis a triades a l'atzar i col·laboradors de Wikipedia; i 4) signat seleccionada aleatòriament peticions en change.org.

Figura 4.13: Efectes a llarg termini d'èxit conferit a l'atzar en quatre sistemes socials diferents. Arnout van de Rijt i els seus col·legues (2014) 1) es van comprometre diners per als projectes seleccionats a l'atzar en kickstarter.com , un lloc web de crowdfunding; 2) puntuació positiva opinions seleccionats a l'atzar en el lloc web epinions ; 3) va donar premis a triades a l'atzar i col·laboradors de Wikipedia ; i 4) signat seleccionada aleatòriament peticions en change.org .

Junts, aquests dos exemples mostren que els investigadors poden dur a terme experiments de camp digitals sense la necessitat d'associar-se amb empreses o la necessitat de construir sistemes digitals complexos. A més, la Taula 4.2 proporciona encara més exemples que mostren el rang del que és possible quan els investigadors utilitzen la infraestructura dels sistemes existents per lliurar els resultats del tractament i / o mesurar. Aquests experiments són relativament barats per als investigadors i ofereixen un alt grau de realisme. No obstant això, aquests experiments els investigadors ofereixen un control limitat sobre els participants, els tractaments i les conseqüències que han de mesurar-se. A més, per als experiments que es realitzen en un sol sistema, els investigadors han d'estar preocupat que els efectes podrien ser impulsats per la dinàmica específica del sistema (per exemple, la forma en què el pedal d'arrencada s'ubica projectes o la forma en què s'ubica change.org peticions; per a més informació, vegeu la discussió sobre els factors de confusió algorítmic en el capítol 2). Finalment, quan els investigadors intervenen en els sistemes de treball, qüestions ètiques difícils emergeixen sobre una possible dany als participants, no participants, i els sistemes. Els tindrem en compte qüestió ètica en més detall en el capítol 6, i hi ha una excel·lent discussió dels mateixos en l'apèndix de Van de Rijt (2014) . Les compensacions que vénen amb el treball en un sistema existent no són ideals per a cada projecte, i per aquesta raó alguns investigadors a construir el seu propi sistema experimental, el tema de la següent secció.

Taula 4.2: Exemples d'experiments en els sistemes existents. Aquests experiments semblen caure en tres categories principals, i aquesta categorització poden ajudar a adonar-oportunitats addicionals per a la seva pròpia investigació. En primer lloc, hi ha experiments que suposen la venda o la compra d'alguna cosa (per exemple, Doleac and Stein (2013) ). En segon lloc, hi ha experiments que impliquen el lliurament d'un tractament als participants específics (per exemple, Restivo and Rijt (2012) ). Finalment, hi ha experiments que impliquen tractaments lliurar a objectes específics, com ara peticions (per exemple, Vaillant et al. (2015) ).
tema citació
Efecte de barnstars sobre les contribucions a Wikipedia Restivo and Rijt (2012) ; Restivo and Rijt (2014) ; Rijt et al. (2014)
Efecte del missatge contra l'assetjament per tuits racistes Munger (2016)
Efecte del mètode de subhasta el preu de venda Lucking-Reiley (1999)
Efecte de la reputació en el preu en les subhastes en línia Resnick et al. (2006)
Efecte de la cursa del venedor en la venda de targetes de beisbol a eBay Ayres, Banaji, and Jolls (2015)
Efecte de la cursa del venedor en la venda d'iPods Doleac and Stein (2013)
Efecte de la raça dels convidats en el lloguer d'Airbnb Edelman, Luca, and Svirsky (2016)
Efecte de les donacions en l'èxit dels projectes en Kickstarter Rijt et al. (2014)
Efecte de la raça i l'etnicitat en el lloguer d'habitatge Hogan and Berry (2011)
Efecte de la qualificació positiva en les qualificacions futures sobre epinions Rijt et al. (2014)
Efecte de les signatures en l'èxit de les peticions Vaillant et al. (2015) ; Rijt et al. (2014)