2.4.3.1 experimente naturale

Experimentele naturale să profite de evenimente aleatoare din lume. eveniment aleator + întotdeauna pe date de sistem = experiment natural

Cheia pentru a experimentelor controlate randomizate, care să permită o comparație echitabilă este randomizare. Cu toate acestea, ocazional se întâmplă ceva în lume, care atribuie în mod esențial oameni la întâmplare sau aproape aleatoriu la diferite tratamente. Una dintre cele mai clare exemple ale strategiei de utilizare a experimentelor naturale provine din cercetarea Angrist (1990) , care măsoară efectul serviciilor militare asupra câștigurilor salariale.

În timpul războiului din Vietnam, Statele Unite ale Americii a crescut dimensiunea forțelor sale armate printr-un proiect. În scopul de a decide care cetățenii vor fi chemați în serviciu, guvernul SUA a organizat o loterie. Fiecare a fost reprezentat pe data de naștere o bucată de hârtie, iar aceste lucrări au fost plasate într-un borcan de sticlă mare. Așa cum se arată în figura 2.5, aceste bucăți de hârtie au fost extrase din borcan unul la un moment dat pentru a determina ordinea în care tinerii vor fi chemați să servească (femei tinere care nu au făcut obiectul proiectului). Pe baza rezultatelor obținute, bărbații născuți la 14 septembrie au fost chemați mai întâi, bărbații născuți la data de 24 aprilie au fost numite în al doilea rând, și așa mai departe. În cele din urmă, în această loterie, bărbații născuți pe 195 de zile diferite au fost chemați la serviciu în timp ce bărbații născuți la 171 de zile nu au fost numite.

Figura 2.5: Congresmanul Alexander Pirnie (R-NY), desen prima capsulă pentru proiectul selectiv serviciu de la 1 decembrie 1969. Joshua Angrist (1990) combinat proiectul de loterie cu date despre veniturile din Social Security Administration pentru a estima efectul serviciului militar pe câștigurile. Acesta este un exemplu de cercetare folosind un experiment natural. Sursa: Wikimedia Commons

Figura 2.5: Congresmanul Alexander Pirnie (R-NY) , desen prima capsulă pentru proiectul selectiv serviciu de la 1 decembrie 1969. Joshua Angrist (1990) combinat proiectul de loterie cu date despre veniturile din Social Security Administration pentru a estima efectul serviciului militar pe câștigurile. Acesta este un exemplu de cercetare folosind un experiment natural. Sursa: Wikimedia Commons

Cu toate că s-ar putea să nu fie imediat aparent, un proiect de loterie are o similitudine critică pentru un experiment clinic randomizat, controlat: în ambele situații, participanții sunt repartizati aleatoriu pentru a primi un tratament. În cazul proiectului de loterie, dacă suntem interesați în procesul de învățare despre efectele proiectului de-eligibilitate și serviciul militar asupra câștigurilor ulterioare ale pieței forței de muncă, putem compara rezultatele pentru persoanele ale căror date de naștere au fost sub secționarea loterie (de exemplu, 14 Septembrie, Aprilie 24, etc.), cu rezultatele pentru persoanele ale căror zile de naștere au fost după secționarea (de exemplu, 20 februarie 02 decembrie, etc.).

Având în vedere faptul că acest tratament a fi elaborat a fost repartizati aleatoriu, putem masura atunci efectul acestui tratament pentru orice rezultat care a fost măsurat. De exemplu, Angrist (1990) a combinat informația cu privire la care a fost selectat în mod aleatoriu în proiectul cu datele privind veniturile care au fost colectate de către Administrația de Securitate Socială pentru a concluziona că veniturile veteranilor albi au fost aproximativ 15% mai puțin decât câștigurile comparabile non-veterani . Alti cercetatori au folosit un truc similar, de asemenea. De exemplu, Conley and Heerwig (2011) combinate informația cu privire la care a fost selectat în mod aleatoriu în proiectul cu datele de uz casnic colectate de la Survey 2000 de recensământ și 2005 Comunitatea americană și a constatat că atât de mult timp după proiect, nu a existat un efect redus pe termen lung a serviciul militar varietate de rezultate, cum ar fi posesiune de locuințe (deținerea versus închiriere) și a stabilității rezidențiale (probabilitatea de a fi mutat în cinci ani anteriori).

Așa cum acest exemplu ilustrează, uneori, forțele sociale, politice sau naturale creează experimente sau aproape de experimente care pot fi leveraged de către cercetători. De multe ori experimentele naturale sunt cel mai bun mod de a estima relațiile cauză-efect în setările în cazul în care nu este etic sau practic pentru a rula experimente randomizate controlate. Ele sunt o strategie importantă pentru descoperirea de comparații echitabile în date non-experimentale. Această strategie de cercetare poate fi rezumată prin această ecuație:

\ [\ text {aleatoare (sau ca în cazul în care aleatoare) eveniment} + \ text {întotdeauna pe flux de date} = \ text {experiment natural} \ prototipurilor (2.1) \]

Cu toate acestea, analiza experimentelor naturale pot fi destul de dificil. De exemplu, în cazul proiectului din Vietnam, nu toți cei care au fost cu tiraj eligibilă a terminat de servire (au existat o varietate de excepții). Și, în același timp, unii oameni care nu au fost proiecte eligibile pentru serviciu voluntar. Era ca și în cazul în care într-un studiu clinic al unui nou medicament, unii oameni din grupul de tratament nu a luat medicamentul lor, iar unele dintre persoanele din grupul de control a primit într-un fel de droguri. Această problemă, numită neconformare cu două fețe, precum și multe alte probleme sunt descrise mai detaliat în unele dintre citirile recomandate la sfârșitul acestui capitol.

Strategia de a profita în mod natural de atribuire aleatorie precede epoca digitală, dar prevalența datelor mari face ca această strategie mult mai ușor de utilizat. După ce realizezi un tratament a fost repartizati aleatoriu, surse de date de mare poate furniza datele rezultate pe care aveți nevoie pentru a compara rezultatele pentru persoanele aflate în tratament și control al condițiilor. De exemplu, în studiul său despre efectele proiectului și serviciul militar, Angrist a făcut uz de câștigurile înregistrări de la Administrația de Securitate Socială; fără aceste date rezultat, studiul său nu ar fi fost posibilă. În acest caz, Administrația de Securitate Socială este întotdeauna pe sursa de date de mare. Deoarece există mai multe și mai automat colectate surse de date, vom avea mai multe date rezultate care pot măsura efectele modificărilor create prin variația exogene.

Pentru a ilustra această strategie în era digitală, să ia în considerare Mas și Moretti (2009) de cercetare elegant , cu privire la efectul colegilor asupra productivității. Deși la suprafață poate arăta diferit decât studiul lui Angrist cu privire la efectele Proiectului Vietnam, în structura ambele urmeze modelul în echiv. 2.1.

Mas și Moretti măsurate modul în care colegii afectează productivitatea lucrătorilor. Pe de o parte, având un peer greu de lucru ar putea duce lucrătorilor să își mărească productivitatea, din cauza presiunii de grup. Sau, pe de altă parte, un peer greu de lucru ar putea duce la alți lucrători delăsători chiar mai mult. Cel mai clar mod de a studia efectele asupra productivității la egal la egal ar fi un experiment randomizat, controlat, în cazul în care muncitorii sunt repartizati aleatoriu la schimburi cu muncitori de diferite niveluri de productivitate și de productivitate care rezultă apoi se măsoară pentru toată lumea. Cercetători, cu toate acestea, nu controlează programul lucrătorilor în orice afacere reală, și așa mai departe și Mas Moretti a trebuit să se bazeze pe un experiment natural care a avut loc într-un supermarket.

La fel ca și echiv. 2.1, studiul lor a avut două părți. În primul rând, ei au folosit jurnalele din sistemul supermagazin pentru a avea o precisă, individuală, și întotdeauna pe măsură a productivității: numărul de elemente scanate pe secundă. Și, în al doilea rând, din cauza modului în care programarea a fost făcută la acest supermarket, ei au aproape compozitie aleatoare de colegii. Cu alte cuvinte, chiar dacă programarea casieri nu este determinată de o loterie, a fost în mod esențial la întâmplare. În practică, încrederea pe care o avem în experimentele naturale depinde în mod frecvent pe plauzibilitatea acestei "ca în cazul în care" cerere aleatorie. Profitând de această variație aleatoare, Mas și Moretti a constatat că lucrează cu colegii de productivitate mai mare crește productivitatea. Mai mult, Mas și Moretti a folosit mărimea și bogăția setului de date lor de a trece dincolo de estimarea cauza-efect pentru a explora două aspecte mai importante și mai subtile: eterogenitatea acestui efect (pentru care tipuri de lucrători este mai mare efect) și mecanismul în spatele efectului (de ce nu are colegii de productivitate mare conduce la o productivitate mai mare). Vom reveni la aceste două probleme importante de-eterogenitate a efectelor tratamentului și a mecanismelor de la capitolul 5, când vom discuta despre experimente cu mai multe detalii.

Generalizând din studiile privind efectul proiectului de Vietnam privind veniturile și studiul efectului colegilor asupra productivității, Tabelul 2.3 rezumă alte studii care au aceeași structură exactă: folosind o întotdeauna pe sursa de date pentru a măsura impactul unor evenimente . După cum arată Tabelul 2.3 arată clar, experimentele naturale sunt peste tot, dacă știi exact cum să le caute.

Tabelul 2.3: Exemple de experimente naturale care utilizează surse de date mari. Toate aceste studii urmează aceeași rețetă de bază: eveniment aleator (sau ca în cazul în care aleatoare) + întotdeauna cu privire la sistemul de date. A se vedea Dunning (2012) pentru mai multe exemple.
se concentreze pe fond Sursa de experiment natural Întotdeauna la sursă de date Citare
Peer efecte asupra productivității Procesul de planificare date de finalizarea comenzii Mas and Moretti (2009)
formarea de prietenie uragane Facebook Phan and Airoldi (2015)
Răspândirea emoțiilor ploaie Facebook Coviello et al. (2014)
Peer to peer transferurile economice cutremur date mobile bani Blumenstock, Fafchamps, and Eagle (2011)
Comportamentul de consum personal 2013 SUA închidere guvern date finantele personale Baker and Yannelis (2015)
Impactul economic al sistemelor de sfatuitor variat datele de navigare la Amazon Sharma, Hofman, and Watts (2015)
Efectul stresului asupra fătului 2006 războiul Israel-Hezbollah înregistrări de naștere Torche and Shwed (2015)
Lectură un comportament pe Wikipedia revelații Snowden busteni Wikipedia Penney (2016)

În practică, cercetătorii folosesc două strategii diferite pentru a găsi experimente naturale, ambele din care pot fi fructuoase. Unii cercetători încep cu întotdeauna pe date sursă și să căutați evenimente aleatoare din lume; alții începe cu evenimente aleatoare din lume și să caute surse de date care surprind impactul acestora. În cele din urmă, observați că forța experimentelor naturale care nu provine din gradul de sofisticare al analizei statistice, ci din grija in a descoperi o comparație echitabilă creat de un accident norocos de istorie.