2.4.1.1 Taksi u New Yorku

Istraživač se koriste velike količine podataka iz taksija metara za proučavanje odlučivanja taksista u New Yorku. Ovi podaci su dobro pogodna za ovo istraživanje.

Jedan primjer jednostavne moći brojanja pravu stvar dolazi iz Henry Farber je (2015) proučavanje ponašanja New Yorku taksisti. Iako je ova grupa možda ne zvuči po sebi interesantno je to strateški istraživački sajt za testiranje dva konkurentskih teorija u ekonomiji rada. Za potrebe istraživanja Farber je, postoje dvije važne karakteristike o radnom okruženju taksista: 1) svoje satnice varira iz dana u dan, sa sjedištem u dijelu na faktore kao što su na vrijeme i 2) broj sati rade mogu varirati svaki dan na osnovu odluke vozača. Ove funkcije dovesti do zanimljivo pitanje o odnosu između satnica i odrađenih sati. Neoklasičnog modela u ekonomiji predviđaju da će taksisti rade više na dan, gdje imaju veći satnica. Alternativno, modeli iz ekonomije ponašanja predviđaju upravo suprotno. Ako vozači postavili određeni prihod meta-reći $ 100 po danu-i rada sve dok taj cilj je ispunjen, onda vozači će završiti rade manje sati na dan da oni zarađuju više. Na primjer, ako ste bili meta zarađuje, možda završiti radi 4 sata na dobar dan ($ 25 po satu) i 5 sati na loš dan ($ 20 po satu). Dakle, da vozači rade više sati na dan sa većim satnica (kako je predviđeno od strane neoklasične modele) ili više sati na dan sa nižim satnica (kao što je predviđeno po ponašanju ekonomskih modela)?

Da bi odgovorili na ovo pitanje Farber dobiti podatke o svakom taksi putovanje koje je New York City kabine iz 2009 - 2013, podaci koje su sada dostupne javnosti . Ovi podaci-koji su prikupljeni od strane elektronskih brojila da grad zahtijeva taksi za korištenje-uključuje nekoliko komada informacije za svako putovanje: vreme početka, početak lokacija, kraj vremena, kraj lokacija, fare, i tip (ako je tip platio sa kreditna kartica). Ukupno, podaci Farber je sadrže informacije o oko 900 miliona putovanja uzeti u oko 40 miliona smjene (pomak je otprilike jedan radni dan za jednog vozača). U stvari, nije bilo toliko podataka, da Farber koristiti samo slučajnom uzorku od toga za njegovu analizu. Koristeći ovaj metar podataka taksi, Farber je utvrdio da većina vozača raditi na dane kada plate su veće, u skladu sa neoklasične teorije. Pored ovog glavnog nalaz, Farber je u stanju da iskoriste veličinu podataka za bolje razumijevanje heterogenost i dinamike. Farber otkrili da se tokom vremena noviji vozača postepeno naučiti da rade više sati na visokom dana zarada (npr, oni uče da se ponašaju kao neoklasičnog modela predviđa). I, novi vozači koji se ponašaju više kao meta zarađuju češće da ostavim kao taksista. Oba ova suptilnije nalaza, koji pomažu objasniti promatranim ponašanje sadašnjih vozača, bilo moguće samo zbog veličine skup. Oni bi bilo nemoguće otkriti u ranijim studijama koje koriste papir putovanje listova iz malog broja taksista u kratkom vremenskom periodu (npr Camerer et al. (1997) ).

Farber studija bio blizu najbolji predmet na studiju koristeći velike količine podataka. Prvo, podaci nisu bili bez predstavnika jer je grad potrebne vozačima da koriste digitalne metara. I, podaci nisu bili nepotpuni, jer su podaci koji su prikupljeni od strane grad je bio prilično blizu podatke koji bi Farber prikupili ako je imao izbora (jedna razlika je da će Farber imaju želio podatke o ukupnim zaradama-karata plus tips- ali grad podataka uključeni samo savjeti plaća kreditnom karticom). Ključ za istraživanje Farber, je kombinirajući dobro pitanje sa dobrim podacima. Sama podaci nisu dovoljni.