2.4.1.1 न्यूयॉर्क शहर में टैक्सी

एक शोधकर्ता टैक्सी मीटर से बड़ा डेटा का उपयोग किया अध्ययन करने के लिए टैक्सी ड्राइवरों न्यूयॉर्क में की निर्णय लेने की। इन आंकड़ों में अच्छी तरह से इस शोध के लिए उपयुक्त था।

सही बात की गिनती की साधारण शक्ति का एक उदाहरण हेनरी फार्बर के से आता है (2015) न्यूयॉर्क शहर के टैक्सी चालकों के व्यवहार का अध्ययन। हालांकि इस समूह स्वाभाविक दिलचस्प ध्वनि नहीं हो सकता यह श्रम अर्थशास्त्र में दो प्रतिस्पर्धी सिद्धांतों के परीक्षण के लिए एक रणनीतिक अनुसंधान साइट है। फार्बर के अनुसंधान के प्रयोजनों के लिए, वहाँ टैक्सी ड्राइवरों के काम के माहौल के बारे में दो महत्वपूर्ण विशेषताएं हैं: 1) अपने प्रति घंटा मजदूरी दिन के लिए दिन, मौसम जैसे कारकों पर भाग में स्थित से उतार चढ़ाव होता रहता है और 2) घंटे वे काम की संख्या चालक के फैसले के आधार पर प्रत्येक दिन उतार चढ़ाव हो सकता है। इन सुविधाओं प्रति घंटा मजदूरी और घंटे काम के बीच रिश्ते के बारे में एक दिलचस्प सवाल पैदा होती हैं। अर्थशास्त्र में Neoclassical मॉडल भविष्यवाणी है कि टैक्सी चालकों को जहां वे उच्च प्रति घंटा मजदूरी के दिनों में अधिक काम करेगा। वैकल्पिक रूप से, मॉडल व्यवहार अर्थशास्त्र से बिल्कुल विपरीत भविष्यवाणी। अगर ड्राइवरों के लिए एक विशेष इनकम सेट प्रति $ 100 लक्ष्य का कहना है कि दिन और काम जब तक कि लक्ष्य पूरा किया जाता है, तो ड्राइवरों दिनों कि वे अधिक कमा रहे हैं पर कम घंटे काम खत्म होगा। उदाहरण के लिए, यदि आप एक लक्ष्य मजदूर थे, तो आप को एक अच्छा दिन ($ 25 प्रति घंटे) और एक बुरा दिन ($ 20 प्रति घंटा) पर 5 घंटे के आधार पर 4 घंटे काम खत्म हो सकता है। तो, ड्राइवरों उच्च प्रति घंटा मजदूरी के रूप में (neoclassical मॉडल ने भविष्यवाणी) या उससे अधिक घंटे कम प्रति घंटा मजदूरी के साथ दिन पर दिन के साथ पर अधिक घंटे काम करते हैं (जैसा व्यवहार आर्थिक मॉडल ने भविष्यवाणी की)?

2013, डेटा है कि अब कर रहे हैं - इस सवाल का जवाब फार्बर हर टैक्सी यात्रा 2009 से न्यूयॉर्क सिटी कैब द्वारा उठाए गए पर डेटा प्राप्त सार्वजनिक रूप से उपलब्ध । स्थान, अंत समय, अंत स्थान, किराया और टिप (शुरू करता है, तो टिप एक साथ भुगतान किया गया था शुरू समय,: इस डेटा जो इलेक्ट्रॉनिक मीटर की दूरी पर है कि शहर में टैक्सियों की आवश्यकता द्वारा एकत्र किया गया था प्रत्येक यात्रा के लिए जानकारी के कई टुकड़े का उपयोग भी शामिल है क्रेडिट कार्ड)। कुल में, फार्बर के डेटा लगभग 40 लाख की पाली के दौरान लिए गए लगभग 900 मिलियन यात्राओं पर जानकारी निहित (एक पारी मोटे तौर पर एक ड्राइवर के लिए एक दिन का काम है)। वास्तव में, वहाँ इतना डेटा था, कि फार्बर केवल अपने विश्लेषण के लिए यह एक यादृच्छिक नमूना इस्तेमाल किया। इस टैक्सी मीटर डेटा का उपयोग करना, फार्बर में पाया गया कि अधिकांश चालकों के दिनों में अधिक काम जब मजदूरी अधिक है, neoclassical सिद्धांत के साथ संगत कर रहे हैं। यह मुख्य खोजने के अलावा, फार्बर विविधता और गतिशीलता का एक बेहतर समझ के लिए डेटा के आकार का लाभ उठाने में सक्षम था। फार्बर में पाया गया कि समय के साथ धीरे-धीरे नए ड्राइवरों उच्च वेतन के दिनों में अधिक समय तक काम करने के लिए सीखना (जैसे, वे के रूप में neoclassical मॉडल भविष्यवाणी व्यवहार करना सीखना)। और, नए ड्राइवरों, जो अधिक लक्ष्य मजदूर की तरह व्यवहार अधिक एक टैक्सी ड्राइवर की जा रही छोड़ने की संभावना है। इन निष्कर्षों को और अधिक सूक्ष्म है, जो मौजूदा ड्राइवरों का मनाया व्यवहार की व्याख्या करने में मदद के दोनों डाटासेट के आकार की वजह से ही संभव हो गया है। वे पहले के अध्ययनों कि टैक्सी चालकों की एक छोटी संख्या से कागज यात्रा चादरों का इस्तेमाल किया समय की एक छोटी अवधि (जैसे, ओवर में पता लगाने के लिए असंभव हो गया होता Camerer et al. (1997) )।

फार्बर के अध्ययन बड़ा डेटा का उपयोग कर एक अध्ययन के लिए एक सबसे अच्छा मामले के करीब था। सबसे पहले, डेटा गैर प्रतिनिधि नहीं थे, क्योंकि शहर आवश्यक ड्राइवरों डिजिटल मीटर का उपयोग करने के लिए। और, डेटा क्योंकि डेटा है कि शहर से एकत्र किया गया था सुंदर डेटा कि फार्बर एकत्र होता है, तो वह विकल्प नहीं था के करीब था अधूरा नहीं थे (एक अंतर यह है कि फार्बर कुल मजदूरी-किराये प्लस युक्तियाँ पर चाहता था डेटा होता है लेकिन शहर डेटा केवल क्रेडिट कार्ड द्वारा भुगतान सुझावों के शामिल है)। फार्बर के अनुसंधान के लिए महत्वपूर्ण अच्छा डेटा के साथ एक अच्छा सवाल के संयोजन किया गया था। अकेले डेटा पर्याप्त नहीं हैं।