2.4.1.1 แท็กซี่ในนิวยอร์กซิตี้

นักวิจัยได้ใช้ข้อมูลขนาดใหญ่จากรถแท็กซี่เมตรเพื่อศึกษาการตัดสินใจของคนขับรถแท็กซี่ในนิวยอร์ก ข้อมูลเหล่านี้ถูกเหมาะสำหรับการวิจัยครั้งนี้

ตัวอย่างหนึ่งของการใช้พลังงานที่เรียบง่ายของการนับสิ่งที่ถูกต้องมาจากเฮนรีฟาร์ (2015) การศึกษาพฤติกรรมของคนขับรถแท็กซี่มหานครนิวยอร์ก แม้ว่ากลุ่มนี้อาจไม่ได้เสียงที่น่าสนใจโดยเนื้อแท้เป็นเว็บไซต์วิจัยเชิงกลยุทธ์สำหรับการทดสอบทฤษฎีที่สองในการแข่งขันเศรษฐศาสตร์แรงงาน สำหรับวัตถุประสงค์ของการวิจัยฟาร์ที่มีสองคุณสมบัติที่สำคัญเกี่ยวกับสภาพแวดล้อมการทำงานของคนขับรถแท็กซี่ 1) ค่าจ้างรายชั่วโมงของพวกเขาลดลงจากวันต่อวันซึ่งตั้งอยู่ในส่วนที่เกี่ยวกับปัจจัยเช่นสภาพอากาศและ 2) จำนวนชั่วโมงที่พวกเขาทำงาน สามารถเปลี่ยนแปลงได้ในแต่ละวันขึ้นอยู่กับการตัดสินใจของคนขับรถ คุณสมบัติเหล่านี้นำไปสู่​​คำถามที่น่าสนใจเกี่ยวกับความสัมพันธ์ระหว่างค่าจ้างรายชั่วโมงและชั่วโมงทำงาน รุ่นนีโอคลาสสิเศรษฐศาสตร์คาดการณ์ว่าคนขับรถแท็กซี่จะทำงานมากขึ้นในวันที่พวกเขามีค่าจ้างรายชั่วโมงที่สูงขึ้น อีกทางเลือกหนึ่งรุ่นจากเศรษฐศาสตร์พฤติกรรมทำนายตรงข้าม หากไดรเวอร์กำหนดรายได้โดยเฉพาะอย่างยิ่งเป้าหมายพูด $ 100 ต่อวันและการทำงานจนกว่าเป้าหมายที่ได้พบแล้วคนขับรถจะจบลงด้วยชั่วโมงการทำงานน้อยลงในวันที่พวกเขามีรายได้มากขึ้น ตัวอย่างเช่นถ้าคุณเป็นรายได้เป้าหมายที่คุณอาจท้ายการทำงาน 4 ชั่วโมงในวันที่ดี ($ 25 ต่อชั่วโมง) และ 5 ชั่​​วโมงในวันที่ไม่ดี ($ 20 ต่อชั่วโมง) ดังนั้นไม่ไดรเวอร์ทำงานเป็นเวลามากขึ้นในวันที่มีค่าจ้างสูงกว่ารายชั่วโมง (ตามคำทำนายรูปแบบนีโอคลาสสิ) หรือชั่วโมงในวันที่มีค่าจ้างรายชั่วโมงที่ต่ำกว่า (เป็นที่คาดการณ์โดยแบบจำลองทางเศรษฐกิจพฤติกรรม)?

เพื่อตอบคำถามนี้ฟาร์ที่ได้รับข้อมูลเกี่ยวกับการเดินทางของรถแท็กซี่ทุกที่ถ่ายโดยรถแท็กซี่นิวยอร์กซิตี้ 2009 - 2013 ข้อมูลที่มีตอนนี้ ที่มีอยู่ทั่วไป ข้อมูลที่นี้ถูกเก็บรวบรวมโดยเมตรอิเล็กทรอนิกส์ที่เมืองต้องใช้รถแท็กซี่ที่จะใช้รวมถึงหลายชิ้นของข้อมูลสำหรับการเดินทางแต่ละเวลาเริ่มต้นเริ่มตั้งเวลาสิ้นสุดตำแหน่งสิ้นสุดของว่างและปลาย (ถ้าปลายได้รับค่าจ้างด้วย บัตรเครดิต). รวมข้อมูลของฟาร์ที่มีข้อมูลเกี่ยวกับการประมาณ 900 ล้านทริปถ่ายในช่วงประมาณ 40 ล้านกะ (กะคือประมาณวันทำงานของคนหนึ่งคนขับ) ในความเป็นจริงมีข้อมูลมากเพื่อที่ฟาร์เดียวที่ใช้ในตัวอย่างที่สุ่มจากมันสำหรับการวิเคราะห์ของเขา โดยใช้ข้อมูลแท็กซี่นี้ฟาร์พบว่าคนขับส่วนใหญ่ทำงานมากขึ้นในวันที่ค่าจ้างที่สูงขึ้นสอดคล้องกับทฤษฎีนีโอคลาสสิ นอกเหนือจากการหาหลักนี้ฟาร์ก็สามารถที่จะใช้ประโยชน์จากขนาดของข้อมูลเพื่อความเข้าใจที่ดีขึ้นของเซลล์สืบพันธุ์และการเปลี่ยนแปลง ฟาร์พบว่าในช่วงเวลาที่ใหม่กว่าไดรเวอร์ค่อย ๆ เรียนรู้ที่จะทำงานเป็นเวลามากขึ้นในวันที่ค่าจ้างสูง (เช่นที่พวกเขาเรียนรู้ที่จะทำงานเป็นรูปแบบนีโอคลาสสิคาดการณ์) และไดรเวอร์ใหม่ที่ทำงานมากขึ้นเช่นรายได้จุนเจือเป้าหมายมีแนวโน้มที่จะลาออกจากการเป็นคนขับรถแท็กซี่ ทั้งสองของผลการวิจัยที่ลึกซึ้งยิ่งขึ้นเหล่านี้ซึ่งช่วยอธิบายการสังเกตพฤติกรรมของคนขับรถในปัจจุบันเป็นไปได้เพียงเพราะขนาดของชุดข้อมูลที่ พวกเขาจะเป็นไปไม่ได้ที่จะตรวจสอบในการศึกษาก่อนหน้านี้ที่ใช้ในการเดินทางแผ่นกระดาษจากจำนวนเล็ก ๆ ของคนขับรถแท็กซี่ในช่วงระยะเวลาสั้น ๆ (เช่น Camerer et al. (1997) )

การศึกษาฟาร์ก็ใกล้เคียงกับกรณีที่ดีที่สุดสำหรับการศึกษาโดยใช้ข้อมูลขนาดใหญ่ ครั้งแรกข้อมูลที่ไม่ได้ไม่ใช่ตัวแทนเมืองเพราะจำเป็นต้องใช้ไดรเวอร์ที่จะใช้ดิจิตอลมิเตอร์ และข้อมูลที่ไม่สมบูรณ์เพราะข้อมูลที่ถูกเก็บรวบรวมโดยเป็นเมืองที่สวยใกล้เคียงกับข้อมูลที่ฟาร์จะมีการเก็บรวบรวมถ้าเขามีทางเลือก (หนึ่งความแตกต่างก็คือฟาร์จะมีข้อมูลที่ต้องการอยู่กับยอดค่าจ้างค่าโดยสารบวก tips- แต่ข้อมูลเมืองรวมเฉพาะเคล็ดลับการชำระเงินด้วยบัตรเครดิต) กุญแจสำคัญในการวิจัยฟาร์ถูกรวมเป็นคำถามที่ดีกับข้อมูลที่ดี ข้อมูลเพียงอย่างเดียวไม่พอ