2.5 สรุป

ข้อมูลขนาดใหญ่ที่มีอยู่ทั่วไป แต่ใช้มันและรูปแบบอื่น ๆ ของข้อมูลการสังเกตสำหรับการวิจัยทางสังคมเป็นเรื่องยาก จากประสบการณ์ของผมมีบางอย่างเหมือนไม่มีสถานที่ให้บริการอาหารกลางวันฟรีสำหรับการวิจัย: ถ้าคุณไม่ใส่ในจำนวนมากของการทำงานการเก็บรวบรวมข้อมูลแล้วคุณอาจจะต้องใส่ในการทำงานมากการวิเคราะห์ข้อมูลของคุณหรือในความคิดเกี่ยวกับ สิ่งที่อยู่ในคำถามที่น่าสนใจที่จะขอข้อมูล ขึ้นอยู่กับความคิดในบทนี้ผมคิดว่ามีสามวิธีหลักที่แหล่งที่มาของข้อมูลขนาดใหญ่จะมีคุณค่ามากที่สุดสำหรับการวิจัยทางสังคม:

  • สังเกตุกะเทาะเปลือกระหว่างการแข่งขันการคาดการณ์ในเชิงทฤษฎี ตัวอย่างของงานประเภทนี้ ได้แก่ Farber (2015) (คนขับรถแท็กซี่นิวยอร์ก) และ King, Pan, and Roberts (2013) (เซ็นเซอร์ในประเทศจีน)
  • การวัดทางสังคมที่ดีขึ้นสำหรับนโยบายผ่าน nowcasting ตัวอย่างของงานประเภทนี้เป็น Ginsberg et al. (2009) (Google แนวโน้มไข้หวัดใหญ่)
  • การประเมินผลกระทบเชิงสาเหตุที่มีการทดลองทางธรรมชาติและการจับคู่ ตัวอย่างของชนิดของการทำงาน. นี้ Mas and Moretti (2009) (ผลกระทบเพียร์ในการผลิต) และ Einav et al. (2015) (ผลกระทบจากราคาเริ่มต้นในการประมูลที่อีเบย์)

คำถามที่สำคัญมากในการวิจัยทางสังคมอาจจะแสดงออกว่าเป็นหนึ่งในสามคนนี้ แต่วิธีการเหล่านี้โดยทั่วไปจำเป็นต้องนักวิจัยที่จะนำมากให้ข้อมูล สิ่งที่ทำให้ Farber (2015) ที่น่าสนใจคือแรงจูงใจทฤษฎีการวัด นี้แรงจูงใจทางทฤษฎีมาจากภายนอกข้อมูล ดังนั้นสำหรับผู้ที่มีดีที่ถามบางประเภทของคำถามการวิจัยแหล่งข้อมูลขนาดใหญ่สามารถมีผลมาก

สุดท้ายมากกว่าทฤษฎีที่ขับเคลื่อนด้วยการวิจัยเชิงประจักษ์ (ซึ่งได้รับความสนใจในบทนี้) เราสามารถพลิกสคริปต์และสร้างทฤษฎีสังเกตุที่ขับเคลื่อนด้วย นั่นคือผ่านการสะสมความระมัดระวังของข้อเท็จจริงเชิงประจักษ์รูปแบบและปริศนาที่เราสามารถสร้างทฤษฎีใหม่

ทางเลือกวิธีการที่ข้อมูลนี้เป็นครั้งแรกกับทฤษฎีไม่ใช่เรื่องใหม่และมันก็ก้องมากที่สุดอย่างแข็งขันโดย Glaser and Strauss (1967) กับสายของพวกเขาสำหรับทฤษฎีจากข้อมูลพื้นฐาน วิธีนี้ข้อมูลครั้งแรก แต่ไม่ได้หมายความว่า "ในตอนท้ายของทฤษฎี" ที่ได้รับการอ้างสิทธิโดยมากวารสารศาสตร์รอบการวิจัยในยุคดิจิตอล (Anderson 2008) แต่ขณะที่การเปลี่ยนแปลงสภาพแวดล้อมของข้อมูลที่เราจะต้องคาดหวังเรื่องสมดุลในความสัมพันธ์ระหว่างทฤษฎีและข้อมูลที่ ในโลกที่การเก็บรวบรวมข้อมูลมีราคาแพงก็จะทำให้ความรู้สึกในการเก็บรวบรวมเฉพาะข้อมูลที่ทฤษฎีแนะนำจะเป็นประโยชน์มากที่สุด แต่ในโลกที่มีจำนวนมหาศาลของข้อมูลที่มีอยู่แล้วสามารถใช้ได้ฟรีก็จะทำให้ความรู้สึกที่จะยังลองใช้วิธีข้อมูลครั้งแรก (Goldberg 2015)

ขณะที่ผมได้แสดงให้เห็นในบทนี้นักวิจัยสามารถเรียนรู้มากจากคนดู ในสามบทต่อไปผมจะอธิบายวิธีการที่เราสามารถเรียนรู้สิ่งต่างๆมากขึ้นและแตกต่างกันถ้าเราตัดการเก็บรวบรวมข้อมูลของเราและมีปฏิสัมพันธ์กับผู้คนมากขึ้นโดยตรงโดยการถามคำถามพวกเขา (บทที่ 3) วิ่งทดลอง (บทที่ 4) และแม้กระทั่งเกี่ยวข้องกับพวกเขา ในกระบวนการวิจัยโดยตรง (บทที่ 5)