2.2 ข้อมูลขนาดใหญ่

ข้อมูลขนาดใหญ่จะถูกสร้างและเก็บรวบรวมโดยรัฐบาลเพื่อวัตถุประสงค์อื่นนอกเหนือการวิจัย โดยใช้ข้อมูลนี้สำหรับการวิจัยจึงต้องประสงค์

มุมมองที่เงียบสงบของการวิจัยทางสังคมนึกว่านักวิทยาศาสตร์ที่มีความคิดและจากนั้นเก็บรวบรวมข้อมูลเพื่อทดสอบความคิดที่ว่า รูปแบบของการวิจัยครั้งนี้นำไปสู่​​การพอดีคับระหว่างคำถามการวิจัยและข้อมูล แต่จะมีข้อ จำกัด เนื่องจากนักวิจัยแต่ละคนมักจะไม่ได้มีทรัพยากรที่จำเป็นในการเก็บรวบรวมข้อมูลที่พวกเขาต้องการเช่นข้อมูลขนาดใหญ่ที่อุดมไปด้วยและประเทศชาติตัวแทน ดังนั้นมากของการวิจัยทางสังคมในอดีตที่ผ่านมาได้ใช้ขนาดใหญ่การสำรวจทางสังคมเช่นการสำรวจทั่วไปทางสังคม (GSS) การศึกษาการเลือกตั้งแห่งชาติอเมริกัน (ANES) และการศึกษาแผงของรายได้ Dynamics (PSID) เหล่านี้การสำรวจขนาดใหญ่จะดำเนินการโดยทั่วไปโดยทีมงานของนักวิจัยและพวกเขาได้รับการออกแบบในการสร้างข้อมูลที่สามารถนำมาใช้โดยนักวิจัยหลายคน เพราะในเป้าหมายของการสำรวจเหล่านี้ขนาดใหญ่, การดูแลที่ดีคือการใส่ลงไปในการออกแบบการเก็บรวบรวมข้อมูลและการจัดเตรียมข้อมูลที่เกิดขึ้นสำหรับการใช้งานโดยนักวิจัย ข้อมูลเหล่านี้โดยนักวิจัยและนักวิจัย

การวิจัยทางสังคมส่วนใหญ่ใช้แหล่งยุคดิจิตอล แต่เป็นพื้นฐานที่แตกต่างกัน แทนการใช้ข้อมูลที่เก็บรวบรวมโดยนักวิจัยและนักวิจัยจะใช้แหล่งข้อมูลที่ถูกสร้างขึ้นและเก็บรวบรวมโดยธุรกิจและรัฐบาลเพื่อวัตถุประสงค์ของตนเองเช่นการทำกำไรให้บริการหรือการบริหารกฎหมาย ธุรกิจและรัฐบาลแหล่งข้อมูลเหล่านี้ได้มาจะเรียกว่าข้อมูลขนาดใหญ่ การทำวิจัยกับข้อมูลขนาดใหญ่จะแตกต่างกว่าการทำวิจัยที่มีข้อมูลที่ถูกสร้างขึ้นมาเพื่อการวิจัย เปรียบเทียบตัวอย่างเช่นเว็บไซต์สื่อสังคมเช่น Twitter มีการสำรวจความคิดเห็นของประชาชนแบบดั้งเดิมเช่นการสำรวจสังคมทั่วไป (GSS) เป้าหมายหลักของทวิตเตอร์ที่มีการให้บริการแก่ผู้ใช้และที่จะทำกำไร ในกระบวนการของการบรรลุเป้าหมายเหล่านี้ทวิตเตอร์สร้างข้อมูลที่อาจเป็นประโยชน์สำหรับการศึกษาลักษณะบางอย่างของความคิดเห็นของประชาชน แต่แตกต่างจากการสำรวจสังคมทั่วไป (GSS) ทวิตเตอร์ไม่ได้เน้นหลักในการวิจัยทางสังคม

ข้อมูลขนาดใหญ่ระยะคลุมเครือเฉื่อยชาและกลุ่มร่วมกันสิ่งที่แตกต่างกันมาก สำหรับวัตถุประสงค์ของการวิจัยทางสังคมผมคิดว่ามันเป็นประโยชน์ในการแยกแยะความแตกต่างระหว่างสองชนิดของแหล่งข้อมูลขนาดใหญ่:. บันทึกการบริหารบันทึกการบริหารของรัฐบาลและมีการบันทึกการบริหารธุรกิจรัฐบาลมีข้อมูลที่สร้างขึ้นโดยรัฐบาลเป็นส่วนหนึ่งของกิจกรรมประจำวันของพวกเขา เหล่านี้ชนิดของระเบียนที่ถูกนำมาใช้โดยนักวิจัยในอดีตที่ผ่านมาเช่นประชากรศาสตร์เรียนเกิดการแต่งงานและมีการบันทึก แต่รัฐบาลตายมีมากขึ้นการเก็บรวบรวมและปล่อยบันทึกรายละเอียดในรูปแบบวิ ยกตัวอย่างเช่นรัฐบาลนิวยอร์กซิตี้ติดตั้งเมตรดิจิตอลภายในของทุกรถแท็กซี่ในเมือง เมตรเหล่านี้บันทึกข้อมูลทุกชนิดเกี่ยวกับแต่ละนั่งรถแท็กซี่รวมทั้งคนขับที่เวลาเริ่มต้นและสถานที่เวลาและสถานที่หยุดและค่าโดยสาร ในการศึกษาที่ฉันจะบอกต่อไปในบทนี้เฮนรี่ฟาร์ (2015) repurposed ข้อมูลเหล่านี้ไปยังที่อยู่การอภิปรายพื้นฐานในสาขาเศรษฐศาสตร์แรงงานเกี่ยวกับความสัมพันธ์ระหว่างค่าจ้างรายชั่วโมงและจำนวนชั่วโมงการทำงาน

ที่สองประเภทหลักของข้อมูลขนาดใหญ่สำหรับการวิจัยทางสังคมเป็นบันทึกการบริหารธุรกิจ เหล่านี้เป็นข้อมูลที่ว่าธุรกิจสร้างและรวบรวมเป็นส่วนหนึ่งของกิจกรรมประจำวันของพวกเขา บันทึกการบริหารธุรกิจเหล่านี้มักจะเรียกว่าร่องรอยดิจิตอลและรวมถึงสิ่งที่ต้องการบันทึกแบบสอบถามเครื่องมือค้นหาโพสต์สื่อสังคมและการบันทึกการโทรจากโทรศัพท์มือถือ ฉกรรจ์บันทึกการบริหารธุรกิจเหล่านี้จะไม่เพียงเกี่ยวกับพฤติกรรมออนไลน์ ยกตัวอย่างเช่นร้านค้าที่ใช้เครื่องสแกนเช็คเอากำลังสร้างมาตรการในเวลาจริงของการผลิตของผู้ปฏิบัติงาน ในการศึกษาที่ฉันจะบอกคุณเกี่ยวกับการต่อไปในบทนี้ Alexandre Mas และ Enrico เร็ต (2009) repurposed ซูเปอร์มาร์เก็ตข้อมูลนี้เช็คเอาท์เพื่อศึกษาวิธีการผลิตแรงงานได้รับผลกระทบจากผลผลิตของเพื่อนของพวกเขา

ขณะที่ทั้งสองตัวอย่างเหล่านี้แสดงให้เห็นถึงความคิดของประสงค์เป็นพื้นฐานการเรียนรู้จากข้อมูลขนาดใหญ่ จากประสบการณ์ของผมสังคมนักวิทยาศาสตร์และนักวิทยาศาสตร์ข้อมูลวิธีนี้ repurposing แตกต่างกันมาก นักวิทยาศาสตร์สังคมที่มีความคุ้นเคยกับการทำงานกับข้อมูลที่ออกแบบมาสำหรับการวิจัยมีความรวดเร็วในการชี้ให้เห็นปัญหาที่เกิดขึ้นกับข้อมูล repurposed ขณะที่ละเลยจุดแข็งของ ในทางตรงกันข้ามนักวิทยาศาสตร์ข้อมูลมีความรวดเร็วในการชี้ให้เห็นถึงประโยชน์ของข้อมูล repurposed ในขณะที่ละเลยจุดอ่อนของมัน ธรรมชาติวิธีที่ดีที่สุดที่จะเป็นไฮบริด นั่นคือนักวิจัยต้องเข้าใจลักษณะของแหล่งใหม่ของข้อมูลเหล่านี้ทั้งดีและไม่ดีและแล้วคิดออกว่าจะเรียนรู้จากพวกเขา และนั่นคือแผนสำหรับส่วนที่เหลือของบทนี้ ต่อไปผมจะอธิบายสิบลักษณะทั่วไปของธุรกิจและรัฐบาลในการบริหารข้อมูล หลังจากนั้นผมจะอธิบายสามวิธีการวิจัยที่สามารถนำมาใช้กับข้อมูลเหล่านี้วิธีการที่เหมาะกับลักษณะของข้อมูลนี้