2.5 Kết luận

Big dữ liệu ở khắp mọi nơi, nhưng sử dụng nó và các hình thức khác của dữ liệu quan sát để nghiên cứu xã hội là khó khăn. Theo kinh nghiệm của tôi có cái gì đó giống như một không có tài sản ăn trưa miễn phí cho nghiên cứu: nếu bạn không đặt trong rất nhiều công việc thu thập dữ liệu, sau đó bạn có lẽ sẽ phải đặt trong rất nhiều công việc phân tích dữ liệu của bạn hoặc trong suy nghĩ về những gì có trong một câu hỏi thú vị để hỏi về dữ liệu. Dựa trên ý tưởng trong chương này, tôi nghĩ rằng có ba cách chính mà nguồn dữ liệu lớn sẽ có giá trị nhất cho nghiên cứu xã hội:

theo kinh nghiệm xét xử giữa cạnh tranh dự đoán lý thuyết. Ví dụ về các loại công việc này bao gồm Farber (2015) (driver New York Taxi) và King, Pan, and Roberts (2013) (kiểm duyệt ở Trung Quốc)
cải tiến đo lường xã hội đối với chính sách thông qua nowcasting. Một ví dụ của loại hình công việc này là Ginsberg et al. (2009) (Google Trends Flu).
ước tính tác động nhân quả với các thí nghiệm tự nhiên và phù hợp. Ví dụ về các loại công việc này. Mas and Moretti (2009) (peer tác về năng suất) và Einav et al. (2015) (ảnh hưởng của giá khởi điểm bán đấu giá tại eBay).

Nhiều câu hỏi quan trọng trong nghiên cứu xã hội có thể được thể hiện như là một trong ba người. Tuy nhiên, các phương pháp này thường đòi hỏi các nhà nghiên cứu để mang lại nhiều dữ liệu. Điều gì làm cho Farber (2015) thú vị là động lực lý thuyết của phép đo. động lực lý thuyết này đến từ bên ngoài dữ liệu. Như vậy, đối với những người giỏi trong việc đặt một số loại câu hỏi nghiên cứu, các nguồn dữ liệu lớn có thể rất hiệu quả.

Cuối cùng, hơn là lý thuyết định hướng nghiên cứu thực nghiệm (mà đã được tập trung vào chương này), chúng ta có thể lật các kịch bản và tạo ra lý thuyết thực nghiệm theo định hướng. Đó là, thông qua việc tích lũy kinh nghiệm cẩn thận của các sự kiện, mô hình, và câu đố, chúng ta có thể xây dựng các lý thuyết mới.

Thay thế, phương pháp tiếp cận dữ liệu đầu tiên này để thuyết không phải là mới, và nó đã được một cách mạnh mẽ nhất trình bày bởi Glaser and Strauss (1967) với lời kêu gọi của họ cho lý thuyết nền tảng. Cách tiếp cận dữ liệu đầu tiên này, tuy nhiên, không có nghĩa là "sự kết thúc của lý thuyết", như đã được khẳng định bởi nhiều của báo chí xung quanh nghiên cứu trong thời đại kỹ thuật số (Anderson 2008) . Thay vào đó, khi môi trường thay đổi dữ liệu, chúng ta phải mong đợi một sự tái cân bằng trong mối quan hệ giữa lý thuyết và dữ liệu. Trong một thế giới mà thu thập dữ liệu là đắt tiền, nó làm cho cảm giác chỉ thu thập các dữ liệu mà các lý thuyết đề nghị sẽ là hữu ích nhất. Nhưng, trong một thế giới mà một lượng lớn dữ liệu đã có sẵn miễn phí, nó có ý nghĩa cũng thử một cách tiếp cận dữ liệu đầu tiên (Goldberg 2015) .

Như tôi đã trình bày trong chương này, các nhà nghiên cứu có thể học được rất nhiều bằng cách quan sát người. Trong ba chương tiếp theo, tôi sẽ mô tả làm thế nào chúng ta có thể tìm hiểu thêm và khác nhau điều nếu chúng ta chỉnh thu thập dữ liệu của chúng tôi và tương tác với những người trực tiếp hơn bằng cách hỏi họ những câu hỏi (Chương 3), chạy các thử nghiệm (Chương 4), và thậm chí họ tham gia trong quá trình nghiên cứu trực tiếp (Chương 5).