3.1 Giới thiệu

Các nhà nghiên cứu học cá heo không thể đặt câu hỏi cho họ và do đó buộc phải cố gắng tìm hiểu về cá heo bằng cách quan sát hành vi của chúng. Các nhà nghiên cứu nghiên cứu con người, mặt khác, dễ dàng hơn: những người trả lời có thể nói chuyện. Nói chuyện với mọi người là một phần quan trọng của nghiên cứu xã hội trong quá khứ, và tôi hy vọng rằng nó sẽ là trong tương lai.

Trong nghiên cứu xã hội, nói chuyện với mọi người thường có hai hình thức: khảo sát và phỏng vấn sâu. Nói chung, nghiên cứu sử dụng các cuộc khảo sát liên quan đến việc tuyển dụng có hệ thống số lượng người tham gia lớn, bảng câu hỏi có cấu trúc cao và sử dụng các phương pháp thống kê để khái quát hóa từ những người tham gia đến một dân số lớn hơn. Nghiên cứu sử dụng các cuộc phỏng vấn sâu, mặt khác, thường bao gồm một số ít người tham gia, các cuộc hội thoại bán cấu trúc, và kết quả trong một mô tả phong phú, định tính của những người tham gia. Khảo sát và phỏng vấn sâu là cả hai cách tiếp cận mạnh mẽ, nhưng các cuộc điều tra bị ảnh hưởng nhiều hơn bởi sự chuyển đổi từ tương tự sang thời đại kỹ thuật số. Do đó, trong chương này, tôi sẽ tập trung vào nghiên cứu khảo sát.

Như tôi sẽ trình bày trong chương này, thời đại kỹ thuật số tạo ra nhiều cơ hội thú vị để các nhà nghiên cứu thu thập dữ liệu nhanh hơn và rẻ hơn, hỏi các loại câu hỏi khác nhau và tăng giá trị của dữ liệu khảo sát với các nguồn dữ liệu lớn. Tuy nhiên, ý tưởng cho rằng nghiên cứu khảo sát có thể được biến đổi bởi một thay đổi công nghệ không phải là mới. Khoảng năm 1970, một sự thay đổi tương tự đã được thực hiện bởi một công nghệ truyền thông khác nhau: điện thoại. May mắn thay, sự hiểu biết làm thế nào điện thoại thay đổi nghiên cứu khảo sát có thể giúp chúng ta tưởng tượng như thế nào thời đại kỹ thuật số sẽ thay đổi nghiên cứu khảo sát.

Nghiên cứu khảo sát, như chúng ta nhận ra nó ngày nay, bắt đầu vào những năm 1930. Trong thời kỳ nghiên cứu khảo sát đầu tiên, các nhà nghiên cứu sẽ lấy mẫu ngẫu nhiên các khu vực địa lý (chẳng hạn như các khối thành phố) và sau đó đi đến các khu vực đó để có cuộc trò chuyện trực tiếp với những người trong các hộ mẫu ngẫu nhiên. Sau đó, một sự phát triển công nghệ - sự phổ biến rộng rãi của điện thoại cố định ở các nước giàu có - cuối cùng dẫn đến nghiên cứu khảo sát thứ hai. Kỷ nguyên thứ hai này khác nhau về cách mọi người được lấy mẫu và trong cách các cuộc hội thoại diễn ra. Trong kỷ nguyên thứ hai, thay vì lấy mẫu hộ gia đình ở các khu vực địa lý, các nhà nghiên cứu lấy ngẫu nhiên các số điện thoại trong một thủ tục gọi là quay số ngẫu nhiên . Và thay vì đi du lịch để nói chuyện với những người mặt đối mặt, các nhà nghiên cứu thay vào đó gọi họ trên điện thoại. Đây có thể là những thay đổi nhỏ về hậu cần, nhưng họ đã thực hiện nghiên cứu khảo sát nhanh hơn, rẻ hơn và linh hoạt hơn. Ngoài việc được trao quyền, những thay đổi này cũng gây nhiều tranh cãi bởi vì nhiều nhà nghiên cứu lo ngại rằng các quy trình lấy mẫu và phỏng vấn mới này có thể đưa ra một loạt các thành kiến. Nhưng cuối cùng, sau nhiều công việc, các nhà nghiên cứu đã tìm ra cách thu thập dữ liệu một cách đáng tin cậy bằng cách sử dụng các cuộc phỏng vấn điện thoại và quay số ngẫu nhiên. Vì vậy, bằng cách tìm ra cách để khai thác thành công cơ sở hạ tầng công nghệ của xã hội, các nhà nghiên cứu đã có thể hiện đại hóa cách họ nghiên cứu khảo sát.

Bây giờ, một phát triển công nghệ khác — kỷ nguyên số — cuối cùng sẽ đưa chúng ta đến một nghiên cứu khảo sát thứ ba. Sự chuyển đổi này đang được thúc đẩy một phần bởi sự phân rã dần dần của các phương pháp tiếp cận thời đại thứ hai (BD Meyer, Mok, and Sullivan 2015) . Ví dụ, vì nhiều lý do công nghệ và xã hội, tỷ lệ không phản hồi — tức là, tỷ lệ những người lấy mẫu không tham gia vào các cuộc điều tra — đã gia tăng trong nhiều năm (National Research Council 2013) . Những xu hướng dài hạn này có nghĩa là tỷ lệ không phản hồi có thể vượt quá 90% trong các cuộc khảo sát qua điện thoại tiêu chuẩn (Kohut et al. 2012) .

Mặt khác, việc chuyển đổi sang thời đại thứ ba cũng đang được thúc đẩy một phần bởi những cơ hội mới thú vị, một số trong đó tôi sẽ mô tả trong chương này. Mặc dù mọi thứ vẫn chưa được giải quyết, tôi hy vọng rằng nghiên cứu khảo sát thứ ba sẽ được đặc trưng bởi việc lấy mẫu không xác suất, phỏng vấn máy tính và liên kết các cuộc điều tra với các nguồn dữ liệu lớn (bảng 3.1).

Bảng 3.1: Ba nghiên cứu khảo sát dựa trên Groves (2011)
Lấy mẫu Phỏng vấn Môi trường dữ liệu
Kỷ nguyên đầu tiên Lấy mẫu xác suất khu vực Mặt đối mặt Cuộc khảo sát độc lập
Kỷ nguyên thứ hai Lấy mẫu xác suất quay số ngẫu nhiên (RDD) Điện thoại Cuộc khảo sát độc lập
Kỷ nguyên thứ ba Lấy mẫu không xác suất Quản lý máy tính Khảo sát được liên kết với các nguồn dữ liệu lớn

Sự chuyển đổi giữa thời đại thứ hai và thứ ba của nghiên cứu khảo sát chưa hoàn toàn suôn sẻ, và đã có những cuộc tranh luận gay gắt về cách các nhà nghiên cứu nên tiến hành. Nhìn lại quá trình chuyển đổi giữa thời kỳ đầu tiên và lần thứ hai, tôi nghĩ có một sự thấu triệt quan trọng đối với chúng ta bây giờ: sự khởi đầu không phải là kết thúc . Đó là, ban đầu nhiều phương thức dựa trên điện thoại thứ hai là quảng cáo đặc biệt và không hoạt động tốt. Nhưng, thông qua công việc khó khăn, các nhà nghiên cứu đã giải quyết những vấn đề này. Ví dụ, các nhà nghiên cứu đã thực hiện quay số ngẫu nhiên trong nhiều năm trước khi Warren Mitofsky và Joseph Waksberg phát triển một phương pháp lấy mẫu quay số ngẫu nhiên có tính chất thực tế và lý thuyết tốt (Waksberg 1978; ??? ) . Do đó, chúng ta không nên nhầm lẫn giữa các phương pháp tiếp cận thời đại thứ ba với các kết quả cuối cùng của chúng.

Lịch sử nghiên cứu khảo sát cho thấy lĩnh vực này phát triển, được thúc đẩy bởi những thay đổi về công nghệ và xã hội. Không có cách nào để ngăn chặn sự tiến hóa đó. Thay vào đó, chúng ta nên nắm lấy nó, trong khi tiếp tục vẽ sự khôn ngoan từ thời đại trước đó, và đó là cách tiếp cận mà tôi sẽ đưa vào chương này. Đầu tiên, tôi sẽ lập luận rằng các nguồn dữ liệu lớn sẽ không thay thế các khảo sát và sự phong phú của các nguồn dữ liệu lớn tăng lên - không giảm - giá trị của các cuộc điều tra (phần 3.2). Với động lực đó, tôi sẽ tóm tắt khung tổng số lỗi khảo sát (phần 3.3) đã được phát triển trong hai giai đoạn đầu tiên của nghiên cứu khảo sát. Khung này cho phép chúng ta hiểu các cách tiếp cận mới để biểu diễn - đặc biệt, các mẫu không xác suất (phần 3.4) - và các phương pháp tiếp cận mới để đo lường - đặc biệt là các cách mới để đặt câu hỏi cho người trả lời (phần 3.5). Cuối cùng, tôi sẽ mô tả hai mẫu nghiên cứu để liên kết dữ liệu khảo sát với các nguồn dữ liệu lớn (phần 3.6).