7.2.1 . Смешивание готовых файлов и custommades

Ни чистая готовая стратегия, ни чистая стратегия custommade полностью не используют возможности цифрового века. В будущем мы собираемся создавать гибриды.

Во вступлении я сравнил готовый стиль Марселя Дюшана с стильным стилем Микеланджело. Этот контраст также отражает разницу между учеными-данными, которые, как правило, работают с готовыми, и социологами, которые склонны работать с custommades. В будущем, однако, я ожидаю, что мы увидим больше гибридов, потому что каждый из этих чистых подходов ограничен. Исследователи, которые хотят использовать только готовые версии, будут бороться, потому что в мире не так много красивых матчей. Исследователи, которые хотят использовать только custommades, с другой стороны, собираются пожертвовать масштабом. Гибридные подходы, однако, могут сочетать масштаб, который поставляется с готовыми версиями, с плотной подгонкой между вопросом и данными, которые поступают из custommades.

Мы видели примеры этих гибридов в каждой из четырех эмпирических глав. В главе 2 мы увидели, как Google Flu Trends объединили постоянную большую систему данных (поисковые запросы) с традиционной системой оценки на основе вероятности (система наблюдения за гриппом CDC) для получения более быстрых оценок (Ginsberg et al. 2009) . В главе 3 мы видели, как Стивен Ансолабехер и Эйтан Херш (2012) объединили данные опроса, сделанные по индивидуальному заказу, с готовыми государственными административными данными, чтобы узнать больше о характеристиках людей, которые фактически голосуют. В главе 4 мы увидели, как эксперименты Оповера объединили готовую инфраструктуру измерения электричества с помощью кустарной обработки для изучения влияния социальных норм на поведение миллионов людей (Allcott 2015) . Наконец, в главе 5 мы увидели, как Кеннет Бенуа и его коллеги (2016) применяли процесс кодирования толстой кишки в готовый набор манифеста, созданный политическими партиями, для создания данных, которые исследователи могут использовать для изучения динамики политических дебатов.

Все эти четыре примера показывают, что мощная стратегия в будущем будет заключаться в обогащении больших источников данных, которые не созданы для исследований, с дополнительной информацией, которая делает их более подходящими для исследований (Groves 2011) . Независимо от того, начинается ли это custommade или готовым, этот гибридный стиль имеет большие перспективы для многих проблем исследования.