7.2.1 Mieszanie gotowych i kunsztownych

Ani czysta strategia gotowa, ani czysta strategia custommade w pełni nie wykorzystuje możliwości ery cyfrowej. W przyszłości zamierzamy stworzyć hybrydy.

We wstępie zestawiłem gotycki styl Marcela Duchampa z stylem custommade Michała Anioła. Ten kontrast pokazuje również różnicę między naukowcami zajmującymi się danymi, którzy pracują z gotowymi osobami, a naukowcami społecznymi, którzy pracują z klientami. W przyszłości jednak spodziewam się, że zobaczymy więcej hybryd, ponieważ każde z tych czystych podejść jest ograniczone. Badacze, którzy chcą korzystać tylko z gotowych tekstów, będą walczyć, ponieważ na świecie nie ma zbyt wielu pięknych gotowych tekstów. Natomiast badacze, którzy chcą korzystać tylko z usług kancelarii, poświęcą skalę. Podejścia hybrydowe mogą jednak łączyć skalę, która przychodzi z gotowością, z ciasnym dopasowaniem między pytaniem a danymi pochodzącymi od klientów.

Widzieliśmy przykłady tych hybryd w każdym z czterech rozdziałów empirycznych. W rozdziale 2 zobaczyliśmy, w jaki sposób Google Flu Trends połączyło system dużych zbiorów danych (zapytania wyszukiwania) z tradycyjnym systemem pomiarowym opartym na prawdopodobieństwie (system nadzoru grypy CDC), aby uzyskać szybsze oszacowania (Ginsberg et al. 2009) . W rozdziale 3 zobaczyliśmy, jak Stephen Ansolabehere i Eitan Hersh (2012) połączyli dane z ankiet przeprowadzonych na zamówienie z gotowymi danymi administracyjnymi rządu, aby dowiedzieć się więcej o cechach osób, które faktycznie głosują. W rozdziale 4 zobaczyliśmy, w jaki sposób eksperymenty Opower połączyły gotową infrastrukturę do pomiaru energii elektrycznej z procesem custommade, aby zbadać wpływ norm społecznych na zachowanie milionów ludzi (Allcott 2015) . Na koniec, w rozdziale 5, zobaczyliśmy, jak Kenneth Benoit i jego koledzy (2016) zastosowali proces kategoryzacji tłumu do gotowego zestawu manifestów stworzonych przez partie polityczne w celu stworzenia danych, które naukowcy mogą wykorzystać do badania dynamiki debat politycznych.

Wszystkie te cztery przykłady pokazują, że potężną strategią w przyszłości będzie wzbogacanie dużych źródeł danych, które nie są tworzone do badań, z dodatkowymi informacjami, które czynią je bardziej odpowiednimi do badań (Groves 2011) . Niezależnie od tego, czy zaczyna się od klienta, czy też gotowości, ten hybrydowy styl jest obiecujący dla wielu problemów badawczych.