3.6 Aptaujas, kas saistītas ar lieliem datu avotiem

Aptauju saistīšana ar lieliem datu avotiem ļauj jums sagatavot aprēķinus, kuri nebūtu iespējami no viena datu avota individuāli.

Lielākā daļa aptauju ir neatkarīgas, pašpietiekamas pūles. Tās nenodarbojas viens ar otru, un viņi neizmanto visus pārējos pasaulē esošos datus. Tas mainīsies. Ir tikai pārāk daudz, lai to varētu iegūt, saistot aptaujas datus ar lielajiem datu avotiem, kas apskatīti 2. nodaļā. Apvienojot šos divu veidu datus, bieži vien ir iespējams kaut ko darīt neiespējami ne ar vienu, ne individuāli.

Ir vairāki dažādi veidi, kā aptaujas datus apvienot ar lieliem datu avotiem. Šajā sadaļā es raksturošu divas pieejas, kas ir noderīgas un atšķirīgas, un es aicinu viņus bagātināt, lūdzot un pastiprinot jautāšanu (3.12. Attēls). Kaut arī es gatavos ilustrēt katru pieeju ar detalizētu piemēru, jums vajadzētu atzīt, ka šīs ir vispārīgas receptes, kuras varētu izmantot ar dažāda veida apsekojumu datiem un dažādu veidu lieliem datiem. Turklāt jums jāievēro, ka katru no šiem piemēriem var apskatīt divos dažādos veidos. Atceroties 1. nodaļā minētās idejas, daži cilvēki šos pētījumus uzskatīs par "pielāgotus" aptaujas datu piemērus, kas uzlabo "sagatavoto" lielo datu apjomu, un citi uzskata tos par "sagatavoto" lielo datu paraugu, kas uzlabo "pasūtījuma veiktā" aptaujas datus. Jums vajadzētu būt iespējai redzēt abus skatus. Visbeidzot, jums vajadzētu pamanīt, kā šie piemēri paskaidro, ka apsekojumi un lielie datu avoti ir papildinājumi, nevis aizstājēji.

Attēls 3.12: divi veidi, kā apvienot lielus datu avotus un aptaujas datus. Bagātinātajā jautājumā (3.6.1. Sadaļa) lielais datu avots ir galvenais interešu mērs, un aptaujas dati veido nepieciešamo kontekstu. Paplašinātajā jautāšanā (3.6.2. Iedaļa) lielajam datu avotam nav galvenā interešu mērījuma, bet to izmanto, lai paplašinātu aptaujas datus.

Attēls 3.12: divi veidi, kā apvienot lielus datu avotus un aptaujas datus. Bagātinātajā jautājumā (3.6.1. Sadaļa) lielais datu avots ir galvenais interešu mērs, un aptaujas dati veido nepieciešamo kontekstu. Paplašinātajā jautāšanā (3.6.2. Iedaļa) lielajam datu avotam nav galvenā interešu mērījuma, bet to izmanto, lai paplašinātu aptaujas datus.