3.6 Sondaje legate de mari surse de date

Legarea anchetelor către sursele de date mari vă permite să realizați estimări care ar fi imposibile fie cu fiecare sursă de date în parte.

Cele mai multe sondaje sunt eforturi independente și independente. Ei nu se construiesc unul pe altul și nu profită de toate celelalte date care există în lume. Acest lucru se va schimba. Există prea multe lucruri care pot fi obținute prin conectarea datelor din sondaj la sursele de date de mari dimensiuni discutate în capitolul 2. Prin combinarea acestor două tipuri de date, este adesea posibil să faci ceva care nu a fost posibil cu nici unul singur.

Există câteva moduri diferite în care datele anchetei pot fi combinate cu surse mari de date. În această secțiune, voi descrie două abordări care sunt utile și distincte și le voi numi îmbogățite cerând și amplificând întrebarea (figura 3.12). Deși am să ilustrez fiecare abordare cu un exemplu detaliat, trebuie să recunoașteți că acestea sunt rețete generale care ar putea fi utilizate cu diferite tipuri de date de anchetă și diferite tipuri de date mari. Mai mult, ar trebui să observați că fiecare dintre aceste exemple ar putea fi văzut în două moduri diferite. Revenind la ideile din capitolul 1, unii oameni vor vedea aceste studii drept exemple de date "sintetice" personalizate care vor spori datele "gata", iar alții le vor vedea drept exemple de date "sintetizate" care măresc datele "personalizate". Ar trebui să puteți vedea ambele vederi. În cele din urmă, ar trebui să observați modul în care aceste exemple clarifică faptul că sondajele și sursele de date mari sunt complete și nu substitute.

Figura 3.12: Două moduri de combinare a surselor mari de date și a datelor din sondaj. Într-o întrebare îmbogățită (secțiunea 3.6.1), sursa mare de date are o mărime de interes și datele din sondaj construiesc contextul necesar în jurul acesteia. Într-o întrebare amplificată (secțiunea 3.6.2), sursa mare de date nu are o miez de interes, ci este utilizată pentru a amplifica datele din sondaj.

Figura 3.12: Două moduri de combinare a surselor mari de date și a datelor din sondaj. Într-o întrebare îmbogățită (secțiunea 3.6.1), sursa mare de date are o mărime de interes și datele din sondaj construiesc contextul necesar în jurul acesteia. Într-o întrebare amplificată (secțiunea 3.6.2), sursa mare de date nu are o miez de interes, ci este utilizată pentru a amplifica datele din sondaj.