2.3.2.3 Non-representante

Duha ka mga tinubdan sa dili-representativeness mga lain-laing mga populasyon ug lain-laing mga sumbanan sa paggamit.

Big nga data tambong sa sistematikong biased sa duha ka nag-unang mga dalan. Kini dili kinahanglan nga ang usa ka problema alang sa tanan nga matang sa pagtuki, apan alang sa pipila ka pagtuki kini mahimong usa ka kritikal nga sayup.

Usa ka una nga tinubdan sa sistematikong pagpihig mao nga ang mga tawo nadakpan mao ang kasagaran dili ang usa ka bug-os nga uniberso sa tanan nga mga katawhan o sa usa ka random sampol gikan sa bisan unsang piho nga populasyon. Kay sa panig-ingnan, mga Amerikano sa Twitter dili sa usa ka random sample sa mga Amerikano (Hargittai 2015) . Usa ka ikaduha nga tinubdan sa sistematikong pagpihig mao nga sa daghan nga mga dagko nga mga sistema sa data nga pagdakop sa mga buhat, ug ang uban nga mga tawo makatampo daghan pa nga mga buhat kay sa uban. Pananglitan, ang pipila ka mga tawo sa ibabaw sa Twitter amot gatusan ka mga panahon nga mas Tweets kay sa uban. Busa, ang mga panghitabo sa usa ka piho nga plataporma mahimong mas hilabihan reflective sa pipila ka segundaryong mga grupo kay sa plataporma sa iyang kaugalingon.

Kasagaran tigdukiduki gusto nga masayud sa usa ka daghan mahitungod sa mga data nga sila. Apan, nga gihatag sa mga non-representante kinaiya sa dagko nga impormasyon, kini mao ang makatabang sa usab litik, witik sa imong panghunahuna. Ikaw kinahanglan usab nga mahibalo sa usa ka daghan mahitungod sa mga data nga kamo wala. Kini mao ang tinuod nga ilabi na sa diha nga ang mga data nga kamo wala sa mga sistematikong lain-laing mga gikan sa mga data nga kamo adunay. Pananglitan, kon kamo adunay mga talaan nga tawag gikan sa usa ka mobile kompaniya sa telepono sa usa ka kabos nga mga nasod, nga kamo kinahanglan maghunahuna nga dili lang mahitungod sa mga tawo diha sa imong panid, apan usab sa mga tawo nga mahimong kabos kaayo nga iya sa usa ka mobile phone. Dugang pa, sa Kapitulo 3, kita makakat-on kon sa unsang paagi nga kabug-aton makapaarang tigdukiduki aron sa paghimo sa mas maayo nga mga banabana gikan sa dili-representante sa data.