2.3.7 Drifting

Biztanleriaren garraioa, erabilerarako garraioa eta sistema deritzoek epe luzeko joerak aztertzeko datu-iturri handiak erabiltzen dituzte.

Datu iturri askoren abantaila handienetako bat denboran zehar datuak biltzen ditu. Gizarte zientzialariek denbora luzez datu luzetarako datuak deitzen dituzte. Eta, jakina, luzerako datuak oso garrantzitsuak dira aldaketa aztertzeko. Aldaketak modu fidagarrian neurtzeko, hala ere, neurketa sistema bera egonkorra izan behar da. Otis Dudley Duncan soziologoaren hitzetan, "Aldaketa neurtu nahi baduzu, ez aldatu neurri hori" (Fischer 2011) .

Zoritxarrez, datu sistema handiak (batez ere negozio-sistemak) denbora guztian aldatzen ari dira, nora eramango dudan prozesu bat. Bereziki, sistema horiek hiru modu nagusitan aldatzen dira: biztanleriaren noraeza (horiek erabiltzean aldaketak), portaera narriadura (pertsonak erabiltzen dituzten aldaketak), eta sistemaren noraeza ( sistemaren aldaketa bera). Hiru iturri narriadurak esan nahi du datu-iturri handi baten eredua munduan aldaketa garrantzitsu batek eragin dezakeela edo nolabaiteko nolabaiteko eragina izan dezakeela.

Drogei buruzko biztanleriaren deriba lehen iturburua sisteman erabiltzen ari den aldaketak eragiten du, eta aldaketa horiek aldi laburrean eta luzean gerta daitezke. Adibidez, 2012ko hauteskundeetako AEBetako hauteskundeetan emakumeek idatzitako politiken inguruko tweeten proportzioa egunetik egunera (Diaz et al. 2016) . Horrela, Twitter-bertsoaren umore aldaketaren bat gertatuko balitz, agian, une batez hitz egiten duen norbaiten aldaketa izango litzateke. Epe laburrerako gorabeheren gain, talde demografiko jakin batzuen epe luzerako joera izan da Twitteren hartzea eta alde batera utzi gabe.

Sistemak erabiltzen dituen aldaketaz gain, sistemak nola erabiltzen diren aldaketak ere baditu, jokabidearen deriva deitzen dudanean. Esate baterako, 2013an Okzitani Gezi protestak Turkiakoan, protestanteek hashtagen erabilera aldatu zuten protesta gisa. Hona hemen nola Zeynep Tufekci (2014) jokabidearen narrazioa deskribatu zuen, zeinetan Twitter-en portaera behatu baitzuen, eta pertsonan:

"Zer gertatu zen, protesta istorioa menderatzailearena izan zen bezain laster, jende kopuru handia ... gelditu zen hashtagak erabiliz, fenomeno berri bati arreta jartzea izan ezik ... Protestek jarraitu eta areagotu egin zuten hashtagak. Elkarrizketek bi arrazoi agerian utzi dituzte. Lehenik eta behin, denek bazekien gaia, hashtag aldi berean superfluous eta kaltegarriak karpetan mugatutako Twitter plataforman. Bigarrenik, hashtagak oso baliagarriak izan dira gai jakin bati arreta erakartzeko, ezta horri buruz hitz egiteko ".

Horrela, ikertzaile izan ziren protestak ikasten protesta erlazionatutako hashtagekin tweets aztertuz zer gertatzen ari zen baita jokabidearen drift horren zentzua desitxuratu bat izango litzateke. Esate baterako, uste dute protesta eztabaidan jaitsi luze gutxitu egin baino lehen.

Deriva mota hirugarren sistema derbia da. Kasu honetan, ez da jendea aldatzen edo haien portaera aldatzen, baina sistema bera aldatzen da. Esate baterako, denboran zehar, Facebook-ek eguneraketaren iraupenaren muga handitu du. Horrela, egoera-eguneratzeen azterketa luzeko edozein aldaketak eragindako artifacts izango dira. Sistemaren nolabaiteko nahasketa algoritmikoak deritzon arazoari lotua dago, 2.3.8. Atalean azalduko dudana.

Bigarrenik, datu-iturri handiak asko erabiltzen ari dira aldaketak izan ditzakeen aldaketengatik, nola erabiltzen ari diren eta nola funtzionatzen duten sistemek. Aldaketaren iturri horiek batzuetan ikerketa interesgarriak dira, baina aldaketa horiek denboran zehar epe luzeko aldaketak jarraitzeko datu-iturri handiak zailtzen dituzte.