2.3.8 Algoritmikoki nahastuta

Datu sistema handien portaera ez da naturala; sistemen ingeniaritzako helburuak bultzatuta.

Datu-iturri handiak asko ez diren arren, jendeak ez dakiela bere datuak erregistratzen ari direnik (2.3.3 atala), ikertzaileek ez lukete kontuan hartu behar lineako sistemen portaera "gerturatzea" dela. Egiaz, portaera erregistratzen duten sistema digitalak oso diseinatuta dago jokabide zehatzak bultzatzeko, esate baterako, iragarkietan klik egitean edo edukiak argitaratzean. Sistemako diseinatzaileen helburuak datuen ereduak txertatzeko moduak deitzen dira nahasketa algoritmikoak . Konfigurazio algoritmikoa oso ezezaguna da gizarte zientzialariei, baina datu zientzialari zainduen artean kezka nagusia da. Eta, aztarna digitaletako beste arazo batzuen artean ez bezala, nahasmena algoritmikoa neurri handi batean ikusezina da.

Nahasmena algoritmikoaren adibide nahiko erraza da Facebook-en erabiltzaile anomaloez oso gutxi duten 20 lagun inguru dituztela, Johan Ugander eta lankideek (2011) aurkitu zuten moduan. Zientzialariek datu hauek aztertzen ez badituzte, nola funtzionatzen duten Facebookek nolabait esateko, 20 zenbaki sozial magiko bat nola sortu den azaltzen da. Zorionez, Ugandek eta bere lankideek informazio hori sortu zuten prozesuaren ulermen handia izan zuten eta Facebook-ek Facebook-ekin lotura gutxi izan zezakeela aditzera eman zien Facebook-k lagun gehiago egiteko 20 lagun iritsi ziren arte. Ugandako eta lankideek ez dutela esaten hori paperean, politika hau Facebook-ek sortu zuen, erabiltzaile berriak aktiboago bihurtzeko asmoz. Politikaren existentziari buruz jakin gabe, ordea, erraza da datuetatik okerreko ondorioa ateratzea. Beste era batera esanda, 20 lagun inguru dituzten pertsonen harrigarriro kopuru handia Facebook-ri buruzkoa da, giza jokabideari buruz baino.

Aurreko adibide honetan, nahasketa algoritmikoak emaitza bitxi bat sortu zuen ikertzaile arduratsuak ikertzeko eta ikertzeko. Hala eta guztiz ere, konfuzio algoritmikoaren bertsio maltzurraren bat ere badago, sistemen diseinatzaileek teoria sozialen jakitun direnean eta teoria horiek beren sistemen funtzionamenduan sartzen direnean. Gizarte zientzialariek deitu performatibitatea honetan: teoria bat mundu aldatzen denean modu bat munduari ekarri duela gehiago teoriaren ildotik sartu, hala nola. Konputazio algoritmiko performatiboaren kasuan, datuen izaera nahasgarria detektatzeko oso zaila da.

Performatibitateak sortutako eredu baten adibidea sare sozialen sareetan transistitzen da. 1970eko eta 1980ko hamarkadan, ikertzaileek behin eta berriz aurkitu zuten Alice eta Bob-en lagunak baziren ere, Alice eta Bob lagunak izan ohi ziren elkarren artean bi ausaz aukeratutako pertsonak baziren. Eredu berbera Facebook-en grafiko sozialean aurkitu da (Ugander et al. 2011) . Horrela, adiskidetasunaren ereduak Facebooken errepikatzeko adiskidetasun linealen ereduak errepikatuko lirateke, gutxienez transaktibitateari dagokionez. Hala eta guztiz ere, Facebookeko gizarte grafikoaren iragazkortasunaren magnitudea partzialki nahastu algoritmatikoa da. Hau da, Facebook-en datu zientzialariek trantsitibotasunari buruzko ikerketa enpiriko eta teorikoaz jabetu eta, ondoren, nola funtzionatzen duen Facebooken labean. Facebook-ek "Pertsonak ezagutu ditzakezun" eginbidea du, lagun berriak iradokitzen dituena, eta Facebook-ek zuretzako iradokitzen duena erabakitzen duen modu bat da. Hau da, Facebook litekeena da lagunekin lagunekin lagun egitea gomendatzea. Ezaugarri horri esker, Facebookeko gizarte-grafikoan iragazkortasuna areagotzearen eragina du. Beste era batera esanda, transistentzia teoriak munduak teoriaren iragarpenekin bat egiten du (Zignani et al. 2014; Healy 2015) . Horrela, datu-iturri handiek teoria sozialaren iragarpenak erreproduzitzen badituzte, ziur egon behar dugu teoria bera ez zela sistema nola funtzionatu.

Datu-iturri handien pentsamendua ezarpen natural batean behatzea bezainbatean, kasinoko jendea behatzeko metafora egokiagoa da. Kasinoek zenbait jokabide bultzatu nahi dituzten inguruneak diseinatu dituzte, eta ikertzaile batek ez luke kasino kasinoan jokabide bakarreko leiho bat sartu beharrik izan beharrik izango. Jakina, giza jokabideari buruz zerbait ikasi ahal izango duzu kasinoko jendea aztertuz, kasinoko datuek kasinoa sortzen ari diren kasuetan baztertu badituzu, ondorio txarrak sor ditzakezu.

Zoritxarrez, konfuzio algoritmikoari aurre egitea zaila da bereziki, sistema elektronikoen ezaugarri asko jabeduna, gaizki dokumentatua eta etengabe aldatuz gero. Adibidez, kapitulu honetan azalduko dudan bezala, nahasketa algoritmikoak Google-ren Gripearen Trends (2.4.2. Atala) pixkanaka desegiteko azalpen posiblea izan zen, baina erreklamazio hau zaila izan zen ebaluatzea Google-ren bilaketa-algoritmoaren barne funtzionamenduak jabetza-. Konfuzio algoritmikoaren izaera dinamikoa sistema deribatuaren forma bat da. Konfigurazio algoritmikoak esan nahi du sistema digital bakar batetik datorren giza jokabideari buruzko edozein erreklamazioei buruz kontu handiz ibili behar dela.