2.3.8 Algoritme konfuzita

Konduto en grandaj datumaj sistemoj ne estas natura; ĝi estas pelita de la inĝenieroj de la sistemoj.

Kvankam multaj grandaj datumaj fontoj estas neaktivaj, ĉar homoj ne konscias, ke iliaj datumoj estas registritaj (sekcio 2.3.3), esploristoj ne konsideras konduton en ĉi tiuj sistemoj en linio "nature okazantaj". Fakte, la ciferecaj sistemoj, kiuj registras konduton, estas tre entreprenita por indukti specifajn kondutojn kiel alklakante anoncojn aŭ afiŝantajn enhavojn. La manieroj, kiujn la celoj de sistemaj diseñistoj povas enmeti ŝablonojn en datumojn, nomas algoritma konflikto . Algoritma konflikto estas relative nekonata al sociaj sciencistoj, sed ĝi estas grava maltrankvilo inter zorgaj datumaj sciencistoj. Kaj, kontraste kun iuj el la aliaj problemoj kun ciferecaj spuroj, algoritma konflikto estas plejparte nevidebla.

Relative simpla ekzemplo de algoritma konflikto estas la fakto, ke en Facebook estas anomale alta numero de uzantoj kun proksimume 20 amikoj, kiel estis malkovrita fare de Johan Ugander kaj kolegoj (2011) . Scienculoj analizantaj ĉi tiun informon sen kompreno pri kiel Facebook funkcias povus nedubeble generi multajn rakontojn pri kiel 20 estas ia magia socia nombro. Feliĉe, Ugander kaj liaj kolegoj havis grandan komprenon pri la procezo, kiu generis la datumojn, kaj ili sciis, ke Facebook kuraĝigis homojn kun malmultaj ligoj en Facebook por fari pli da amikoj ĝis ili atingis 20 amikojn. Kvankam Ugander kaj kolegoj ne diras ĉi tion en sia papero, ĉi tiu politiko estis supozeble kreita fare de Facebook por instigi novajn uzantojn por esti pli aktivaj. Sen scii pri la ekzisto de ĉi tiu politiko, tamen, estas facile tiri la malĝustan konkludon de la datumoj. Alivorte, la mirinde alta nombro da homoj kun proksimume 20 amikoj rakontas al ni pli pri Facebook ol pri homa konduto.

En ĉi tiu antaŭa ekzemplo, algoritma konflikto produktis strangan rezulton, ke zorgema esploristo povus detekti kaj esplori plu. Tamen, ekzistas eĉ pli malfacila versio de algoritma konflikto, kiu okazas kiam la projektantoj de interretaj sistemoj konscias pri sociaj teorioj kaj bakas ĉi tiujn teoriojn al la funkciado de iliaj sistemoj. Sociaj scienculoj nomas ĉi tiun realiĝon : kiam teorio ŝanĝas la mondon tiel ke ĝi pliigas la mondon kun la teorio. En la kazo de prezenta algoritma konflikto, la konfuzita naturo de la datumoj estas tre malfacile detekti.

Unu ekzemplo de ŝablono kreita de performativity estas transireco en interretaj sociaj retoj. En la 1970-aj jaroj kaj 1980-aj jaroj, esploristoj ree trovis, ke se vi estas amikoj kun Alicio kaj Bob, tiam Alicio kaj Bob pli probable estas amikoj unu kun la alia, ol se ili estis du hazarde elektitaj homoj. Ĉi tiu sama ŝablono estis trovita en la socia grafeo en Facebook (Ugander et al. 2011) . Tiel oni povus konkludi, ke mastroj de amikeco en Facebook replikas ŝablonojn de senkonektaj amikecoj, almenaŭ koncerne transitivojn. Tamen, la grando de transitivity en la socia grafikaĵo de Facebook estas parte funkciigita per algoritma konflikto. Tio estas, sciencaj datumoj ĉe Facebook sciis pri la empirika kaj teoria esploro pri transitiveco kaj poste bakis ĝin kiel Facebook funkcias. Facebook havas "Personon Vi Eble Sciu" trajton, kiu sugestas novajn amikojn, kaj unu vojon, kiun Facebook decidas, kiu sugesti al vi, estas transita. Tio estas, Facebook pli verŝajne sugestas, ke vi amikoj amikoj kun viaj amikoj. Ĉi tiu funkcio tiel havas la efikon de kreskanta transitiveco en la socia grafikaĵo de Facebook; En aliaj vortoj, la teorio de transitiveco alportas la mondon en linio kun la antaŭdiroj de la teorio (Zignani et al. 2014; Healy 2015) . Tiel, kiam grandaj datumaj fontoj ŝajnas reprodukti antaŭdirojn de socia teorio, ni devas certiĝi, ke la teorio mem ne bakis kiel funkciis la sistemo.

Prefere ol pensado pri grandaj datumaj fontoj kiel observado de homoj en naturo, pli kapabla metaforo observas homojn en kazino. Kazinoj estas tre konstruitaj medioj desegnitaj por indukti iujn kondutojn, kaj esploristo neniam atendus konduton en kazino por provizi nekontentan fenestron en homan konduton. Kompreneble, vi povus lerni ion pri homa konduto studante homojn en kazinoj, sed se vi ignoris la fakton, ke la datumo kreiĝas en kazino, vi povus tiri malbonajn konkludojn.

Bedaŭrinde, traktanta algoritma konflikto estas precipe malfacila ĉar multaj trajtoj de interretaj sistemoj estas posedaj, malofte dokumentitaj kaj konstante ŝanĝantaj. Ekzemple, kiel mi klarigos poste en ĉi tiu ĉapitro, algoritma konflikto estis ebla klarigo por la laŭgrada malplenigo de Google Flu Trends (sekcio 2.4.2), sed ĉi tiu aserto malfacile taksis ĉar la internaj laboroj de la serĉo algoritmo de Google estas proprietulo. La dinamika naturo de algoritma konflikto estas unu formo de sistemigo. Algoritma konflikto signifas, ke ni devas esti singardaj pri iu ajn reklamacio pri homa konduto, kiu venas el unu cifereca sistemo, kiom ajn granda.