2.3.8 Algoritmiski sajaukti

Uzvedība lielās datu sistēmās nav dabiska; to nosaka inženiertehniskie sistēmas mērķi.

Lai arī daudzi lieli datu avoti nav reaģējoši, jo cilvēki nezina, ka viņu dati tiek ierakstīti (2.3.3. Sadaļa), pētniekiem nevajadzētu uzskatīt, ka šo tiešsaistes sistēmu rīcība ir dabiski sastopama. Patiesībā digitālās sistēmas, kas reģistrē uzvedību, ir augsti izstrādāts, lai radītu īpašu uzvedību, piemēram, noklikšķinot uz reklāmām vai publicējot saturu. Sistēmas dizaineru mērķus var ieviest modeļus datu ievadē, tiek saukts par algoritmisku sajaukumu . Algoritmiskais sajukums ir salīdzinoši nezināms sociālajiem zinātniekiem, taču tas ir liela problēma rūpīgo datu zinātnieku vidū. Un, atšķirībā no dažām citām problēmām ar digitālajām pēdām, algoritmiskais satraucošais ir lielā mērā neredzams.

Salīdzinoši vienkāršs algoritmiskas sajaukšanas piemērs ir fakts, ka Facebook ir ievērojami liels lietotāju skaits ar apmēram 20 draugiem, kā to atklāja Johans Uganders un viņa kolēģi (2011) . Zinātnieki, analizējot šos datus bez izpratnes par to, kā darbojas Facebook, neapšaubāmi var radīt daudz stāstu par to, kā 20 ir sava veida burvju sociālais numurs. Par laimi, Uganderam un viņa kolēģiem bija liela izpratne par procesu, kas radīja datus, un viņi zināja, ka Facebook iedrošināja cilvēkus, kuriem Facebook ir nedaudz savienojumu, lai izveidotu vairāk draugu, līdz viņi sasniedza 20 draugus. Lai gan Uganders un viņa kolēģi savā rakstā to nenozīmē, šo politiku, domājams, radīja Facebook, lai mudinātu jaunus lietotājus kļūt aktīvākiem. Tomēr, nezinot par šīs politikas esamību, no datiem ir viegli izdarīt nepareizu secinājumu. Citiem vārdiem sakot, pārsteidzoši liels skaits cilvēku ar apmēram 20 draugiem saka mums vairāk par Facebook nekā par cilvēku uzvedību.

Šajā iepriekšējā piemērā algoritmiskais sajaukums radīja dīvainu rezultātu, kuru uzmanīgs pētnieks varētu atklāt un izpētīt tālāk. Tomēr ir vēl sarežģītāka algoritmiskā sajaukšanas versija, kas notiek, kad tiešsaistes sistēmu dizaineri apzinās sociālās teorijas un pēc tam cept šīs teorijas uz savu sistēmu darbību. Sociāldemokrāti to sauc par šo performanci : kad teorija pasaulei mainās tā, ka tā pasauli vairāk saskaņo ar teoriju. Ja tiek veikts algoritmisks izpildījums, datu konfidenciālais raksturs ir ļoti grūti atklāt.

Viens no pārveidojamības modeļa paraugiem ir transitiveitāte tiešsaistes sociālajos tīklos. 70. un 80. gados pētnieki atkārtoti konstatēja, ka, ja jūs esat draugi gan ar Alisu, gan ar Bobu, tad Alice un Bobs, visticamāk, būs draugi viens ar otru, ja vien tie būtu divi nejauši izvēlēti cilvēki. Šis pats modelis tika atrasts sociālajā grafikā Facebook (Ugander et al. 2011) . Tādējādi varētu secināt, ka Facebook draudzības modeļi atkārto bezsaistes draudzības modeļus, vismaz attiecībā uz pārredzamību. Tomēr Facebook sociālās diagrammas pārredzamības lielumu daļēji nosaka algoritmiskais sajukums. Tas ir, datu zinātnieki Facebook zināja par empīriskajiem un teorētiskajiem pētījumiem par transitivitāti, un pēc tam to uztvēra par to, kā darbojas Facebook. Facebook ir "Cilvēki, kurus var zināt", kas iesaka jaunus draugus, un viens no veidiem, kāpēc Facebook izvēlas, kas jums ieteikt, ir pārredzamība. Tas nozīmē, ka Facebook visdrīzāk norāda uz to, ka jūs kļūstat draugi ar draugiem no saviem draugiem. Tādējādi šī funkcija palielina pārredzamību Facebook sociālajā grafikā; citiem vārdiem sakot, (Zignani et al. 2014; Healy 2015) teorija paver pasauli par teorijas prognozēm (Zignani et al. 2014; Healy 2015) . Tādējādi, ja lielie datu avoti, šķiet, reproducē prognozes par sociālo teoriju, mums ir jābūt pārliecinātiem, ka pati teorija nav cepta, kā sistēma darbojas.

Tā vietā, nevis domāt par lieliem datu avotiem, piemēram, novērot cilvēkus dabiskā vidē, metafora, kas ir daudz piemērotāka, novēro cilvēkus kazino. Kazino ir ļoti inženierijas vide, kas domāta noteiktiem uzvedības virzieniem, un pētnieks nekad nesagaida uzvedību kazino, lai nodrošinātu neierobežotu logu cilvēka uzvedībā. Protams, jūs varētu uzzināt kaut ko par cilvēka uzvedību, pētot cilvēkus kazino, bet, ja jūs ignorējat faktu, ka dati tika izveidoti kazino, jūs varētu izdarīt sliktus secinājumus.

Diemžēl algoritmiskas sajaukšanas problēmas ir īpaši grūti, jo daudzas tiešsaistes sistēmas iezīmes ir patentētas, slikti dokumentētas un nepārtraukti mainās. Piemēram, kā es vēl skaidrošu tālāk šajā nodaļā, algoritmiskais sajaukums bija viens no iespējamiem skaidrojumiem par Google gripas tendenču pakāpenisku sadalīšanu (2.4.2. Sadaļa), taču šo prasību bija grūti novērtēt, jo Google meklēšanas algoritma iekšējā darbība patentēta. Algoritmiskās sajaukšanas dinamiskā daba ir viena sistēmas novirzīšanas forma. Algoritmiskais sajaukums nozīmē, ka mums vajadzētu būt piesardzīgiem attiecībā uz jebkuru prasību attiecībā uz cilvēka uzvedību, kas nāk no vienas digitālās sistēmas neatkarīgi no tā, cik liela.