2.3.2.5 algoritmide segas

Käitumine leitud andmed ei ole loomulik, see on ajendatud inseneri eesmärke süsteeme.

Kuigi paljud leitud andmete allikad on mitte-reaktiivne, sest inimesed ei ole teadlikud oma andmete salvestamise (punktis 2.3.1.3), teadlased ei tohiks kaaluda käitumist nende online süsteem on "looduslikult esinev" või "puhas". Tegelikult digitaalsed süsteemid, mis salvestavad käitumine on väga projekteeritud tekitada spetsiifilist käitumist nagu klikke või postitad sisu. Võimalusi, et eesmärkide süsteemi disainerid saavad tutvustada mustreid arvesse andmete nimetatakse algoritmilise segavate. Algoritmiline segavate on suhteliselt tundmatu ühiskonnateadlased, kuid see on suur mure ettevaatlik andmeid teadlased. Ja erinevalt mõnest teisest probleeme digitaalse jälgi Algoritmilise segavate on suuresti nähtamatu.

Suhteliselt lihtne näide algoritmilise segavate on asjaolu, et Facebook on on anomaalselt kõrge kasutajate arv ligikaudu 20 sõbrad (Ugander et al. 2011) . Teadlased analüüsides selle andmed ilma arusaamist sellest, kuidas Facebook töötab võiks kahtlemata tekitada palju lugusid sellest, kuidas 20 on mingi maagiline sotsiaalse number. Kuid Ugander ja tema kolleegid olid oluliselt arusaamist protsessi, et andmete saamiseks ning nad teadsid, et Facebook julgustada inimesi vähe ühendused Facebookis teha rohkem sõpru, kuni nad jõudsid 20 sõbrad. Kuigi Ugander ja kolleegid ei ütle seda paberit, see poliitika oli arvatavasti loodud Facebook, et soodustada uute kasutajate muutunud aktiivsemaks. Tundmata olemasolu selle poliitika, aga see on lihtne teha valesid järeldusi andmeid. Teisisõnu, üllatavalt suur hulk inimesi umbes 20 sõbrad räägib meile lähemalt Facebook kui inimese käitumist.

Rohkem hukatuslik kui seda eelmises näites, kus algoritmilise segavate toodetud Pentsik tulemus hoolikalt teadlasi võiks edasi uurida, on veelgi keerukam versioon algoritmilise segavate mis tekib, kui disainerid online süsteemid on teadlikud sotsiaalse teooriaid ning seejärel küpsetada need teooriad töö oma süsteeme. Sotsiaalne teadlased nimetavad seda performatiivsuse: kui teooriad muuta maailma nii, et nad toovad maailma paremini kooskõlla teooria. Juhtudel Performatiivsete algoritmilise segavate on segaduses andmete laadile on tõenäoliselt nähtamatu.

Üks näide muster loodud performatiivsuse on transitiivisyys online sotsiaalsete võrgustike. 1970. ja 1980. aastatel on teadlased korduvalt leidnud, et kui olete sõpradega koos Alice ja olete sõbrad koos Bob, siis Bob ja Alice on tõenäolisem, et olla sõbrad omavahel kui kaks juhuslikult valitud inimesed. Ja seesama muster leiti sotsiaalne graafik Facebookis (Ugander et al. 2011) . Seega võib järeldada, et mustrid sõprus Facebookis imiteerida mustrid offline sõprus, vähemalt nii transitiivisyys. Samas suurusjärgus transitiivisyys on Facebook sotsiaalse graafik on osaliselt ajendatud algoritmilise segavate. See tähendab, et andmeid teadlased Facebook teadis empiiriliste ja teoreetiliste uurimusi transitiivisyys ja seejärel küpsetatud see, kuidas Facebook töötab. Facebook on "tuttavate inimeste" funktsioon, mis näitab, sõbrad, ja üks viis, et Facebook otsustab, kes soovitada teil on transitiivisyys. See tähendab, et Facebook on suurema tõenäosusega oletada, et jäätesõbrad koos sõprade sõpradele. See funktsioon on seega suurendav toime transitiivisyys on Facebook sotsiaalse graafik; Teisisõnu, teooria transitiivisyys toob maailma kooskõlla ennustused teooria (Healy 2015) . Seega, kui suur andmeallikate ilmub reprodutseerida ennustused sotsiaalse teooria, peame olema kindlad, et teooria ise ei Leivo, kuidas süsteem toimib.

Selle asemel, et mõelda suur andmeallikaid jälgides inimesi füüsiline seade enam kohane metafoor jälgib inimesi kasiinos. Kasiinod on väga konstrueeritud keskkondade kavandatud mõjutama teatud käitumist ning uurijad kunagi loota, et käitumise kasiino annaks piiramatu akna inimese käitumist. Muidugi, me võime õppida midagi inimese käitumist õppimise inimesed kasiinodes-tegelikult kasiino võib olla ideaalne paik vaheliste seoste uurimisel alkoholi tarbimist ja riski eelistusi-, kuid kui me ignoreerida, et andmed on loodud kasiinos me võiksime juhtida halbu järeldusi.

Kahjuks tegelevad algoritmilise segavate on eriti raske, sest palju funktsioone online süsteemid on patenteeritud, halvasti dokumenteeritud ja pidevalt. Näiteks kui ma seletan hiljem selles peatükis algoritmilise segavate oli üks võimalik seletus järkjärgulist lagunemist Google Flu Trends (punkt 2.4.2), kuid see väide oli raske hinnata, sest tööst Google'i otsing algoritm on patenteeritud. Dünaamilist olemust algoritmilise segavate on üks vorm süsteemi triivi. Algoritmiline segavate tähendab, et me peaksime olema ettevaatlikud tahes nõude inimeste käitumist, mis pärineb digitaalse ühtse süsteemi, olgu see kuitahes suur.