2.3.8 Algoritmikusan zavaros

A nagy adatrendszerek viselkedése nem természetes; a rendszerek technikai céljait vezérlik.

Bár sok nagy adatforrás nem reagál, mert az emberek nem tudják, hogy adataik rögzítésre kerülnek (2.3.3. Szakasz), a kutatóknak nem szabad úgy gondolniuk, hogy ezek az online rendszerek viselkedése "természetesen előfordul." A valóságban a viselkedésüket rögzítő digitális rendszerek nagymértékben úgy tervezték, hogy olyan konkrét viselkedéseket indít el, mint például a hirdetésekre való kattintás vagy a tartalom közzététele. Az algoritmikus zavarónak nevezik azokat a módszereket, melyekkel a rendszertervezők céljait bevinni az adatokba. Az algoritmikus zavaró tényezők viszonylag ismeretlenek a társadalomtudósok számára, de ez a legfontosabb aggodalom a gondos tudósok körében. És ellentétben a digitális nyomok más problémáival, az algoritmikus zavarok nagyrészt láthatatlanok.

Az algoritmikus zavarok viszonylag egyszerű példája az a tény, hogy a Facebookon anomálián nagy számú felhasználó van körülbelül 20 baráttal, ahogy azt Johan Ugander és munkatársai (2011) fedezték fel. A tudósok, akik anélkül elemezik ezeket az adatokat, hogy megértették volna, hogyan működik a Facebook, kétségtelenül sok történetet tud felmutatni arról, hogy a 20 valamiféle mágikus társadalmi szám. Szerencsére Ugander és munkatársai alaposan megértették az adatokat generáló folyamatot, és tudták, hogy a Facebook bátorította a Facebookon kevés kapcsolatot, hogy több barátot hozzon létre, amíg el nem éri a 20 barátot. Habár Ugander és munkatársai ezt nem mondják papírjukban, valószínűleg a Facebook létrehozta ezt a politikát annak érdekében, hogy ösztönözze az új felhasználókat aktívabbá tételére. Annak ismerete nélkül, hogy létezik ez a politika, azonban könnyen levonni a rossz következtetést az adatok. Más szóval, a meglepően nagy számú, mintegy 20 baráttal rendelkező ember többet mond a Facebookról, mint az emberi viselkedésről.

Ebben az előző példában az algoritmikus összezavarás olyan furcsa eredményt hozott, amelyet egy gondos kutató észlelhet és tovább vizsgálhat. Az algoritmikus zűrzavar még egy apróbb verziója is előfordul, amikor az online rendszerek tervezői tisztában vannak a társadalmi elméletekkel, majd ezeket az elméleteket rendszereik működésébe sütik. A társadalomtudósok ezt a performativitást nevezik: amikor egy elmélet megváltoztatja a világot oly módon, hogy a világot jobban összhangba hozza az elmélettel. Az előadói algoritmikus zavarok esetében nagyon nehéz felismerni az adatok zavaros jellegét.

Az előadóképesség által létrehozott minta egyik példája az online szociális hálózatokban való átjárhatóság. Az 1970-es és 1980-as években a kutatók többször megtalálták, hogy ha Alice és Bob barátja vagy, akkor Alice és Bob valószínűleg barátok egymással, mintha két véletlenszerűen kiválasztott ember lenne. Ezt a mintát a Facebook társadalmi grafikájában találta (Ugander et al. 2011) . Így arra lehet következtetni, hogy a barátságok a Facebookon az offline barátságok mintázatát reprodukálják, legalábbis a tranzitivitás szempontjából. Azonban a Facebook szociális diagramban a tranzititás nagyságát részben algoritmikus zavarok vezérlik. Vagyis a Facebook tudósai tudták a tranzitivitásról szóló empirikus és elméleti kutatásokat, majd azt a Facebook működéséről. A Facebooknak van egy "People You Can Know" funkciója, amely új barátokat sugall, és az egyik módja annak, hogy a Facebook eldöntsék, hogy ki javasolja Önnek a tranzitivitást. Vagyis a Facebook valószínűleg azt sugallja, hogy barátaid barátai barátaival barátkoznak. Ez a tulajdonság tehát hatással van a Facebook szociális grafikonának a tranzitivitás növelésére; más szóval, a tranzititás elmélete összhangba hozza a világot az elmélet előrejelzéseivel (Zignani et al. 2014; Healy 2015) . Így amikor a nagy adatforrások úgy tűnnek, hogy reprodukálják a társadalomelmélet előrejelzéseit, akkor biztosak kell lennünk abban, hogy maga az elmélet nem süllyesztette be a rendszer működését.

Ahelyett, hogy a nagy adatforrásokra gondolna, amikor megfigyelnék az embereket egy természetes környezetben, egy kedvezőbb metafora a kaszinó embereinek megfigyelése. A kaszinók olyan magasan kialakított környezetek, amelyek bizonyos viselkedést indítanak, és egy kutató soha nem számíthat arra, hogy a kaszinó magatartást jelenthet az ember viselkedésében. Természetesen te is tanulhatsz valamit az emberi viselkedésről, ha kipróbálod az embereket a kaszinókban, de ha figyelmen kívül hagyod azt a tényt, hogy az adatokat kaszinóban hozták létre, akkor rossz következtetéseket vonhat le.

Sajnos az algoritmikus zavarok kezelése különösen nehéz, mert az online rendszerek számos jellemzője szabadalmaztatott, rosszul dokumentált és folyamatosan változik. Például, amint később elmagyarázzam ebben a fejezetben, az algoritmikus összezavarás egy lehetséges magyarázat a Google Influenzatrendek fokozatos lebontásához (2.4.2. Szakasz), de ezt a követelést nehéz megítélni, mert a Google keresési algoritmusának belső működése szabadalmazott. Az algoritmikus összetévesztés dinamikus jellege a rendszer sodródásának egyik formája. Az algoritmikus zavarás azt jelenti, hogy óvatosnak kell lennünk az emberi viselkedéssel kapcsolatos bármely állítással kapcsolatban, amely egyetlen digitális rendszerből származik, függetlenül attól, hogy milyen nagy.