2.3.8 Алгоритамски збунет

Однесувањето во големите системи за податоци не е природно; тоа е управувано од инженерските цели на системите.

Иако многу големи извори на податоци се нереактивни, бидејќи луѓето не се свесни дека нивните податоци се евидентираат (дел 2.3.3), истражувачите не треба да сметаат дека однесувањето во овие онлајн системи е "природно". Во реалноста, дигиталните системи кои го снимаат однесувањето високо конструирани за да предизвикаат одредени однесувања како што се кликање на реклами или објавување на содржини. Начините на кои целите на системските дизајнери можат да воведат обрасци во податоци се нарекуваат алгоритамски конфликти . Алгоритамскиот конфликт е релативно непознат за социолозите, но тоа е голема загриженост кај внимателни научници за податоци. И, за разлика од некои од другите проблеми со дигиталните траги, алгоритамскиот конфликт во голема мера е невидлив.

Релативно едноставен пример на алгоритамски конфузија е фактот дека на Фејсбук има аномално голем број корисници со околу 20 пријатели, како што беше откриено од Јохан Угандер и неговите колеги (2011) . Научниците кои ги анализираат овие податоци без никакво разбирање за тоа како функционира Фејсбук, несомнено може да генерира многу приказни за тоа како 20 е некој вид на магичен социјален број. За среќа, Угандер и неговите колеги имале значително разбирање за процесот што ги генерирал податоците и знаеле дека Фејсбук ги охрабрувал луѓето со неколку врски на Фејсбук да направат повеќе пријатели додека не стигнале до 20 пријатели. Иако Угандер и неговите колеги не го кажуваат ова во својот труд, Фејсбук веројатно го создал ова правило со цел да ги охрабри новите корисници да станат поактивни. Меѓутоа, без да се знае за постоењето на оваа политика, лесно е да се извлече погрешен заклучок од податоците. Со други зборови, изненадувачки голем број луѓе со околу 20 пријатели ни кажува повеќе за Фејсбук отколку за човечкото однесување.

Во овој претходен пример, алгоритамското збунетост создаде чуден резултат кој внимателен истражувач може да го открие и истражи понатаму. Сепак, постои уште поинтересна верзија на алгоритамски конфликти што се јавува кога дизајнерите на онлајн системите се свесни за социјалните теории и потоа ги исперуваат овие теории во работењето на нивните системи. Социјалистичките научници ја нарекуваат оваа изведба : кога една теорија го менува светот на таков начин што го доведува светот во согласност со теоријата. Во случај на перформативни алгоритамски конфузии, конфузната природа на податоците е многу тешко да се открие.

Еден пример за модел создаден со изведбата е транзитивност во онлајн социјалните мрежи. Во 1970-тите и 1980-тите години, истражувачите постојано откриле дека ако сте пријатели со Алис и Боб, тогаш Алис и Боб се со поголема веројатност да се дружат едни со други, отколку ако биле двајца случајно избрани луѓе. Оваа иста шема беше пронајдена во социјалниот графикон на Facebook (Ugander et al. 2011) . Така, може да се заклучи дека моделите на пријателство на Фејсбук ги реплицираат обрасците на офлајн пријателства, барем во смисла на транзитивност. Сепак, големината на транзитивноста во социјалниот графикон на Фејсбук е делумно управувана од алгоритамски измами. Тоа е, научниците за податоци на Фејсбук знаеле за емпириското и теоретското истражување за транзитивноста, а потоа го испеале како функционира Фејсбук. Фејсбук има функција "Луѓе, што можеш да знаеш", која сугерира нови пријатели, и еден начин на кој Фејсбук одлучува кој ќе ви предложи да е транзитивност. Тоа е, Фејсбук е поверојатно да се сугерира дека ќе станете пријатели со пријателите на вашите пријатели. Оваа функција има ефект на зголемување на транзитивноста во социјалниот графикон на Facebook; со други зборови, теоријата на транзитивност го доведува светот во согласност со предвидувањата на теоријата (Zignani et al. 2014; Healy 2015) . Така, кога големите извори на податоци изгледа дека репродуцираат предвидувања на општествената теорија, мораме да бидеме сигурни дека самата теорија не беше испечена во начинот на функционирање на системот.

Наместо да размислува за големи извори на податоци како набљудување на луѓе во природна средина, повеќе метафора ги следи луѓето во казино. Казините се високо конструирани средини дизајнирани да предизвикаат одредени однесувања, а истражувачот никогаш не би очекувал однесување во казино за да обезбеди неограничен прозорец во човечкото однесување. Се разбира, можеш да научиш нешто за човековото однесување со проучување луѓе во казина, но ако го игнорира фактот дека податоците се создаваат во казино, може да извлечете некои лоши заклучоци.

За жал, справувањето со алгоритамските конфузии е особено тешко бидејќи многу карактеристики на онлајн системите се неслободни, слабо документирани и постојано се менуваат. На пример, како што подоцна ќе го објаснам во ова поглавје, алгоритамското збунетост беше едно можно објаснување за постепеното распаѓање на Гугл трендови за грип (дел 2.4.2), но ова тврдење беше тешко да се процени, бидејќи внатрешната работа на алгоритмот за пребарување на Google се комерцијален. Динамичната природа на алгоритамското одушевување е една форма на системски лебдат. Алгоритамското збрка значи дека треба да бидеме претпазливи во врска со секое тврдење во врска со човековото однесување кое произлегува од еден дигитален систем, без разлика колку е голема.