2.3.8 Ալգորիթմային խառնաշփոթ

Մեծ տվյալների համակարգերում վարքագիծը բնական չէ. դա պայմանավորված է համակարգերի տեխնիկական նպատակներով:

Թեեւ շատ մեծ տվյալների աղբյուրները անարդյունավետ են, քանի որ մարդիկ չգիտեն իրենց տվյալները (բաժին 2.3.3), հետազոտողները չպետք է դիտարկեն այս առցանց համակարգերում պահվածքը «բնականաբար տեղի ունենալու»: Իրականում թվային համակարգերը, բարձր տեխնոլոգիաների շնորհիվ, որոշակի վարքագծեր առաջ բերելու համար, ինչպիսիք են սեղմելով գովազդները կամ բովանդակությունը: Համակարգի դիզայներների նպատակները, որոնք կարող են տվյալների ներդիրներ ներկայացնել, կոչվում են ալգորիթմային շփոթում : Ալգորիթմական շփումը համեմատաբար անհասկանալի է սոցիալական գիտնականների համար, սակայն խիստ մտահոգիչ է տվյալների գիտնականների ուշադրությունից: Եվ, ի տարբերություն թվային հետքեր ունեցող այլ խնդիրների, ալգորիթմիկ խառնաշփոթը հիմնականում անտեսանելի է:

Ալգորիթմային խառնաշփոթի համեմատաբար պարզ օրինակն այն է, որ Ֆեյսբուքում կա մոտավորապես 20 ընկերներ ունեցող անոմալիալ քանակի օգտվողներ, ինչպես հայտնաբերել է Յոհան Ուգանդերը եւ գործընկերները (2011) : Գիտնականներն այս տվյալները վերլուծում են, առանց Facebook- ի աշխատելու մասին, անշուշտ կարող են շատ պատմություններ առաջացնել, թե ինչպես է 20-ը մի քանի կախարդական սոցիալական թվեր: Բարեբախտաբար, Ուգանդերը եւ նրա գործընկերները միանգամայն հասկացան տվյալների գեներացնող գործընթացը, եւ նրանք գիտեին, որ Ֆեյսբուքը Facebook- ի հետ մի քանի կապեր ունեցող մարդկանց խրախուսում է, որպեսզի նրանք ավելի շատ ընկերներ ունենան, մինչեւ 20 հոգու հասնեն: Թեեւ Ugander- ը եւ գործընկերները դա չեն ասում իրենց թերթում, այս քաղաքականությունը ենթադրաբար ստեղծվել է Facebook- ի կողմից, որպեսզի նոր օգտվողներին խրախուսվի ավելի ակտիվ դառնալ: Չնայած այս քաղաքականության գոյության մասին չգիտեմ, սակայն հեշտ է եզրակացնել, Այլ կերպ ասած, մոտ 20 ընկերների հետ զարմանալիորեն մեծ թվով մարդիկ պատմում են մեզ Ֆեյսբուքի մասին, քան մարդկային վարքագծի մասին:

Այս նախորդ օրինակում, ալգորիթմական խառնաշփոթը առաջացնում է զարմանալի արդյունք, որ ուշադիր հետազոտողը կարող է հայտնաբերել եւ ուսումնասիրել հետագա: Այնուամենայնիվ, գոյություն ունի ալգորիթմիկ խառնաշփոթի նույնիսկ ճկուն տարբերակը, որը տեղի է ունենում այն ​​ժամանակ, երբ առցանց համակարգերի դիզայներները տեղյակ են սոցիալական տեսությունների մասին եւ այնուհետեւ այդ տեսությունները թխում են իրենց համակարգերի աշխատանքի մեջ: Հասարակական գիտնականները կոչում են այս կատարողականություն . Երբ տեսությունը փոխում է աշխարհը, այնպես, որ աշխարհը ավելի շատ բան է վերածում տեսության: Կատարողական ալգորիթմային շփոթության դեպքում տվյալների շփոթված բնույթը շատ դժվար է հայտնաբերել:

Արդյունավետության արդյունքում ստեղծված օրինակներից մեկի օրինակն է, առցանց սոցիալական ցանցերում տարանցիկությունը: 1970-ականների եւ 1980-ականների ընթացքում հետազոտողները բազմիցս պարզել են, որ եթե դուք էլ Ալիս եւ Բոբի հետ ընկերակցում եք, ապա Ալիսը եւ Բոբը ավելի հավանական է, որ իրար հետ ընկեր լինեն, քան նրանք, ովքեր երկու պատահականորեն ընտրված մարդիկ էին: Այս նույն նախագիծը հայտնաբերվել է Facebook- ի սոցիալական գրաֆիկում (Ugander et al. 2011) : Այսպիսով, կարելի է եզրակացնել, որ Ֆեյսբուքում Facebook- ի բարեկամության ձեւերը շուտով փոխկապակցված ընկերությունների օրինակներ են, առնվազն տարանցիկության առումով: Սակայն Facebook- ի սոցիալական գրաֆիկի տարանցիկության մեծությունը մասնակիորեն պայմանավորված է ալգորիթմային խառնաշփոթությամբ: Այսինքն, Ֆեյսբուքի տվյալների գիտնականները գիտեին տարանցիկության մասին էմպիրիկ եւ տեսական հետազոտությունները, այնուհետեւ թխում այն, թե ինչպես աշխատում է Facebook- ն: Facebook- ը ունի «Մարդիկ կարող եք իմանալ» ֆունկցիան, որը առաջարկում է նոր ընկերներ, եւ մեկ ձեւով, որ Facebook- ը որոշում է, թե ով է առաջարկում ձեզ տրանզիտացիան: Այսինքն, Ֆեյսբուքը ավելի հավանական է, որ դուք ընկերանաք ձեր ընկերների ընկերների հետ: Այս առանձնահատկությունը, այսպիսով, ունի Facebook սոցիալական գրաֆիկում տարանցիկության բարձրացման ազդեցությունը, այլ կերպ ասած, տարանցիկության տեսությունը աշխարհին համահունչ է տեսության կանխատեսումների հետ (Zignani et al. 2014; Healy 2015) : Այսպիսով, երբ մեծ տվյալների աղբյուրները հայտնվում են սոցիալական տեսության կանխատեսումների վերարտադրմամբ, մենք պետք է համոզված լինենք, որ տեսությունը ինքնին չի թխվել, թե ինչպես է աշխատել համակարգը:

Ավելի շուտ, քան մեծ տվյալների աղբյուրների մասին մտածելը, որպես բնական միջավայրում մարդկանց դիտարկելը, ավելի ճիշտ տերմինը մարդկանց կազինոյում դիտում է: Կազինոները բարձրակարգ մշակված միջավայրեր են, որոնք նախատեսված են որոշակի վարք դրսեւորելու համար, եւ հետազոտողը երբեք կազինոյում վարքագիծ չի ակնկալի, որպեսզի մարդու վարքագծի անթույլատրելի պատուհանը ապահովվի: Իհարկե, դուք կարող եք սովորել ինչ-որ բան մարդկանց վարքագծի մասին `կազինոներում մարդկանց ուսումնասիրելով, բայց եթե անտեսում եք այն փաստը, որ տվյալները ստեղծվում են կազինոյում, ապա կարող եք մի քանի վատ եզրակացություններ անել:

Ցավոք սրտի, ալգորիթմիկ խառնաշփոթի հետ կապված, հատկապես դժվար է, քանի որ օնլայն համակարգերի բազմաթիվ առանձնահատկությունները գույքային, վատ փաստաթղթավորվում են եւ անընդհատ փոփոխվում են: Օրինակ, այս գլխի հետագայում ես կբացատրեմ, որ ալգորիթմիկ խառնաշփոթը հնարավոր բացատրություն էր Google Flu Trends- ի աստիճանական բաշխման համար (բաժին 2.4.2), սակայն այս պահանջը դժվար էր գնահատել, քանի որ Google- ի որոնման ալգորիթմի ներքին աշխատանքները սեփականատեր: Ալգորիթմային խառնաշփոթի դինամիկ բնույթը համակարգային արտահոսքի մեկ ձեւ է: Ալգորիթմային խառնաշփոթը նշանակում է, որ մենք պետք է զգույշ լինենք այն մասին, թե ինչպիսի մարդ է այն վարվելակերպը, որը գալիս է մի թվային համակարգից, անկախ նրանից, թե որքան մեծ է: