2.3.8 ალგორითმულად დაბნეული

ქცევა დიდ მონაცემთა სისტემაში არ არის ბუნებრივი; ის ამოძრავებს სისტემების საინჟინრო მიზნებს.

მიუხედავად იმისა, რომ ბევრი დიდი მონაცემთა წყარო არ არის ნერვული, რადგან ადამიანები არ იციან მათი მონაცემები (სექცია 2.3.3), მკვლევარებმა არ უნდა განიხილონ ქცევის ამ ონლაინ სისტემებში, რომ იყოს "ბუნებრივად." სინამდვილეში ციფრული სისტემები, უაღრესად ტექნოლოგია, რათა გამოიწვიოს კონკრეტული ქცევები, როგორიცაა დაწკაპვით განცხადებები ან გამოქვეყნების შინაარსი. სისტემური დიზაინერების მიზნები შეიძლება შეიცავდეს მონაცემებს, რომლებიც ალგორითურ შევიწროებას უწოდებენ. ალგორითმული აზროვნება შედარებით უცნობია სოციალური მეცნიერებისთვის, მაგრამ სიფრთხილით ინარჩუნებს მეცნიერებს. და, განსხვავებით სხვა პრობლემები ციფრული კვალი, ალგორითმული confounding დიდწილად უხილავი.

ალგორითმული აზროვნების შედარებით მარტივი მაგალითია ის ფაქტი, რომ ფეისბუქზე იოჰან უგანანდსა და კოლეგებს (2011) აღმოაჩენენ დაახლოებით 20 მეგობრის წევრებს. მეცნიერთა ანალიზი ამ მონაცემების გარეშე გაგება, თუ როგორ მუშაობს Facebook- ს, ალბათ, ბევრ სიუჟეტს ქმნის იმის შესახებ, თუ როგორ არის 20 რაღაც სახის ჯადოსნური სოციალური ნომერი. საბედნიეროდ, უგანანდმა და მისმა კოლეგებმა მნიშვნელოვანი წვლილი შეიტანეს იმ პროცესის შესახებ, რომლებმაც წარმოადგინეს მონაცემები და იცოდნენ, რომ Facebook- მა ადამიანებს Facebook- თან რამდენიმე კავშირი გააცნო, რათა მეგობრებთან ერთად, სანამ ისინი 20 მეგობრამდე მიაღწევენ. მიუხედავად იმისა, რომ უგანდერმა და კოლეგებმა თავიანთი ქაღალდი არ იციან, ეს პოლიტიკა, სავარაუდოდ, Facebook- მა შექმნა, რათა ახალი მომხმარებლები უფრო აქტიური გახდეს. ამ პოლიტიკის არსებობის შესახებ არ იცის, რომ მონაცემები არასწორი დასკვნისაა. სხვა სიტყვებით რომ ვთქვათ, 20-ზე მეტი მეგობრის ხალხის სიუჟეტი ბევრად უფრო მეტყველებს Facebook- ზე, ვიდრე ადამიანის ქცევაზე.

ამ წინა მაგალითში, ალგორითმული გაურკვევლობა წარმოშვა კირკიტის შედეგი, რომელიც ფრთხილად მკვლევარმა შეიძლება გამოავლინოს და გამოიძიოს შემდგომი. თუმცა, არსებობს ალგორითმული დამაბრკოლებელი კი მაშინაც კი, როდესაც ინტერნეტ სისტემების დიზაინერებს იცნობენ სოციალური თეორიების შესახებ და ამ თეორიების შემუშავებას მათი სისტემების მუშაობაში. სოციალურ მეცნიერებს უწოდებენ ამ პერფორმანტურობას : როდესაც თეორია იცვლება სამყაროში ისე, რომ სამყარო უფრო თეორიულად შეიტანოს. სათანადო ალგორითმული კონფისკაციის შემთხვევაში, მონაცემების დამაბნეველი ხასიათი ძნელია გამოვლენისათვის.

ერთ-ერთი ნიმუში, რომელიც შექმნილია სტეფექტურობით, არის ონლაინ სოციალური ქსელების ტრანზიტურობა. 1970-იან და 1980-იან წლებში მკვლევარებმა არაერთხელ დაადგინეს, რომ თუ თქვენ ხართ ალისა და ბობთან მეგობრობით, მაშინ ალისა და ბობ უფრო მეტად მეგობრობენ ერთმანეთთან, ვიდრე ორი შემთხვევითი შერჩეული ადამიანი. ეს იგივე ნიმუში იქნა ნაპოვნი სოციალურ გრაფაში Facebook- ზე (Ugander et al. 2011) . ამდენად, შეიძლება დავასკვნათ, რომ Facebook- ზე მეგობრობის ნიმუშები ხაზს უსვამს ხაზგარეშე მეგობრობას, ყოველ შემთხვევაში ტრანზიტულობის თვალსაზრისით. თუმცა, Facebook- ის სოციალურ გრაფაში ტრანზიტურობის მასშტაბები ნაწილობრივ ამოძრავებს ალგორითმული გაღიზიანებით. ანუ, მონაცემების მეცნიერებმა Facebook- მა იცოდა ემპირიული და თეორიული კვლევა ტრანზიტურობის შესახებ და შემდეგ ფეისბუკზე მუშაობს. Facebook- ს აქვს "ხალხი იცნობთ" ფუნქციას, რომელიც ახალ მეგობრებს გვთავაზობს და ერთი გზა, რომელიც Facebook- ს გადაწყვეტს, ვინმემ თქვას, რომ თქვენ ხართ ტრანზიტურობა. ანუ, Facebook უფრო მეტყველებს, რომ მეგობრებთან მეგობრობთ. ეს ფუნქცია ამგვარად მოქმედებს Facebook სოციალური გრაფაში ტრანზიტურობის გაზრდის შესახებ; სხვა სიტყვებით რომ ვთქვათ, ტრანზიტურობის თეორია სამყაროში შედის თეორიის პროგნოზებთან (Zignani et al. 2014; Healy 2015) ; ამრიგად, როდესაც დიდი მონაცემთა წყაროები სოციალური თეორიის პროგნოზების რეპროდუცირებას ახდენენ, დარწმუნებული უნდა ვიყოთ, რომ თეორია არ იყო ჩამარხული, თუ როგორ მუშაობდა სისტემა.

იმის ნაცვლად, რომ დიდი მონაცემთა წყაროების ფიქრი, როგორც ადამიანების ბუნებრივი გარემოში დაკვირვებას, უფრო მეტ პოტენციურ მეტაფორა კაზინოში ადამიანებს აკვირდება. კაზინოები მაღალტექნიკური გარემოთია, რომლებიც განკუთვნილია გარკვეულ ქცევებს, ხოლო მკვლევარი კაზინოში არასოდეს მოელოდა ქცევას, რათა გადაეკვეთა ფანჯარა ადამიანის ქცევას. რა თქმა უნდა, თქვენ შეგიძლიათ გაიგოთ ადამიანური ქცევის შესახებ კაზინოში ადამიანების შესასწავლი, მაგრამ თუ იგნორირებულია ის ფაქტი, რომ მონაცემები კაზინოში იქმნება, შეიძლება დაგჭირდეთ ცუდი დასკვნები.

სამწუხაროდ, ალგორითმული კვანძების საქმე განსაკუთრებით რთულია, რადგან ონლაინ სისტემების მრავალი მახასიათებელი საკუთრების, ცუდი დოკუმენტირებული და მუდმივად იცვლება. მაგალითად, როგორც მე ავუხსენი ამ თავში, ალგორითმული დამაბნეველი იყო ერთი შესაძლო ახსნა Google Flu Trends- ის (სექცია 2.4.2) თანდათანობით, მაგრამ ეს მოთხოვნა ძნელი იყო იმის შეფასება, რომ Google- ის საძიებო ალგორითმის შიდა სამუშაოები საკუთრება. ალგორითმული აზროვნების დინამიკური ხასიათისაა სისტემაში მორევის ერთი ფორმა. ალგორითმული გაურკვევლობა ნიშნავს, რომ სიფრთხილით უნდა ვიყოთ ნებისმიერი პრეტენზია ადამიანის ქცევასთან დაკავშირებით, რომელიც ერთი ციფრული სისტემისგან მოდის, რაც არ უნდა დიდი იყოს.