2.3.2.5 สับสนอัลกอริทึม

พฤติกรรมในข้อมูลที่พบไม่ได้เป็นธรรมชาติก็คือการขับเคลื่อนด้วยเป้าหมายทางวิศวกรรมของระบบ

แม้ว่าจะมีหลายแหล่งข้อมูลพบว่าจะไม่เกิดปฏิกิริยาเพราะคนไม่ทราบข้อมูลของพวกเขาจะถูกบันทึกไว้ (มาตรา 2.3.1.3) นักวิจัยไม่ควรพิจารณาพฤติกรรมในระบบออนไลน์เหล่านี้จะเป็น "ธรรมชาติที่เกิดขึ้น" หรือ "บริสุทธิ์." ในความเป็นจริง ระบบดิจิตอลที่บันทึกพฤติกรรมที่ได้รับการออกแบบอย่างมากที่จะทำให้เกิดพฤติกรรมที่เฉพาะเจาะจงเช่นการคลิกที่โฆษณาหรือโพสต์เนื้อหา วิธีการที่เป้าหมายของการออกแบบระบบสามารถแนะนำรูปแบบเป็นข้อมูลที่เรียกว่าอัลกอริทึมรบกวน รบกวนขั้นตอนค่อนข้างที่ไม่รู้จักกับนักวิทยาศาสตร์ทางสังคม แต่มันเป็นความกังวลหลักในหมู่นักวิทยาศาสตร์ข้อมูลระมัดระวัง และแตกต่างจากบางส่วนของปัญหาอื่น ๆ ที่มีร่องรอยดิจิตอลรบกวนอัลกอริทึมที่มองไม่เห็นส่วนใหญ่

ตัวอย่างที่ค่อนข้างเรียบง่ายของอัลกอริทึมรบกวนเป็นความจริงที่ว่าบน Facebook มีจำนวนสูงผิดปรกติของผู้ใช้ที่มีประมาณ 20 เพื่อน (Ugander et al. 2011) นักวิทยาศาสตร์วิเคราะห์ด้วยข้อมูลนี้ไม่เข้าใจวิธีการทำงานของ Facebook ไม่ต้องสงสัยสามารถสร้างเรื่องราวมากมายเกี่ยวกับวิธีการใด ๆ ที่เป็น 20 ชนิดของหมายเลขสังคมบางขลัง อย่างไรก็ตาม Ugander และเพื่อนร่วมงานของเขามีความเข้าใจที่สำคัญของกระบวนการที่สร้างข้อมูลและพวกเขารู้ว่า Facebook เป็นกำลังใจให้คนที่มีการเชื่อมต่อไม่กี่บน Facebook เพื่อให้เพื่อนเพิ่มขึ้นจนกว่าพวกเขาจะมาถึงเพื่อน 20 คน แม้ว่า Ugander และเพื่อนร่วมงานไม่ได้พูดแบบนี้ในกระดาษนโยบายนี้ถูกสร้างขึ้นโดยสันนิษฐาน Facebook เพื่อส่งเสริมให้ผู้ใช้ใหม่ในการใช้งานมากขึ้น โดยไม่ต้องรู้เกี่ยวกับการดำรงอยู่ของนโยบายนี้ แต่มันเป็นเรื่องง่ายที่จะวาดข้อสรุปที่ผิดพลาดจากข้อมูล ในคำอื่น ๆ จำนวนมากที่น่าแปลกใจของคนที่มีประมาณ 20 เพื่อนบอกเราเพิ่มเติมเกี่ยวกับ Facebook กว่าพฤติกรรมของมนุษย์

เพิ่มเติมอันตรายกว่าตัวอย่างก่อนหน้านี้ที่รบกวนอัลกอริทึมที่ผลิตเป็นผลโวหารว่านักวิจัยระวังอาจจะตรวจสอบต่อไปจะมีรุ่นแม้ trickier ของรบกวนอัลกอริทึมที่เกิดขึ้นเมื่อนักออกแบบระบบออนไลน์มีความตระหนักในทฤษฎีทางสังคมและแล้วอบทฤษฎีเหล่านี้ในการทำงาน ของระบบของพวกเขา นักวิทยาศาสตร์สังคมเรียก Performativity นี้: เมื่อทฤษฎีการเปลี่ยนแปลงของโลกในลักษณะที่พวกเขานำโลกมากยิ่งขึ้นในสอดคล้องกับทฤษฎี ในกรณีของการรบกวนอัลกอริทึมในภาคปฏิบัติที่ธรรมชาติอดสูของข้อมูลที่มีแนวโน้มที่จะมองไม่เห็น

ตัวอย่างหนึ่งของรูปแบบที่สร้างขึ้นโดย Performativity เป็นกริยาในเครือข่ายสังคมออนไลน์ ในปี 1970 และ 1980 นักวิจัยซ้ำ ๆ พบว่าหากคุณเป็นเพื่อนกับอลิซและคุณเป็นเพื่อนกับบ๊อบแล้วบ๊อบและอลิซมีแนวโน้มที่จะเป็นเพื่อนกับแต่ละอื่น ๆ กว่าคนสองคนที่สุ่มเลือก และรูปแบบเดียวกันอย่างนี้ถูกพบในรูปแบบของกราฟทางสังคมบน Facebook (Ugander et al. 2011) ดังนั้นหนึ่งอาจสรุปได้ว่ารูปแบบของมิตรภาพบน Facebook ทำซ้ำรูปแบบของมิตรภาพออฟไลน์อย่างน้อยในแง่ของกริยา อย่างไรก็ตามขนาดของกริยาในกราฟสังคม Facebook เป็นแรงผลักดันบางส่วนจากการรบกวนอัลกอริทึม นั่นคือนักวิทยาศาสตร์ข้อมูลที่ Facebook รู้ของการวิจัยเชิงประจักษ์และทฤษฎีเกี่ยวกับกริยาและอบแล้วมันกลายเป็นวิธีการทำงานของ Facebook Facebook มี "คนที่คุณอาจรู้" คุณลักษณะที่แสดงให้เห็นเพื่อนใหม่และวิธีหนึ่งที่ว่า Facebook ตัดสินใจที่จะแนะนำให้คุณเป็นกริยา นั่นคือ Facebook มีแนวโน้มที่จะขอแนะนำให้คุณกลายเป็นเพื่อนกับเพื่อนของเพื่อนของคุณ คุณลักษณะนี้จึงมีผลต่อการเพิ่มขึ้นของกริยาในกราฟสังคม Facebook นั้น ในคำอื่น ๆ ที่ทฤษฎีของกริยานำโลกในสอดคล้องกับการคาดการณ์ของทฤษฎี (Healy 2015) ดังนั้นเมื่อแหล่งข้อมูลขนาดใหญ่ปรากฏขึ้นในการทำซ้ำการคาดการณ์ของทฤษฎีสังคมเราจะต้องแน่ใจว่าทฤษฎีของตัวเองไม่ได้อบเป็นวิธีการที่ระบบทำงาน

แทนที่จะคิดของแหล่งข้อมูลขนาดใหญ่เป็นคนสังเกตในการตั้งค่าธรรมชาติอุปมาฉลาดมากขึ้นจะสังเกตคนในคาสิโน คาสิโนที่มีสภาพแวดล้อมที่เครื่องสูงที่ออกแบบมาเพื่อก่อให้เกิดพฤติกรรมบางอย่างและนักวิจัยจะไม่เคยคาดพฤติกรรมที่ในคาสิโนจะให้อิสระหน้าต่างเข้าไปในพฤติกรรมของมนุษย์ แน่นอนเราสามารถเรียนรู้บางสิ่งบางอย่างเกี่ยวกับพฤติกรรมการเรียนของมนุษย์คนในคาสิโนในความเป็นจริงคาสิโนอาจจะมีการตั้งค่าที่เหมาะสำหรับการศึกษาความสัมพันธ์ระหว่างการบริโภคเครื่องดื่มแอลกอฮอล์และความเสี่ยงการตั้งค่า แต่ถ้าเราไม่สนใจว่าข้อมูลที่ถูกสร้างขึ้นในคาสิโนที่เราอาจจะ สรุปผลที่ไม่ดีบางอย่าง

แต่น่าเสียดายที่การจัดการกับอัลกอริทึมรบกวนเป็นเรื่องยากอย่างยิ่งเพราะคุณลักษณะต่างๆของระบบออนไลน์ที่เป็นกรรมสิทธิ์ของเอกสารที่ไม่ดีและการเปลี่ยนแปลงตลอดเวลา ตัวอย่างที่ผมจะอธิบายต่อไปในบทนี้รบกวนอัลกอริทึมก็อธิบายได้หนึ่งสำหรับค่อยๆแบ่งลงของ Google แนวโน้มไข้หวัดใหญ่ (มาตรา 2.4.2) แต่การเรียกร้องนี้เป็นเรื่องยากที่จะประเมินเพราะการทำงานภายในของการค้นหาของ Google อัลกอริทึมที่มีกรรมสิทธิ์ ลักษณะของอัลกอริทึมรบกวนเป็นรูปแบบหนึ่งของการดริฟท์ระบบ รบกวนอัลกอริทึมหมายความว่าเราควรจะระมัดระวังเกี่ยวกับการเรียกร้องใด ๆ สำหรับพฤติกรรมของมนุษย์ที่มาจากระบบดิจิตอลเดียวไม่ว่าจะใหญ่