2.3.2.6 Дёти

Манбаъҳои маълумот Big метавонанд бо партовҳои ва спам боргузори шаванд.

Баъзе муњаќќиќон чунин мењисобанд, ки манбаъҳои маълумот калон, хусусан онҳое, ки аз манбаъњои онлайн, pristine мебошанд, чунки онҳо ба таври худкор ҷамъоварӣ. Дар асл, одамоне, ки бо ҳамроҳи сарчашмаи маълумоти калон кор кардаанд медонанд, ки зуд-зуд ифлос мебошанд. Яъне, онҳо зуд-зуд маълумотҳоро, ки амалњои воќеї таваҷҷуҳ ба муҳаққиқон инъикос намекунад. Бисёр олимон иљтимої аллакай бо раванди тоза васеи маълумотњои тадќиќот иљтимої, вале тоза манбаъҳои маълумоти калон аст, барои ду сабаб мушкил шинос аст: 1) онҳо аз ҷониби муҳаққиқон барои муҳаққиқон ва 2) муҳаққиқон офарида нашудаанд умуман фаҳмиши камтар, ки чӣ тавр ки онҳо таъсис дода шуд.

Дар хатари маълумоти микроэлементхо раќамї ифлос аз тарафи Баргард ва ҳамкорони 'тасвир (2010) омӯзиши вокуниши эҳсосӣ ба ҳамлаҳои 11-уми сентябри соли 2001 Тадқиқотчиён маъмулан омӯзиши вокуниш ба ҳодисаҳои фоҷиабори бо истифода аз маълумоти қувваи бозгашт ҷамъоварӣ беш аз моҳ ё ҳатто сол. Аммо, Баргард ва ҳамкорони як паёмҳои ҳамеша-оид ба манбаи рақамӣ нишонаҳои-аз timestamped, ба таври худкор ба қайд гирифта, аз 85.000 Амрико пайдо пейҷерҳо-ва ин имкон муҳаққиқон ба омӯзиши вокуниши эҳсосӣ дар timescale фарди зиёд. Баргард ва ҳамкорони як дақиқа-аз-дақиқа ҷадвали эҳсосӣ 11-уми сентябр аз ҷониби рамзгузории мазмуни эҳсосӣ паёмҳои pager аз тарафи фоизи суханони марбут ба (1) ғаму офаридааст (масалан, фарьёд мезаданд, ки ғаму), (2) изтироб (масалан, ташвиш тарсон), ва (3) хашми (масалан, нафрат, муҳим). Онҳо, ки ғаму ва изтироб дар давоми рӯз бе як намунаи қавӣ тағйир ёфт, аммо ин буд, ки афзоиши корпартоии дар хашм дар давоми рӯз нест. Ин тадқиқот Ба назар мерасад, мисоли аҷибе қудрати ҳамеша-оид ба манбаъњои маълумот: бо истифода аз усулҳои стандартии он ғайриимкон мебуд, ба чунин ҷадвали-њалли баланди вокуниши фаврии ба чорабинии ғайричашмдошт.

Танҳо баъд аз як сол, вале Синтия Pury (2011) дар маълумоти бештар бодиққат нигарист. Ӯ ошкор намояд, ки шумораи зиёди паёмҳои гӯё ғазаб аз тарафи pager ягона тавлид шуд, ва онҳо ҳама якхела буданд. Дар ин ҷо чӣ касоне паёмҳои гӯё ба ғазаб гуфт:

"Мошини Перезагрузка NT [НОМ] дар Хонаи [НОМ] дар [маҳалли ҷойгиршавии]: хатарнок: [сана ва вақт]»

Ин паёмҳои хашмгин нишонгузорӣ карда шуданд, зеро онҳо дохил калимаи «хатарнок», ки метавонад ба таври умум нишон хашми вале дар ин ҳолат нест. Хориҷ паёмҳои тавлидшуда аз ҷониби ин pager ягонаи автоматикунонидашудаи пурра маҳв зиёд ошкор дар хашм бар ҷараёни рӯз (расми 2.2). Ба ибораи дигар, дар натиҷаи асосӣ дар Back, Küfner, and Egloff (2010) як artifact як pager буд. Тавре ки ин мисол нишон медиҳад, тањлили нисбатан содда намудани маълумоти нисбатан мураккаб ва бетартибона дорад, иқтидори рафта ҷиддӣ нодуруст аст.

Расми 2.2: тамоюлҳои тахминии дар хашм бар ҷараёни 11-уми сентябри соли 2001 дар асоси 85.000 пейҷерҳо Амрико (Баргард, Küfner ва Egloff 2010; Pury 2011; Бозгашт, Küfner ва Egloff 2011). Дар аввал, Баргард, Küfner ва Egloff (2010) як намунаи афзоиши хашм дар давоми рӯз гузориш доданд. Перезагрузка NT мошина [НОМ] дар Хонаи [НОМ] дар [маҳалли ҷойгиршавии]: хатарнок: [сана ва вақт] Бо вуҷуди ин, бисёре аз ин хабарҳо ба ғазаб ошкор як pager ягона, ки такроран дар хабари зерин ирсол берун тавлидшуда шуданд. Бо ин паём бардоштем, афзоиши ошкор дар ғазаби нопадид (Pury соли 2011; Бозгашт, Küfner ва Egloff 2011). Ин нишондод дар як таҷдиди расми 1B дар Pury (2011) мебошад.

Расми 2.2: тамоюлҳои тахминии дар хашм бар ҷараёни 11-уми сентябри соли 2001 дар асоси 85.000 пейҷерҳо Амрико (Back, Küfner, and Egloff 2010; Pury 2011; Back, Küfner, and Egloff 2011) . Дар аввал, Back, Küfner, and Egloff (2010) як намунаи афзоиши хашм дар давоми рӯз гузориш доданд. "Мошини Перезагрузка NT [НОМ] дар Хонаи [НОМ] дар [маҳалли ҷойгиршавии]: хатарнок: [сана ва вақт]" Бо вуҷуди ин, бисёре аз ин хабарҳо ба ғазаб ошкор як pager ягона, ки такроран дар хабари зерин ирсол берун тавлидшуда шуданд. Бо ин паём бардоштем, афзоиши ошкор дар ғазаби нопадид (Pury 2011; Back, Küfner, and Egloff 2011) . Ин нишондод дар як таҷдиди расми 1B дар аст, Pury (2011) .

Дар ҳоле ки маълумоти ифлос аст, ки офаридааст, нохост ба монанди яке аз ғалоғула pager-мумкин аст аз ҷониби як пажӯҳишгари оқилона эҳтиёт ошкор низ баъзе системаҳо онлайн, ки ҷалби спаммерҳо қасдан ҳастанд. Ин спаммерҳо фаъолона тавлиди маълумоти қалбакӣ, ва-аксар вақт аз тарафи фоида кор хеле душвор бармеангехт нигоҳ spamming худро пушида намонад. Масалан, фаъолияти сиёсӣ дар Twitter ба назар мерасад дохил ақаллан баъзе спам оқилона мураккабтар, ки ба василаи баъзе сабабҳои сиёсӣ қасдан дод, ки назар маъруф бештар аз инҳо аслии мебошанд (Ratkiewicz et al. 2011) . Тадқиқотчиён кор бо маълумотҳо, ки метавонанд дорои спам қасдан мушкилоти боварибахш шунавандагон, ки онҳо ошкор кардаанд ва хориҷ спам дахлдор ба рӯ мешаванд.

Дар охир, чӣ ҳисоб маълумоти ифлос метавонад бо тарзҳои маккорона оид ба масъалаҳои тадқиқоти шумо вобаста аст. Масалан, бисёре аз вироишҳои ба Википедиа бо ботҳо автоматӣ офаридааст (Geiger 2014) . Агар шумо манфиатдор дар экологияи Википедиа ҳастед, пас ин ботҳо муҳим ҳастанд. Лекин, агар шумо манфиатдор дар чӣ тавр инсоният ба Википедиа мусоидат мекунанд, ки ин вироишҳо аз тарафи ин ботҳо бояд истисно карда шавад.

Дар роҳҳои беҳтарини ба канорагирӣ аз тарафи фиреб маълумоти ифлос дарк кардани иттилооти худ ба иҷро таҳлили љустуљўї оддӣ, ба монанди ворид намудани ќитъањои пароканда оддӣ офарида шуда буданд.