2.3.1

Маљмўи калон як воситаи ба охир; онҳо хотима дар худ нест.

Хусусияти фарогирии манбаъҳои бузурги маълумотҳо ин аст, ки онҳо BIG мебошанд. Бисёре аз варақаҳо, масалан, бо муҳокима ва баъзан фахр кардан - оиди маълумоте, ки онҳо таҳлил кардаанд, оғоз мекунанд. Масалан, коғазе, ки дар соҳаи илм омӯхтани тамоюлҳои калимаро дар Google китобҳои китобҳои дар зер овардашуда (Michel et al. 2011) :

[Corpus] дорои беш аз 500 миллиард калимаҳои англисӣ (361 миллиард), фаронсавӣ (45 млрд.), Испанӣ (45 миллиард), олмонӣ (37 миллиард), чинӣ (13 миллиард), русӣ (35 миллиард) (2 млрд. Кори қадимтарин дар 1500 адад нашр шуд. Даҳҳо даҳсолаҳо танҳо якчанд китобҳо дар як сол, аз якчанд сад ҳазор калимаҳо иборатанд. То соли 1800, корпуси ҳар сол ба 98 миллион калима мерасад; то соли 1900, 1,8 млрд. ва 2000, 11 миллиард. Корпус наметавонад аз ҷониби инсон хонда шавад. Агар шумо кӯшиш карда бошед, ки танҳо аз соли 2000-ум ба забони англисӣ хонед, дар дақиқаи 200 калима / дақиқа, бе рухсора барои хӯрок ва хоб, 80 сол лозим мешавад. Сатҳи мактубҳо аз геноми инсонӣ 1000 маротиба зиёдтар аст: Агар шумо онро дар хатти рост навиштед, он ба Мун расида ва 10 маротиба бармегардад ».

Миқдори ин маълумот бешубҳа ба таври назаррас буда, ҳамаи мо шукргузорӣ мекунем, ки дастаи Google Китобҳо ин маълумотро ба аҳолӣ (дар ҳақиқат, баъзе аз фаъолиятҳо дар охири ин фасли мазкур истифода мебаранд). Аммо, вақте ки шумо чунин чизеро мебинед, шумо бояд пурсед: оё ҳамаи ин маълумот дар ҳақиқат коре мекунад? Оё онҳо таҳқиқ мекунанд, ки агар маълумот ба моҳ ва танҳо як бор такрор шавад? Чӣ бояд кард, агар маълумотҳо танҳо ба болои Mount Mount Everest ё болои Tower Tower?

Дар ин ҳолат, тадқиқоти онҳо дар баъзе мавридҳо, ки дар муддати тӯлонӣ муддати калони калимаҳои калимаро талаб мекунанд, доранд. Масалан, онҳое, ки онҳоро таҳқиқ мекунанд, эволютсияҳои грамматикӣ, хусусан дар сатҳи мутобиқати номуваффақи тағйирёбанда тағйир меёбанд. Азбаски баъзе лампаҳои номуназзам хеле каманд, миқдори зиёди маълумот зарур аст, ки тағйиротро дар вақташ ошкор созанд. Вале аксар вақт, тадқиқотчиён назар ба андозаи манбаи бузурги маълумот ба таври муассир табдил меёбанд - «ба назар мерасад, ки чӣ қадар маълумотҳоро, ки ман метавонем ғарқ кунӣ», аз як ҷиҳат ба як ҳадафи муҳимтарини илмӣ ҷалб намоем.

Дар таҷрибаи ман, омӯзиши ҳодисаҳои нодир аз яке аз се сабабҳои илмии мушаххасе мебошад, ки маълумотҳои зиёди онҳо имконият медиҳанд. Дуюм, омӯзиши ҳунармандӣ аст, ки метавонад аз ҷониби омӯзиши Руйта Четт ва ҳамкорон (2014) дар ҷобаҷогузории иҷтимоӣ дар Иёлоти Муттаҳида нишон дода шавад. Дар гузашта бисёри тадқиқотчиён бо роҳи муқоиса кардани натиҷаҳои ҳаётии волидайн ва кӯдакон аз ҷобаҷогузории иҷтимоӣ омӯхтанд. Муайян кардани мундариҷаи ин адабиёт ин аст, ки волидони волидон ба фарзандони имконияташон манфиатдоранд, аммо қувваи ин муносибат бо вақт ва дар саросари кишварҳо фарқ мекунад (Hout and DiPrete 2006) . Вале чанде пештар Chetty ва ҳамкорон тавонистанд аз андозаи 40 миллион нафар истифода кунанд, то тавонанд ҳосилхезии байнулмилалиро дар саросари Иёлоти Муттаҳида ба назар гиранд (ҷадвали 2.1). Онҳо пайдо шуданд, масалан, эҳтимолияти он, ки фарзандаш дараҷаи баланди тақсимоти даромади миллӣ аз ибтидо аз як оила дар поёнтар ба поён мерасад, тақрибан 13% дар Сан Хосе, Калифорния, вале танҳо 4% дар Шарлотт, Каролинаи Шимолӣ. Агар шумо дар лаҳзаи 2.1-ро ба назар гиред, шумо метавонед фикр кунед, ки чаро мобилияти байниидоравӣ дар баъзе ҷойҳо баландтар аст. Четон ва ҳамкорони онҳо ҳамон як савол буданд, ва онҳо мефаҳмиданд, ки дар минтақаҳои алоҳида сегрегатсияи иҷтимои хурд, нобаробарии камтари даромад, мактабҳои беҳтарини ибтидоӣ, сармояи бузургтарини иҷтимоӣ ва суботи калонтарини оилавӣ мавҷуданд. Албатта, ин таносубҳо танҳо нишон медиҳанд, ки ин омилҳо мобилияти бештарро ба вуҷуд меорад, вале механизмҳои имконпазирро пешниҳод мекунанд, ки метавонанд дар кори минбаъда омӯхта шаванд, ки он чиро, ки Члю ва ҳамкорони худро дар кори минбаъда иҷро мекунанд. Аҳамият диҳед, ки андозаи маълумот дар ин лоиҳа хеле муҳим буд. Агар Chetty ва ҳамкорон гузориши андозро аз 40 ҳазор нафар зиёдтар аз 40 миллион истифода кунанд, онҳо натавонистанд арзиши геноглобентиро арзёбӣ кунанд ва ҳеҷ гоҳ ба тадқиқотҳои минбаъда барои муайян кардани механизмҳое, ки ин тағйиротро эҷод мекунанд, имкон надоштанд.

Диаграммаи 2.1: Арзёбии имконияти кӯдак барои расидан ба боло 20 фоизи тақсимоти даромад ба волидон дар поён 20% (Chetty et al., 2014). Сатҳи сатҳи минтақавӣ, ки дорои сатҳи баланд аст, табиатан ба саволҳои шавқовар ва муҳиме, ки аз як сатҳе, ки сатҳи миллиро ба вуҷуд намеорад, оварда мерасонад. Ин сатҳҳои сатҳи минтақавӣ имконпазир гаштанд, зеро тадқиқотчиён сарчашмаи калони маълумотро истифода мебурданд: рӯйхати андозҳои 40 миллион нафар. Аз маълумоти дастрас дар http://www.equality-of-opportunity.org/.

Диаграммаи 2.1: Арзёбии имконияти кӯдак барои расидан ба боло 20 фоизи тақсимоти даромад ба волидон дар поён 20% (Chetty et al. 2014) . Сатҳи сатҳи минтақавӣ, ки дорои сатҳи баланд аст, табиатан ба саволҳои шавқовар ва муҳиме, ки аз як сатҳе, ки сатҳи миллиро ба вуҷуд намеорад, оварда мерасонад. Ин сатҳҳои сатҳи минтақавӣ имконпазир гаштанд, зеро тадқиқотчиён сарчашмаи калони маълумотро истифода мебурданд: рӯйхати андозҳои 40 миллион нафар. Аз маълумоти дастрас дар http://www.equality-of-opportunity.org/.

Ниҳоят, илова бар омӯхтани ҳодисаҳои нодир ва омӯхтани ҳисси фарогирӣ, маҷмӯаҳои калони илмӣ инчунин ба тадқиқотчиён имкон медиҳанд, ки тафаккури хурдро ошкор кунанд. Дар ҳақиқат, бисёре аз диққати ҷиддии маълумот дар соҳаи саноат дар бораи ин фарқиятҳои хурд: боэътимодона ошкор кардани фарқияти байни 1% ва 1.1% суръати тамос бо реклам метавонад миллионҳо долларро дар даромадҳои иловагӣ тарҷума кунад. Аммо дар баъзе муқаррароти илмӣ, ин гуна тафовутҳои хурд метавонад муҳим набошад, ҳатто агар онҳо статистикӣ (Prentice and Miller 1992) . Аммо, дар баъзе муқаррароти сиёсат, вақте ки онҳо дар маҷмӯа дида мешаванд, метавонанд муҳим бошанд. Масалан, агар ду тадбирҳои тандурустии ҷамъиятӣ дошта бошанд ва яке аз онҳо нисбат ба дигар самараноктар самараноктар аст, пас интихоби дахолати бештар самаранок метавонад ба наҷоти ҳазорҳо ҳаёти иловагӣ хотима диҳад.

Гарчанде ки бензин умуман як амволи хубест, вақте ки дуруст истифода бурда мешавад, ман фаҳмидем, ки он метавонад баъзан ба хатогии одатӣ оварда расонад. Барои баъзе сабабҳо, фишор ба назар гирифтани тадқиқотчиёнро ба назар нагирифтааст, ки чӣ тавр маълумотҳои онҳо истеҳсол мешаванд. Дар ҳоле ки bigness мекунад кам кардани зарурати ба ташвиш дар бораи хатои тасодуфӣ, он дар асл меафзояд, зарурати ба ташвиш дар бораи хатогиҳо муназзам, ба намуди хатоҳои, ки ман дар зер, ки дар тасвир аз Тамоюлҳои пайдо, дар чӣ гуна маълумот таъсис дода мешаванд. Масалан, дар як лоиҳа ман баъдтар дар ин боб тавзеҳ медиҳем, ки таҳқиқотчиён 11 сентябри соли 2001-ро барои тасвири ҳассосе, ки ба зидди террористӣ (Back, Küfner, and Egloff 2010) . Азбаски тадқиқотчиён шумораи зиёди хабарҳоро доштанд, онҳо дар ҳақиқат дар бораи он ки оё намунаашон диданд, ғамгинтар шуда истодаанд, дар давоми рӯз ба вуқӯъ мепайванданд. Маълумотҳои зиёд вуҷуд доштанд ва намунаи хеле равшан буд, ки ҳамаи санҷишҳои омории оморӣ нишон медиҳанд, ки ин намунаи воқеӣ буд. Аммо, ин санҷишҳои оморӣ дар бораи он ки чӣ тавр маълумот дода шудааст, намедонистанд. Дар ҳақиқат, он маълум шуд, ки бисёре аз намунаҳо ба як блоги яктарафа, ки дар тамоми рӯз паёмҳои бештари беинсофӣ пайдо кардаанд. Барнагардонии ин як блог баъзе аз омилҳои асосӣ дар коғаз (Pury 2011; Back, Küfner, and Egloff 2011) тамоман нобуд кард. Бисёр таҳлилгароне, ки дар бораи хатогиҳои системавӣ фикр намекунанд, хатари истифодаи маҷмӯи калони худро доранд, то ки ба андозаи дақиқ будани миқдори эҳтимолӣ, ба монанди мундариҷаи эмотсионалии хабарҳои беинсофе, ки аз ҷониби автоматӣ ба вуҷуд омадаанд, ба вуҷуд оянд.

Дар натиҷа, маҷмӯаҳои калон дар худ нестанд, аммо онҳо метавонанд ба намудҳои муайяни тадқиқот, аз ҷумла омӯзиши ҳодисаҳои нодир, арзёбии ҳосилхезӣ ва ошкор кардани фарқиятҳои хурд. Диаграммаҳои калон ба назар гирифта мешаванд, ки баъзе тадқиқотчиёнро ба назар гиранд, ки чӣ гуна маълумотҳояш маълуманд, ки онҳо метавонанд ба хароҷоти дақиқи миқдори ками онҳо даст зананд.