5.3.4 Konkludo

Malferma alvokoj lasu multaj fakuloj kaj ne-fakuloj proponi solvojn al problemoj kie solvoj estas pli facilaj por kontroli ol generi.

En ĉiuj tri malfermita alvoko projektoj-Netflix Premio, Foldit, Peer-to-Patento-esploristoj proponis demandojn de specifa formo, petis solvojn, kaj poste prenis la plej bonaj solvoj. La esploristoj ne eĉ bezonas scii la plej sperta demandi, kaj kelkfoje la bonaj ideoj venas de neatenditaj lokoj.

Nun mi povas ankaŭ reliefigi du gravaj diferencoj inter malfermita alvoko projektoj kaj homaj kalkulado projektoj. Unue, en malfermita alvoko projektoj la esploristo specifas celo (ekzemple, antaŭdirante filmo ratings) dum en homa kalkulado la esploro indikas micro-tasko (ekz, klasifikante galaksio). Dua, en malfermaj vokoj la esploristoj volas la plej bonan kontribuon-la plej bona algoritmo por antaŭdirado filmo rangigoj, la plej malsupra-energia agordo de proteino, aŭ la plej signifa peco de antaŭa arto-ne ia simpla kombino de ĉiuj el la kontribuoj.

Donita la ĝenerala ŝablono por malferma alvokoj kaj tiuj tri ekzemploj, kio specoj de problemoj en sociaj esploro povus esti taŭgaj por tiu alproksimiĝo? Ĉe tiu punkto, mi devas agnoski ke ne estis multaj sukcesaj ekzemploj tamen (pro kialoj kiujn mi klarigos en momento). Laŭ rektaj analogoj, oni povus imagi ke Peer-to-Patento stilo projekto estanta uzita de historia esploristo serĉanta la plej fruaj dokumentoj mencii specifa persono aŭ ideo. Malfermita alvoko alproksimiĝo al tiu speco de problemo povis esti speciale valora kiam la koncernajn dokumentojn ne kolektitaj en sola arkivo sed estas vaste distribuita.

Pli ĝenerale, multaj registaroj havas problemojn kiuj povus esti cedema malfermi alvokoj ĉar ili estas pri kreanta antaŭdiroj kiuj povas esti uzitaj por gvidi agon (Kleinberg et al. 2015) . Ekzemple, kiel Netflix volis antaŭdiri rangigoj sur filmoj, registaroj eble volas antaŭdiri rezultoj kiel kiu restoracioj estas plej verŝajna al havi sanon kodo malobservoj por asigni inspektado rimedojn pli efike. Motivita de ĉi tiu speco de problemo, Glaeser et al. (2016) uzita malfermita alvoko por helpi la Urbo de Boston antaŭdiri restoracio higieno kaj sanitareco seksperfortadoj bazita sur datenoj de Yelp recenzoj kaj historiaj inspektado datumoj. Glaeser kaj kolegoj estimis ke la prognoza modelo kiu gajnis la malfermita alvoko plibonigus la productividad de restoracio inspektistoj de ĉirkaŭ 50%. Entreprenoj ankaŭ havas problemojn kun simila strukturo kiel antaŭdirante kliento churn (Provost and Fawcett 2013) .

Fine, krom malfermi alvokoj kiuj implikas rezultoj kiuj jam okazis en aparta datumoj aro (ekz, antaŭdirante sano kodo malobservoj uzante datumoj sur pasinteco sano kodo malobservoj), oni povus imagi antaŭdirante rezultoj kiuj ne okazis ankoraŭ, ke iu en la aro de datumoj . Ekzemple, la Delikata Familioj kaj Child Wellbeing studo spuris ĉirkaŭ 5.000 infanoj ekde naskiĝo en 20 malsamaj urboj de Usono (Reichman et al. 2001) . Esploristoj kolektis datumojn pri tiuj infanoj, iliaj familioj, kaj ilia pli larĝa medio ĉe naskiĝo kaj aĝoj 1, 3, 5, 9 kaj 15. Donita ĉiuj la informo pri ĉi tiuj infanoj, kiom bone povus esploristoj antaŭdiri rezultoj kiel kiu gradigi el kolegio? Aŭ, esprimita en maniero kiu estus pli interese multaj esploristoj, kiuj datumoj kaj teorioj estus plej efika en antaŭdirado tiuj rezultoj? Neniu el tiuj infanoj estas nuntempe sufiĉe aĝaj por iri al universitato, tiu estus vera antaŭen-aspekta antaŭdiro kaj estas multaj malsamaj strategioj kiuj esploristoj povus dungi. La investigador kiu kredas ke najbarecoj estas kritikaj en formado de vivo rezultoj povus preni unu alproksimiĝo dum investigador kiu temigas familioj povus fari ion tute malsama. Kiu el tiuj aliroj laborus pli bona? Ni ne scias, kaj en la procezo de elŝeligi ni povus lerni ion gravan pri familioj, najbaraĵoj, edukado kaj socia malegaleco. Plui, tiuj antaŭdiroj povus uzi por gvidi estontecon datenkolektado. Imagu ke ekzistis malmulto de universitato diplomitoj kiuj ne antaŭdiris diplomiĝi per iu el la modeloj; tiuj homoj estus idealaj kandidatoj por sekvado kvalitaj intervjuoj kaj etnografiaj observo. Tiel, en tiu speco de malferma alvoko, la prognozoj ne estas la fino; prefere, ili provizas novan vojon kompari, riĉigi kaj kombini malsamajn teorian tradiciojn. Tiu speco de malferma alvoko ne estas specifa al uzante datumoj de Fragile Familioj antaŭdiri kiu iros al la universitato; ĝi povus esti uzita por antaŭdiri ajnan rezulton kiu eventuale estos kolektita en ia longitudinales socia datumoj aro.

Kiel mi skribis pli frue en tiu sekcio, ekzistas ne estis multaj ekzemploj de sociaj esploristoj uzante malferma alvokoj. Mi pensas ke tio estas ĉar malferma alvokoj ne bone taŭgas por la vojo ke sociaj sciencistoj tipe kadri iliajn demandojn. Revenante al la Netflix Premio, sociaj sciencistoj ne kutime demandas pri antaŭdirante gustoj, ili demandus pri kiel kaj kial kulturaj gustoj diferencas por homoj de malsamaj sociaj klasoj (Bourdieu 1987) . Tia "kiel" kaj "kial" demando ne kondukas al facila por kontroli solvoj, kaj tial ŝajnas malbone tauxgas por malfermi alvokoj. Tiel, ĝi similas ke malferma alvokoj estas pli cedema al demando de antaŭdiro ol demandoj de klarigo; por pli sur la distingo inter prognozo kaj klarigo vidi Breiman (2001) . Lastatempaj teoriuloj tamen vokis sur sociaj sciencistoj rekonsideri la dicotomía inter klarigo kaj prognozo (Watts 2014) . Kiel la linio inter antaŭdiro kaj klarigo nebuligas, mi atendas ke malfermaj konkursoj fariĝos pli komuna en la sociaj sciencoj.