2.4.3 Approximating deuchainnean

Is urrainn dhuinn deuchainnean a thoirt seachad nach eil no nach urrainn dhuinn a dhèanamh. Tha dà dhòigh-obrach a tha gu h-àraidh a 'faighinn buannachd bho stòran dàta mòra mar dheuchainnean nàdarra agus co-ionannachd

Tha cuid de cheistean cudromach saidheansail agus poileasaidh adhbharach. Mar eisimpleir, dè a 'bhuaidh a bhios aig prògram trèanaidh obrach air tuarastail? Dh'fhaodadh neach-rannsachaidh a tha a 'feuchainn ris a' cheist seo a fhreagairt coimeas a dhèanamh eadar cosnaidhean dhaoine a chuir clàradh airson trèanadh dhaibhsan nach do rinn. Ach dè an ìre de dh 'eadar-dhealachadh sam bith anns na tuarastalan eadar na buidhnean sin air sgàth an trèanaidh agus dè a tha a dhìth air sgàth eadar-dhealachaidhean preexisting eadar na daoine a tha a' clàradh agus an fheadhainn nach eil? Is e ceist dhuilich a tha seo, agus is e seo aon nach eil a 'dol air falbh le barrachd dàta gu fèin-obrachail. Ann am faclan eile, tha an dragh mu dh 'eadar-dhealachaidhean a tha comasach air a bhith a' nochdadh a dh'aindeoin dè an àireamh de luchd-obrach anns an dàta agad.

Ann am mòran shuidheachaidhean, is e an dòigh as làidire airson tuairmse a thoirt air buaidh adhbharach cuid de dh 'leigheas, leithid trèanadh obrach, deuchainn deuchainn air a thionndadh air thuaiream far a bheil neach-rannsachaidh a' toirt seachad an leigheas air thuaiream do chuid de dhaoine agus chan e feadhainn eile. Cuiridh mi a h-uile caibideil 4 gu deuchainnean, agus mar sin an seo tha mi a 'dol a chuimseachadh air dà ro-innleachd a dh'fhaodar a chleachdadh le dàta neo-dheuchainneach. Tha a 'chiad ro-innleachd an crochadh air a bhith a' lorg rudeigin a tha a 'tachairt anns an t-saoghal a bhios a' sònrachadh an leigheis air cuid de dhaoine air thuaiream (no cha mhòr air thuaiream) agus chan e feadhainn eile. Tha an dàrna ro-innleachd an urra ri bhith ag atharrachadh dàta neo-dhearbhach ann an staitistig ann an oidhirp gus cunntas a thoirt airson eadar-dhealachaidhean preexisting eadar an fheadhainn a rinn agus nach d 'fhuair an leigheas.

Dh'fhaodadh neach-amhairc a bhith a 'tagradh gum bu chòir an dà ro-innleachd sin a sheachnadh oir tha feum aca air barailean làidir, barailean a tha doirbh a mheasadh agus gu tric, gu bheil iad tric air am briseadh. Ged a tha mi mothachail air an tagradh seo, tha mi a 'smaoineachadh gu bheil e a' dol beagan ro fhada. Tha e gu cinnteach fìor gu bheil e doirbh tuairmsean adhbharach a dhèanamh bho dàta neo-dheuchainneach, ach chan eil mi a 'smaoineachadh gu bheil sin a' ciallachadh nach bu chòir dhuinn feuchainn a-riamh. Gu h-àraidh, faodaidh modhan neo-dhearbhach a bhith cuideachail ma chuireas casg loidsigeach bacadh ort o bhith a 'dèanamh deuchainnean no ma tha cuingealachaidhean eiticeach a' ciallachadh nach eil thu airson deuchainnean a ruith. A bharrachd, faodaidh modhan neo-dhearbhach a bhith cuideachail ma tha thu airson brath a ghabhail air dàta a tha ann mar-thà gus deuchainnean a th 'air a stiùireadh fo thimcheall a dhealbh.

Mus tèid a dhol air adhart, is fhiach a bhith mothachail cuideachd gur e tuairmsean adhbharach aon de na cuspairean as iom-fhillte ann an rannsachadh sòisealta, agus aon a dh'fhaodas deasbad dian agus faireachail a thoirt gu buil. Mar a leanas, bheir mi cunntas dòigheil air gach dòigh-obrach gus togail air inntinn mu dheidhinn, an uairsin bheir mi cunntas air cuid de na dùbhlain a tha a 'nochdadh nuair a bhios iad a' cleachdadh an dòigh-obrach sin. Tha tuilleadh fiosrachaidh mu gach dòigh-obrach ri fhaighinn anns na stuthan aig deireadh a 'chaibideil seo. Ma tha thu am beachd aon de na dòighean-obrach sin a chleachdadh anns an rannsachadh agad fhèin, tha mi a 'moladh gu mòr a bhith a' leughadh aon de na leabhraichean as fheàrr air co-dhùnaidhean adhbharanach (Imbens and Rubin 2015; Pearl 2009; Morgan and Winship 2014) .

Is e aon dòigh-obrach airson tuairmsean adhbharach a dhèanamh bho dàta neo-dhearbhach tachartas a lorg a tha air leigheas a shònrachadh air thuaiream do chuid de dhaoine agus chan ann do dhaoine eile. Canar deuchainnean nàdarra ris na suidheachaidhean sin. Tha aon de na h-eisimpleirean as soilleire de dheuchainn nàdarra a 'tighinn bhon rannsachadh a rinn Joshua Angrist (1990) tomhas buaidh seirbheisean armailteach air tuarastalan. Rè a 'chogaidh ann am Bhietnam, chuir na Stàitean Aonaichte meudachd nam feachdan armaichte aca tro dhreach. Gus co-dhùnadh dè na saoranaich a chaidh a thoirt a-steach don t-seirbheis, chùm riaghaltas na SA crannchur. Chaidh a h-uile ceann-là breith a sgrìobhadh air pìos pàipear, agus, mar a chithear ann am figear 2.7, chaidh na pìosan pàipeir seo a thaghadh aon uair aig àm gus an òrdugh far am biodh daoine òga air an gairm gu seirbheis a choileanadh (cha robh boireannaich òga cuspair chun an dreach). Stèidhichte air na toraidhean, chaidh an fheadhainn a rugadh air an t-Sultain 14 a ghairm an toiseach, air an robh fir a rugadh air 24 Giblean air an ainmeachadh an dàrna fear, agus mar sin air adhart. Aig a 'cheann thall, anns an crannchur seo, chaidh fir a rugadh air 195 latha eadar-dhealaichte a dhealbhadh, ged nach robh fir a rugadh ann an 171 làithean.

Figear 2.7: Am fear-cèile Alexander Pirnie (R-NY) a 'tarraing a' chiad chapalt airson dreach na Seirbheis Roghnaichte air 1 Dùbhlachd 1969. Chuir Joshua Angrist (1990) an dreachd den chrannchur le dàta cosnaidh bho Rianachd Tèarainteachd Shòisealta gus tuairmse a dhèanamh air buaidh seirbheis armailteach air cosnadh. Seo eisimpleir de rannsachadh a 'cleachdadh deuchainn nàdarra. Stòr: Siostam Seirbheis Roghnaichte na SA (1969) / Wikimedia Commons.

Figear 2.7: Am fear-cèile Alexander Pirnie (R-NY) a 'tarraing a' chiad chapalt airson dreach na Seirbheis Roghnaichte air 1 Dùbhlachd 1969. Chuir Joshua Angrist (1990) an dreachd den chrannchur le dàta cosnaidh bho Rianachd Tèarainteachd Shòisealta gus tuairmse a dhèanamh air buaidh seirbheis armailteach air cosnadh. Seo eisimpleir de rannsachadh a 'cleachdadh deuchainn nàdarra. Stòr: Siostam Seirbheis Roghnaichte na SA (1969) / Wikimedia Commons .

Ged nach biodh e follaiseach sa bhad, tha dreach de dhualchas aig crannchur ri deuchainn air a stiùireadh fo thimcheall: ann an dà shuidheachadh, thèid com-pàirtichean a thoirt seachad air thuaiream airson leigheas fhaighinn. Gus sgrùdadh a dhèanamh air a 'bhuaidh a th' aig a 'chùrsa air thuaiream seo, thug Angrist buannachd do shiostam dàta mòr a bha ann an-còmhnaidh: Rianachd Tèarainteachd Sòisealta na SA, a bhios a' cruinneachadh fiosrachadh mu cha mhòr a h-uile h-aon de chosnadh Ameireaganach bho chosnadh. Le bhith a 'cur an fhiosrachaidh a-mach mu cò a chaidh a thaghadh air thuaiream san dreach crannchur leis an dàta cosnaidh a chaidh a chruinneachadh ann an clàran rianachd riaghaltais, choinnich Angrist gun robh tuarastal seann-sheirbhisich mu 15% nas lugha na cosnadh luchd-obrach nach robh coltach ri chèile.

Mar a tha an eisimpleir seo a 'sealltainn, uaireannan tha feachdan sòisealta, poilitigeach no nàdarra a' sònrachadh leigheasan ann an dòigh a dh'fhaodas luchd-rannsachaidh a ghiùlan, agus uaireannan bidh buaidh nan leigheasan sin air an glacadh ann an daonnan - air tobraichean dàta mòr. Faodar geàrr-chunntas a dhèanamh air an ro-innleachd rannsachaidh mar a leanas: \[\text{random (or as if random) variation} + \text{always-on data} = \text{natural experiment}\]

Gus an ro-innleachd seo a shoilleireachadh anns an aois dhidseatach, smaoinich sinn air sgrùdadh le Alexandre Mas agus Enrico Moretti (2009) a dh'fheuch ri tuairmse a dhèanamh air a 'bhuaidh a bhith ag obair le co-obraichean buannachdail air toradh neach-obrach. Mus fhaic thu na toraidhean, is fhiach a bhith a 'sealltainn gu bheil co-dhùnaidhean annasach a dh' fhaodadh a bhith agad. Air an aon làimh, is dòcha gum biodh dùil agad gum biodh e ag obair le co-obraichean buannachdail le neach-obrach a bhith ag àrdachadh a cinneasachd air sgàth cuideam co-aoisean. No, air an làimh eile, dh'fhaodadh tu a bhith an dùil gum faodadh co-aoisean a bhith ag obair cruaidh a thoirt air neach-obrach a bhith a 'falbh air sgàth' s gu bheil an obair air a dhèanamh le a co-aoisean co-dhiù. B 'e deuchainn smachd a th' ann an dòigh as fhasa airson a bhith a 'sgrùdadh cho-bhuaidhean air toradh, far an deach luchd-obrach a shònrachadh air thuaiream airson gluasad le luchd-obrach aig ìrean cinneasachd eadar-dhealaichte agus an uairsin thèid an toradh a thomhas airson a h-uile duine. Ach, chan eil luchd-sgrùdaidh a 'cumail smachd air clàr-obrach luchd-obrach ann an gnìomhachas sam bith, agus mar sin dh'fheumadh Mas and Moretti a bhith an eisimeil deuchainn nàdarra a' toirt a-steach airgeadadairean aig mòr-bhùth.

Anns a 'bhùth-bhùth seo, air sgàth an dòigh anns an deach clàradh a dhèanamh agus an dòigh a tha a' gluasad thairis, bha co-obraichean eadar-dhealaichte aig gach neach-ionmhais aig diofar amannan den latha. A bharrachd, anns a 'bhùth-bhùth shònraichte seo, cha robh obair cisteadairean ceangailte ri cinneasachd an co-aoisean no cho trang sa bha an stòras. Ann am faclan eile, ged nach robh clàradh cìsearan air a dhearbhadh le crannchur, bha e mar gum biodh luchd-obrach air am fastadh air thuaiream uaireannan ag obair le co-aoisean àrd (no ìseal). Gu fortanach, bha siostam dearbhaidh aois digiteach aig a 'mhòr-bhùth seo a bha a' cumail sùil air na nithean a bha gach neach-ionmhais a 'sganadh fad na h-ùine. Bho na clàran-taice clàraidh seo, bha Mas agus Moretti comasach air tomhas mionaideach, fa leth, agus daonnan de chinneasachd a chruthachadh: an àireamh de nithean a chaidh an sganadh gach dàrna fear. A 'ceangal an dà rud sin - an atharrachadh nàdarra ann an toradh co-aoisean agus an tomhas de thorachd a tha an-còmhnaidh air a thoirt seachad - mheas Mas agus Moretti nan deigheadh ​​co-oibriche a thoirt do neach-ionmhais a bha 10% nas buannachdail na an àbhaist, gum biodh a cinneasachadh ag èirigh 1.5% S an Iar- A thuilleadh air an sin, chleachd iad meud agus beairteas an dàta airson dà chùis chudromach a rannsachadh: iomadachd a 'bhuaidh seo (airson dè an seòrsa de luchd-obrach a tha an èifeachd nas motha?) Agus na dòighean air cùl a' bhuaidh (Carson a tha co-aoisean àrd-toraidh a 'leantainn gu cinneasachd nas àirde?). Tillidh sinn chun an dà chùis chudromach seo - iomadachd buaidh agus modhan leigheis-ann an caibideil 4 nuair a bhios sinn a 'bruidhinn air deuchainnean nas mionaidiche.

Le bhith a 'co-èigneachadh bhon dà sgrùdadh seo, tha clàr 2.3 a' toirt geàrr-chunntas air sgrùdaidhean eile aig a bheil an aon structar seo: a 'cleachdadh tobar dàta air-loidhne gus buaidh cuid de dhiofar atharrachadh a thomhas. Ann an cleachdadh, bidh luchd-rannsachaidh a 'cleachdadh dà ro-innleachd eadar-dhealaichte airson deuchainnean nàdarra a lorg, agus faodaidh sin a bhith math. Bidh cuid de luchd-rannsachaidh a 'tòiseachadh le stòr dàta air-loidhne agus a' coimhead airson tachartasan air thuaiream san t-saoghal; bidh feadhainn eile a 'tòiseachadh air thuaiream air thuaiream san t-saoghal agus a' coimhead airson stòran dàta a tha a 'glacadh a bhuaidh.

Clàr 2.3: Eisimpleirean de theagasg nàdurrach a 'cleachdadh stòran dàta mòra
Fòcas cuimseach Stòr deuchainn deuchainn nàdarra Daonnan-air stòr dàta Iomradh
Buaidh cho-aoisean air toradh Pròiseas Clàraidh Dèan sgrùdadh air dàta Mas and Moretti (2009)
Cruthachadh càirdeas Hurricanes Facebook Phan and Airoldi (2015)
Leudachadh nam faireachdainnean Uisge Facebook Lorenzo Coviello et al. (2014)
Aistridhean eaconamach eadar luchd-fèise Crith-thalmhainn Dàta airgead siubhail Blumenstock, Fafchamps, and Eagle (2011)
Giùlan caitheamh pearsanta 2013 dùnadh riaghaltas nan SA Dàta ionmhas pearsanta Baker and Yannelis (2015)
Buaidh eaconamach siostaman recommender Diofar Dàta brabhsair aig Amazon Sharma, Hofman, and Watts (2015)
Buaidh cuideam air pàistean gun bhreith 2006 cogadh Israel-Hezbollah Clàran breith Torche and Shwed (2015)
Giùlan leughaidh air Wikipedia Foillseachaidhean Snowden Logaichean Uicipeid Penney (2016)
Buaidh cho-aoisean air eacarsaich Aimsir Luchd-rianachd fallaineachd Aral and Nicolaides (2017)

Anns an deasbad gu ruige seo mu dheuchainnean nàdarra, dh 'fhàg mi puing chudromach: faodaidh a bhith a' dol bho na nàdar a tha air a thoirt seachad do na tha thu ag iarraidh uaireannan a bhith gu math duilich. Leigamaid air ais gu eisimpleir dreach Bhietnam. Anns a 'chùis seo, bha ùidh aig Angrist ann a bhith a' toirt tuairmse air buaidh seirbheis armailteach air tuarastalan. Gu mì-fhortanach, cha deach seirbheis armailteach a thoirt seachad air thuaiream; an àite bha e ga dhreachadh agus chaidh a thoirt seachad air thuaiream. Ach, cha robh a h-uile duine a chaidh a dhreachadh (bha diofar shaorsa), agus cha robh a h-uile duine a bha an sàs ann an dreach (dh'fhaodadh daoine saor-thoileach seirbheis a dhèanamh). Leis gun deach an dreachd a thoirt seachad air thuaiream, faodaidh neach-rannsachaidh tuairmse a dhèanamh air a 'bhuaidh a bhios ga dhreachadh airson a h-uile duine san dreach. Ach cha robh Angrist ag iarraidh faighinn a-mach dè a 'bhuaidh a bha e air a dhreachadh; bha e airson faighinn a-mach dè a 'bhuaidh a bh' aig a bhith a 'frithealadh anns an arm. Gus an tuairmse seo a dhèanamh, ge-tà, feumar barailean agus duilgheadasan a bharrachd. An toiseach, feumaidh luchd-rannsachaidh a bhith den bheachd gur ann tro sheirbheis armailteach a tha an aon dhòigh air a bheilear a 'dreachdadh cosnadh buaidhichte, barail ris an canar cuingealachadh às - dùnadh . Dh'fhaodadh am barail seo a bhith ceàrr ma dh'fhàg fir, a chaidh an dreachadh, san sgoil na b 'fhaide gus nach biodh iad a' frithealadh no ma bha luchd-fastaidh cho buailteach daoine a bha air an dreachdadh fhastadh. San fharsaingeachd, tha an cuingealachadh às-dùnadh na bheachd riatanach, agus mar as trice tha e doirbh dearbhadh. Fiù ged a tha an cuingealachadh às-dùnadh ceart, tha e fhathast do-dhèanta tuairmse a dhèanamh air buaidh seirbheis air a h-uile duine. An àite sin, tha e a 'nochdadh nach urrainn do luchd-rannsachaidh ach am measadh a dhèanamh air fo-sheòrsa sònraichte de dhaoine ris an canar co-chòrdairean (fir a dhèanadh seirbheis nuair a chaidh an dreachadh, ach nach dèanadh iad seirbheis nuair nach deach an dreachadh) (Angrist, Imbens, and Rubin 1996) . Ach b 'e gearanan, ge-tà, a' chiad ùidh inntinneach a bh 'ann. Feuch gum bi na duilgheadasan sin ag èirigh eadhon ann an cùis an ìre mhath glan den dreach crannchuir. Thig seata eile de dhuilgheadasan nuair nach eil crannchur corporra a 'toirt seachad an leigheis. Mar eisimpleir, ann an sgrùdadh Mas and Moretti air luchd-giùlain, tha ceistean a bharrachd ag èirigh mun bheachd gu bheil tasgadh co-aoisean gu tur air thuaiream. Nam bhathar a 'briseadh gu làidir air a' bheachd seo, dh'fhaodadh e na tuairmsean aca a chlaonadh. Gu crìch, faodaidh deuchainnean nàdarra a bhith nan ro-innleachd chumhachdach airson tuairmsean adhbharach a dhèanamh bho dàta neo-dheuchainneach, agus tha tobraichean dàta mòr a 'meudachadh ar comas air buannachd fhaighinn air deuchainnean nàdarra nuair a bhios iad a' tachairt. Ach, ma dh'fhaoidte gu feumar cùram mòr - agus uaireannan deagh bheachd-sa - a dhol bho na nàdar a tha air a thoirt seachad don tuairmse gu bheil thu ag iarraidh.

Tha an dàrna ro-innleachd a bu toil leam innse dhut mu bhith a 'dèanamh tuairmsean adhbharach bho dàta neo-dheuchainneach an crochadh air atharrachadh staitistigeil dàta neo-dhearbhach ann an oidhirp gus cunntas a thoirt air eadar-dhealachaidhean preexisting eadar an fheadhainn a rinn agus nach d' fhuair an leigheas. Tha mòran mhodhan atharrachaidh mar sin, ach bidh mi a 'cuimseachadh air aon co-fhreagairt ris an canar. Ann a bhith a 'maidseadh, bidh an neach-rannsachaidh a' coimhead tro dàta neo-dhearbhach gus paidhrichean de dhaoine a tha coltach a dhèanamh ach a-mhàin gu bheil an neach air leigheas fhaighinn agus nach eil. Anns a 'phròiseas a bhith a' maidseadh, tha luchd-rannsachaidh cuideachd a ' slaodadh ; is e sin, a 'toirt às do chùisean far nach eil gèam follaiseach ann. Mar sin, bhiodh an dòigh seo air a dhèanamh nas mionaidiche air a bhith a 'maidseadh agus a' tilgeadh, ach cumaidh mi leis an abairt thraidiseanta: a 'maidseadh.

Tha aon eisimpleir de chumhachd ro-innleachdan co-ionnan le stòran dàta fìor-dheuchainneach a 'tighinn bho rannsachadh air giùlan luchd-cleachdaidh le Liran Einav agus co-obraichean (2015) . Bha ùidh aca ann an rocaidean a 'gabhail àite air eBay, agus ann a bhith a' toirt tuairisgeul air an obair, cuiridh mi cuideam air buaidh prìs a 'tòiseachadh ropa air builean rup, mar a' phrìs reic no coltas reic.

Is e an dòigh as grinne airson tuairmse a dhèanamh air buaidh prìs tòiseachaidh air prìs reic ach a bhith a 'cunntadh a' phrìs mu dheireadh airson rocaidean le diofar phrìsean tòiseachaidh. Bhiodh an dòigh-obrach seo math ma bha thu airson a 'phrìs reic a thoirt seachad a rèir a' phrìs tòiseachaidh. Ach ma tha do cheist mu bhuaidh a 'phrìs tòiseachaidh, cha obraich an dòigh-obrach seo seach nach eil e stèidhichte air coimeasan cothromach; dh'fhaodadh na rupan le prìsean tòiseachaidh nas ìsle a bhith gu math eadar-dhealaichte bhon fheadhainn le prìsean tòiseachaidh nas àirde (me, dh'fhaodadh gum bi iad airson diofar sheòrsaichean bathair no a bhith a 'gabhail a-steach diofar sheòrsaichean de luchd-reic).

Ma tha thu mar-thà mothachail air na duilgheadasan a dh 'fhaodadh èirigh nuair a bhios tu a' dèanamh tuairmsean adhbharach bho dàta neo-dheuchainneach, is dòcha gu bheil thu a 'sgioblachadh an dòigh-obrach maiseach agus beachdaich air a bhith a' ruith deuchainnean achaidhean far am biodh tu a 'reic rud sònraichte-can, club goilf seata de pharaimearan rup-can, saoran an-asgaidh agus rup fosgailte airson dà sheachdain - ach le prìsean tòiseachaidh air an sònrachadh. Le bhith a 'dèanamh coimeas eadar na builean mar thoradh air a' mhargaidh, bhiodh an deuchainn seo a 'tairgse tomhas fìor shoilleir de bhuaidh prìs tòiseachaidh air prìs reic. Ach cha bhiodh an tomhas seo a 'buntainn ri aon toradh sònraichte agus seata de pharaimearan rup. Faodaidh na toraidhean a bhith eadar-dhealaichte, mar eisimpleir, airson diofar sheòrsaichean de stuthan. Às aonais teòiridh làidir, tha e doirbh a thoirt às an aon dheuchainn seo gu raon iomlan de dheuchainnean a dh'fhaodadh a bhith air an ruith. A bharrachd, tha deuchainnean achaidhean gu math daor gum biodh e neo-chomasach a h-uile atharrachadh a dh 'fhaodadh tu fheuchainn.

An coimeas ris na modhan ceumnach agus deuchainneach, ghabh Einav agus co-oibrichean an treas dòigh-obrach: co-fhreagairt. Is e am prìomh chleas san ro-innleachd aca nithean a lorg coltach ri deuchainnean raoin a tha air tachairt mu thràth air eBay. Mar eisimpleir, tha figear 2.8 a 'sealltainn cuid de na 31 liostaichean airson an aon chluba goilf a tha dìreach - le dràibhear Taylormade Burner 09 a reic leis an aon neach-reic- "budgetgolfer." Ach, tha feartan beagan eadar-dhealaichte aig na 31 liosan seo, mar a bhith a' tòiseachadh eadar-dhealaichte prìs, cinn-latha crìochnachaidh agus cìsean luingeis. Ann am faclan eile, tha e mar gum biodh "budgetgolfer" a 'ruith dheuchainnean airson an luchd-rannsachaidh.

Tha na clàran seo de dhràibhear Burner Taylormade 09 a chaidh a reic le "budgetgolfer" mar aon eisimpleir de sheata chlàraichte, far a bheil an aon rud air a reic leis an aon neach-reic, ach gach uair le feartan beagan eadar-dhealaichte. Taobh a-staigh nan clàran mòra de eBay tha litearra na ceudan de mhìltean de sheataichean co-cheangailte ris a 'toirt a-steach milleanan de liostaichean. Mar sin, an àite a bhith a 'dèanamh coimeas eadar a' phrìs deireannach airson gach roinn le prìs tòiseachaidh sònraichte, bha Einav agus co-obraichean a 'dèanamh coimeas eadar seataichean matamataigeach. Gus toraidhean a thoirt còmhla bho na coimeasan taobh a-staigh nan ceudan de mhìltean de sheataichean co-ionann, chuir Einav agus co-obraichean air ais am prìs tòiseachaidh agus a 'phrìs deireannach a thaobh luach tagraidh gach nì (me, a' phrìs reic àbhaisteach aca). Mar eisimpleir, nam biodh luach-fiosrachaidh $ 100 (stèidhichte air a reic) aig an neach-giùlain aig Burner Taylormade Burner 09, bhiodh prìs tòiseachaidh de $ 10 air a chur an cèill mar 0.1 agus prìs deireannach de $ 120 mar 1.2.

Figear 2.8: Eisimpleir de sheata co-fhreagarrach. Is e seo an aon chluba goilf a tha a 'dol (a tha a' toirt seachad uisge) a reic leis an aon neach (buidseat buidseat), ach chaidh cuid de na fèilltean sin a choileanadh fo dhuilgheadasan eadar-dhealaichte (mar eisimpleir, prìsean tòiseachaidh eadar-dhealaichte). Ath-riochdachadh le cead bho Einav et al. (2015), figear 1b.

Figear 2.8: Eisimpleir de sheata co-fhreagarrach. Is e seo an aon chluba goilf (aon neach-dràibhidh Taylormade Burner 09) a bhith air a reic leis an aon neach ("budgetgolfer"), ach chaidh cuid de na fèilltean sin a choileanadh fo dhiofar shuidheachaidhean (me, diofar phrìsean tòiseachaidh). Ath-riochdachadh le cead bho Einav et al. (2015) , figear 1b.

Cuimhnich gu robh ùidh aig Einav agus co-obraichean ann a bhith a 'toirt buaidh air prìs tòiseachaidh air toraidhean rup. An toiseach, chleachd iad ath-thionndadh loidhneach gus tuairmse a dhèanamh gu bheil prìsean tòiseachaidh nas àirde a 'lùghdachadh coltasachd reic, agus gu bheil prìsean tòiseachaidh nas àirde a' meudachadh a 'phrìs reic mu dheireadh (a rèir a bhith a' reic reic). Leotha fhèin, tha na tuairmsean seo - a tha a 'toirt cunntas air dàimh loidhneil agus air an cuibheasachd thairis air a h-uile bathar - chan e sin a tha inntinneach. An uairsin, chleachd Einav agus co-obraichean meud mòr an dàta gus diofar tuairmsean nas sìmplidh a chruthachadh. Mar eisimpleir, le bhith a 'toirt tuairmse air a' bhuaidh a tha air leth airson caochladh phrìsean tòiseachaidh, lorg iad gu bheil an dàimh eadar prìs a 'phrìs agus a' phrìs reic neo-fhoirmeil (figear 2.9). Gu sònraichte, airson prìsean a thòiseachadh eadar 0.05 agus 0.85, chan eil mòran buaidh aig a 'phrìs tòiseachaidh air a' phrìs reic, lorg a chaidh a chall gu tur leis a 'chiad anailis aca. A bharrachd, seach a bhith a 'toirt seachad cuibheasachd thairis air a h-uile nì, thomhais Einav agus co-obraichean buaidh air prìs tòiseachaidh airson 23 diofar sheòrsachan de nithean (me, stuthan peataichean, stuth dealanach agus cuimhneachain spòrs) (figear 2.10). Tha na tuairmsean sin a 'sealltainn gu bheil buaidh nas lugha aig prìsean tòiseachaidh airson prìsean tòiseachaidh nas motha air mar a tha coltas reic agus buaidh nas motha air a' phrìs deireannach. A bharrachd, airson rudan nas iomlaideachadh-leithid DVDan-chan eil buaidh sam bith aig a 'phrìs tòiseachaidh air a' phrìs mu dheireadh. Ann am faclan eile, tha cuibheasachd a tha a 'tighinn còmhla ri toraidhean bho 23 diofar seòrsa de nithean a' falach eadar-dhealachaidhean cudromach eadar na rudan sin.

Figear 2.9: Dàimh eadar prìs tòiseachaidh rup agus coltachd reic (a) agus prìs reic (b). Tha co-cheangal dlùth eadar pròiseas tòiseachaidh agus coltachd reic, ach dàimh neo-fhoirmeil eadar prìs tòiseachaidh agus prìs reic; airson prìsean a thòiseachadh eadar 0.05 agus 0.85, chan eil mòran buaidh aig a 'phrìs tòiseachaidh air prìs reic. Anns gach suidheachadh, tha na dàimhean neo-eisimeileach gu bunaiteach bho luach na h-artaigil. Atharrachadh bho Einav et al. (2015), figearan 4a agus 4b.

Figear 2.9: Dàimh eadar prìs tòiseachaidh rup agus coltachd reic (a) agus prìs reic (b). Tha co-cheangal dlùth eadar pròiseas tòiseachaidh agus coltachd reic, ach dàimh neo-fhoirmeil eadar prìs tòiseachaidh agus prìs reic; airson prìsean a thòiseachadh eadar 0.05 agus 0.85, chan eil mòran buaidh aig a 'phrìs tòiseachaidh air prìs reic. Anns gach suidheachadh, tha na dàimhean neo-eisimeileach gu bunaiteach bho luach na h-artaigil. Atharrachadh bho Einav et al. (2015) , figearan 4a agus 4b.

Figear 2.10: Measaidhean bho gach roinn de nithean; Is e an dot dotail an tuairmse airson gach roinn a chaidh a chruthachadh còmhla (Einav et al. 2015). Tha na tuairmsean sin a 'sealltainn gu bheil buaidh nas lugha aig a' phrìs tòiseachaidh air rudan nas sònraichte - leithid cuimhneachain - tha an luach tòiseachaidh air coltas reic (x-axis) agus buaidh nas motha air a 'phrìs reic deireannach (y-axis). Atharrachadh bho Einav et al. (2015), figear 8.

Figear 2.10: Measaidhean bho gach roinn de nithean; Is e an dot dotail an tuairmse airson gach roinn a chaidh a chruthachadh còmhla (Einav et al. 2015) . Na tuairmsean seo a 'sealltainn gu bheil nas sònraichte airson nithean mar chuimhneachain--tòiseachaidh prìs a tha nas lugha buaidh air an coltachd a reic ( \(x\) -axis) agus nas motha buaidh air an reic mu dheireadh prìs ( \(y\) -axis). Atharrachadh bho Einav et al. (2015) , figear 8.

Fiù mura h-eil ùidh shònraichte agad ann an rocaidean air eBay, feumaidh tu a bhith mothachail air an dòigh anns a bheil àireamh 2.9 agus figear 2.10 a 'tairgse tuigse nas fheàrr air eBay na tuairmsean sìmplidh a tha a' toirt cunntas air dàimh shìnteil agus a 'cur còmhla diofar sheòrsachan de nithean. A bharrachd, ged a bhiodh e gu saidheansail comasach na tuairmsean nas sìmplidh seo a ghineadh le deuchainnean achaidh, bhiodh an cosgais a 'dèanamh deuchainnean mar sin deatamach.

Coltach ri deuchainnean nàdarra, tha grunn dhòighean ann gum faod maidseadh droch mheasaidhean a dhèanamh. Tha mi a 'smaoineachadh gur e an t-uallach as motha a thaobh tuairmsean co-ionnan gum faod iad a bhith air an cur an cèill le rudan nach deach an cleachdadh anns na co-fhreagairt. Mar eisimpleir, anns na prìomh thoraidhean aca, rinn Einav agus co-obraichean coimeas dìreach air ceithir comharran: àireamh ID an neach-reic, roinn cuspair, tiotal cuspair, agus fo-thiotalan. Nam biodh na nithean eadar-dhealaichte ann an dòighean nach robh air an cleachdadh airson maidseadh, dh'fhaodadh seo coimeas cothromach a chruthachadh. Mar eisimpleir, ma tha "budgetgolfer" prìsean ìosal airson dràibhear Taylormade Burner 09 sa gheamhradh (nuair nach eil clubaichean goilf cho measail), dh'fhaodadh e nochdadh gu bheil prìsean tòiseachaidh nas ìsle a 'leantainn gu prìsean deireannach nas ìsle, nuair a bhiodh seo na phàirt de atharrachadh ràitheil san iarrtas. Tha aon dòigh-obrach airson dèiligeadh ris a 'chùis seo a' feuchainn ri iomadh seòrsa maidsidh. Mar eisimpleir, dh'atharraich Einav agus co-obraichean air an anailis aca fhad 'sa bha an uinneag-ùine a bha air a chleachdadh airson co-fhreagairt (seataichean co-fhreagarrach a' gabhail a-steach nithean air an reic taobh a-staigh aon bhliadhna, taobh a-staigh aon mhìos, agus gu co-ionnan). Gu fortanach, lorg iad toraidhean co-ionann airson uinneagan fad na h-ùine. Tha dragh eile le co-fhreagairt a 'tighinn bho mhìneachadh. Tha tuairmsean bho mhaidseadh a-mhàin a 'buntainn ri dàta co-fhreagarrach; chan eil iad a 'buntainn ris na cùisean nach gabhadh a bhith air am maidseadh. Mar eisimpleir, le bhith a 'cuingealachadh an rannsachaidh gu nithean aig an robh iomadh liosta, tha Einav agus co-obraichean a' cur fòcas air luchd-reic proifeiseanta agus leth-proifeasanta. Mar sin, nuair a tha sinn a 'mìneachadh nan coimeasan sin feumaidh sinn cuimhneachadh nach eil iad a' buntainn ris an fho-sheòrsa seo de eBay.

Tha co-rèiteachadh na ro-innleachd chumhachdach airson coimeasan cothromach fhaighinn ann an dàta neo-dheuchainneach. Do mhòran de luchd-saidheans sòisealta, bidh co-fhreagairt a 'faireachdainn an dàrna rud as fheàrr air deuchainnean, ach tha sin na chreideas gum faod ath-sgrùdadh a dhèanamh, beagan. Dh'fhaodadh co-fhreagairt ann an dàta mòr a bhith nas fheàrr na àireamh bheag de dheuchainnean-raoin nuair a tha (1) iomadachd buaidhean cudromach agus (2) tha na caochlaidhean cudromach a dhìth airson co-ionnanachd air an tomhas. Tha Clàr 2.4 a 'toirt seachad eisimpleirean eile de mar as urrainnear maids a chleachdadh le stòran dàta mòra.

Clàr 2.4: Eisimpleirean de Sgrùdaidhean a chleachdas a 'co-fhreagairt le stòran dàta mòra
Fòcas cuimseach Tobar dàta mòr Iomradh
Buaidh nan oighreachdan-seilg air fòirneart nam poileas Clàran stad-agus-frisk Legewie (2016)
Buaidh 11 Sultain, 2001 air teaghlaichean agus nàbaidhean Clàran bhòtaidh agus clàran tabhartais Hersh (2013)
Tubaist shòisealta Dàta conaltraidh agus uchd-mhacachd toraidh Aral, Muchnik, and Sundararajan (2009)

Ann an co-dhùnadh, tha e duilich a bhith a 'toirt tuairmse air buaidh adhbharan bho dàta neo-dhearbhaidh, ach faodar dòighean-obrach leithid deuchainnean nàdarra agus atharrachaidhean staitistigeil (me, maidseadh) a chleachdadh. Ann an cuid de shuidheachaidhean, faodaidh na dòighean-obrach sin a dhol gu math ceàrr, ach nuair a thèid an cleachdadh gu faiceallach, faodaidh na dòighean-obrach seo a bhith feumail a rèir an dòigh-obrach dheuchainneach a tha mi a 'toirt cunntas ann an caibideil 4. A bharrachd, tha an dà dhòigh-obrach seo gu h-àraidh buailteach buannachd fhaighinn bho fhàs an- air, siostaman dàta mòr.