2.4.3.2 lotu

Lotu azoka erkaketak kanpoan inausketa kasu arabera.

Azoka konparaketak bai ausazko kontrolatutako esperimentuak edo esperimentu natural datoz. Baina, egoera askotan, non ezin duzu exekutatu esperimentu ideal eta natura ez du esperimentu natural bat baldin badira. Ezarpen hauek, modurik onena arrazoizko konparazio bat betetzen da sortu. matching, ikertzaileak ez-esperimentala datuak bidez itxura antzekoak dira bat izan ezik tratamendua jaso ditu jendeak bikote sortzeko eta ez du inork. Bat datorren prozesua, ikertzaileak dira benetan ere inausketa; hau da, kasu honetan ez dago bistako alderatuz baztertuz. Horrela, metodo hau izango da zehatzago izeneko litzateke matching-eta-inausketa, baina epe tradizionala itsasten dut: datorren.

Betetzen ez-esperimentala masiboa datu-iturri batekin estrategiak boterea adibide eder bat kontsumitzaileen portaera Liran Einav eta lankideek buruzko ikerketa datoz (2015) . Einav eta lankide izan ziren enkanteak egiten ari eBay interesa, eta bere lana deskribatzeko, alderdi jakin bat dut arreta: enkantean prezioa hasita eragina enkante emaitzak, hala nola, salmenta-prezioa edo salmenta probabilitatea gisa.

Gehien inozoa hasierako prezioa salmenta prezioaren gaineko eragina buruzko galderari erantzuteko modu hasierako prezio ezberdinekin enkanteak azken prezioa besterik kalkulatu izango litzateke. Planteamendu hori ondo izango litzateke, besterik gabe, zuk salmenta elementu jakin baterako izan dira eBay jarri emandako hasierako prezioa prezioa iragartzeko nahi izanez gero. Baina, zure galdera da bada zer prezio planteamendu hau hasita merkatuan emaitza ez da ibiliko da, ez da oinarritzen delako arrazoizko konparazioak duen eragina da; txikiagoa hasierako prezioak enkanteak nahiko altuagoa hasierako prezioetan (adibidez, ondasun mota ezberdinen agian dute edo izan saltzaileen mota ezberdinen artean, besteak beste) dituzten enkanteak desberdinak izan ditzake.

dira dagoeneko azoka konparazioak egiteko kezkatuta bazaude, agian inozoa hurbilketa burutzen ez eta kontuan hartu eremu esperimentu bat non zenuke saltzen zehatz item-esan, golf club-rekin bat enkantean multzo finko bat exekutatzen parametro-esan, doanekoa, enkantean bi aste, zabalik etab-baina ausaz dituzten prezioak hasita ezarri. ondoriozko merkatu emaitza alderatuz, eremu esperimentu honetan salmenta prezioa prezioa hasita eragina neurtzeko oso argi eskaintzea litzateke. Baina, neurketa hau litzateke bakarrik, produktu jakin bat aplikatzeko eta enkante parametroak ezarri. Emaitzek ezberdinak izan ditzake, adibidez, produktu-mota desberdinak egiteko. teoria indartsu gabe, zaila da esperimentu bakar hau posible esperimentu sorta osoa izan zitekeen exekutatu from estrapolatu. Aurrerago, eremu esperimentuak nahikoa garestia dela eginezintasun horietako nahikoa exekutatu sortu osoan parametroa produktu eta enkante mota espazioa estaltzeko litzateke dira.

inozoa hurbilketa eta hurbilketa esperimental kontrastea, Einav eta lankideek hartu hirugarren hurbilketa bat: datorren. bere estrategia trikimailu nagusia da gauzak eremu esperimentuak dagoeneko eBay gertatu dira antzekoak ezagutzeko. Adibidez, 2.6 irudiko 31 berdinak golf club-a Taylormade erregailu 09 Driver-ari berdinak seller- "budgetgolfer" saldu zerrendak batzuk erakusten ditu. Hala ere, zerrendak horiek ezaugarri desberdinak dituzte. Horietako Hamaika $ 124,99 prezioa finko bat gidariaren eskaintzeko, beste 20 amaiera datak ezberdinekin enkanteak bitartean. Era berean, zerrendak bidalketa tasak ezberdinak dituzte, bai $ 7.99 edo $ 9.99. Bestela esanda, "budgetgolfer" ikertzaileek esperimentuak exekutatzen balitz bezala da.

Taylormade erregailu 09 Driver zerrendak ari arabera "budgetgolfer" saldu zerrendak, non zehatza elementua bera da zehatza seller bera saltzen ari multzo bat datorren bat baina ezaugarri desberdinak aldi bakoitzean adibide bat dira. eBay erregistroak masiboa barruan daude literalki bat-multzo zerrendak milioika inplikatuz ehunka mila. Horrela, baizik eta azken prezioa alderatuz emandako hasierako prezioa barruan enkanteak guztiak baino, Einav eta lankideek egin datorren multzoen barruan konparazioak. Ordena emaitzak konbinatzeko datorren multzo ehunka mila hauen barruan konparazioak tik, Einav eta lankideek re-adierazteko hasierako prezioa eta azken prezioa erreferentzia elementu bakoitzean (adibidez, bere batez besteko salmenta-prezioa) balioa dagokionez. Adibidez, Taylormade erregailu 09 Driver erreferentzia $ 100 balio bat badu (oinarritutako bere salmentak), eta ondoren 10 $ prezioa hasierako bat egon 0.1 honela adieraziko litzateke eta azken $ 120 prezioa 1,2 gisa adierazi beharko litzateke.

2.6 irudia: datorren multzo baten adibidea. Hau zehatza bera golf club (a Taylormade erregailu 09 Driver) ari zehatza pertsona bera (budgetgolfer) saltzen da, baina salmentak horietako batzuk baldintza ezberdinak (adibidez, ezberdinak hasierako prezioa) egin ziren. Kopuru Einav et al tomado. (2015).

2.6 irudia: datorren multzo baten adibidea. Hau zehatza bera golf club (a Taylormade erregailu 09 Driver) ari zehatza pertsona bera ( "budgetgolfer") saltzen da, baina salmentak horietako batzuk baldintza ezberdinak (adibidez, ezberdinak hasierako prezioa) egin ziren. Kopuru hartutako Einav et al. (2015) .

Gogoratzen Einav eta lankide izan ziren hasieratik prezioen eragina enkante-helburuen interesa. Lehenengoa, erregresio lineala erabiliz goi mailako hasierako prezioak murriztu salgai baten probabilitatea, eta goi-mailako hasierako prezioetan duten azken salmenta prezioa, salmenta bat gertatzen baldintzatzen handitzeko estimatzen dute. Beren kabuz, kalkuluen-dira batez beste produktu guztiak eta beren gain hartzen hasierako prezioa eta final arteko erlazio lineala ez emaitza-zarela interesgarri guztiak. Baina, Einav eta lankideak ere erabili haien datuen tamaina masiboa sotila aurkikuntzak hainbat balioesteko. Lehenengoa, Einav eta lankideek egindako kalkuluen arabera, horiek bereizita prezio desberdinetako elementuak eta erregresio lineala erabili gabe. Irteeran prezioa eta probabilitatea saltzea baten arteko erlazioa lineala da, berriz, hasierako prezioa eta salmenta prezioaren arteko harremana argi dago ez-lineala (2.7 irudia) aurkitu dute. Hain zuzen ere, 0,05 eta 0,85 arteko prezioak hasita, hasierako prezioa salmenta-prezioa, aurkikuntza bat dela amaitu zen izan duten harreman lineal bat bere gain hartu analisiaren galduak oso eragin txikia du.

2.7 Harreman enkante Irteeran prezioa eta probabilitatea sale a (ezkerretik panel) eta salmenta-prezioa (eskuineko panel) artean. Ez dago gutxi gorabehera Irteeran prezioa eta salmenta probabilitatea arteko erlazio lineala, baina ez hasieran prezioa eta salmenta prezioaren arteko erlazio ez-lineal bat da; 0,05 eta 0,85 arteko prezioak hasita, hasierako prezioa salmenta-prezioa oso eragin txikia du. Bi kasuetan, harreman funtsean elementua balio independienteak dira. Grafika hauek ugaltzen Fig 4a eta 4b Einav et al. (2015).

2.7 Harreman enkante Irteeran prezioa eta probabilitatea sale a (ezkerretik panel) eta salmenta-prezioa (eskuineko panel) artean. Ez dago gutxi gorabehera Irteeran prezioa eta salmenta probabilitatea arteko erlazio lineala, baina ez hasieran prezioa eta salmenta prezioaren arteko erlazio ez-lineal bat da; 0,05 eta 0,85 arteko prezioak hasita, hasierako prezioa salmenta-prezioa oso eragin txikia du. Bi kasuetan, harreman funtsean elementua balio independienteak dira. Grafika hauek ugaltzen Fig 4a eta 4b Einav et al. (2015) .

Bigarren, baizik eta elementu guztiak baino batez baino, Einav eta lankideek ere erabiltzen bere datuen masiboki prezio hasita inpaktua 23 elementuak (adibidez, maskota hornidura, elektronika, eta kirol oroigarriak) (2.8 irudia) kategoria desberdinetan dagoen balioesteko. Estimazio horiek erakusteko gehiago bereizgarria elementu-esaterako oroigarriak-hasieratik prezioa txikiagoa saltzea baten probabilitatea eta azken salmenta prezioa eragin handiago bat eragin du. Are gehiago, gehiago commodified elementu-hala nola, DVDak eta bideo-hasierako prezioa ia azken prezioan eragina ez du. Beste era batera esanda, hori 23 elementuen kategoriak desberdinetako emaitzak uztartzen batez beste elementu hauen arteko ezberdintasunak buruzko informazio garrantzitsua ezkutatzen.

2.8 irudia: Emaitzen kategoria bakoitzean banaka kalkuluak; Kategoria guztien kalkuluan dot solidoa elkarrekin horri, 11. taula (Einav et al. 2015, 11 taula). Estimazio horiek erakusteko oroigarriak-etorri gehiago bereizgarria elementu-esaterako Irteeran prezioa txikiagoa sale a (x ardatza) eta azken salmenta prezioa (y ardatzean) eragin handiago baten probabilitatea eragin ditu.

2.8 irudia: Emaitzen kategoria bakoitzean banaka kalkuluak; dot solidoa pooled elkarrekin kategoria guztietan kalkuluan (Einav et al. 2015, Table 11) . Estimazio horiek erakusteko oroigarriak-etorri gehiago bereizgarria elementu-esaterako Irteeran prezioa txikiagoa sale a (x ardatza) eta azken salmenta prezioa (y ardatzean) eragin handiago baten probabilitatea eragin ditu.

Gai ez bada ere, bereziki eBay enkanteak interesa, modu 2.7 irudia dela eta Irudikatu 2.8 eskaintza eBay ulertzeko aberatsagoa erregresio lineal kalkuluen simple harreman lineala du bere gain hartzen eta elementuen kategoriak askotara konbinatu baino miretsi behar duzu. sotilagoak kalkuluen aipatutako datuak masiboa betetzen boterea; aurreikuspen horiek izan ezinezkoa eremu esperimentuak kopuru izugarria, zein garestia izango zatekeen gabe.

Jakina, bereziki datorren ikerketaren emaitzak konfiantza gutxiago konparagarria esperimentu baten emaitzak ere genuke baino izan behar dugu. Noiz datorren azterketa emaitzak baloratzeko, bi kezka garrantzitsu daude. Lehenik eta behin, gogoratu behar dugu hori dela-etortzean erabiliko ziren gauzak azoka konparaketak bakarrik bermatu ahal izango dugu. seller NAN zenbakia, elementua kategorian, elementua izenburua, eta azpititulua: bere emaitzak nagusian, Einav eta lankide zuen zehatza lau ezaugarri betetzen. Elementu modurik ez ziren etortzean erabiliko, hori bidegabeko alderatuz ditzaketen desberdinak balira. Adibidez, "budgetgolfer" apaldu Taylormade erregailu 09 Driver prezioak neguan (denean golf klub dira hain ezaguna), ondoren txikiagoa hasierako prezioak eramango final prezioak jaistea agertzen zitekeen, hain zuzen ere, garai horretako erreferentzia bat izango litzateke eskaria aldakuntza. Oro har, arazo hau hurbilketa onena izango etortze mota desberdin asko saiatzen dela dirudi. Adibidez, Einav eta lankideek euren analisi non datorren multzoen artean, salmenta urtebeteko epean, elementuak, hilabeteko epean, eta contemporaneously errepikatu. leihoa estuagoa egitea datorren multzoen kopurua gutxitzen, baina sasoiko aldakuntza kezka murrizten. Zorionez, emaitzak datorren irizpide aldaketak horiek ez dira aldatu aurkitu zuten. Matching literaturan, kezka mota hau normalean behagarriak eta unobservables terminoetan adierazten da, baina funtsezko ideia da ikertzaile benetan hori bakarrik bat datorren erabilitako eginbideak azoka konparazioak sortuz.

Bigarren kezka nagusietako bat etortzeko emaitzak interpretatzeko dutela datorren datuen aplikatu bakarrik; ez dute kasu hauetan ezin dela datorren aplikatuko. Esate baterako, euren ikerketa mugatuz elementuak, hainbat fitxa Einav eta lankide diren saltzaileen profesionala eta erdi-profesionala bideratua izan den moduan. Horrela, konparazioak horiek interpretatzeko gogoratu behar dugu dutela eBay azpimultzo hau aplikatuko zaie soilik.

Lotu azoka konparaketak aurkitzeko datu-multzo handiak egiteko estrategia indartsu bat da. gizarte-zientzialari askok, bat datorren bigarren onena esperimentu bezala sentitzen da, baina hori uste bat gogoratuko dira, apur bat da. Datu masiboa ere lotu eremu esperimentuak kopuru txiki bat baino hobea izan liteke denean: 1) ondorioak heterogeneotasun garrantzitsua da eta 2) daude etortzeetan behagarriak ona. 2.4 taula bestelako nola betetzen datu-iturri handiak erabili ahal izango dira adibide batzuk eskaintzen ditu.

2.4 taula: parekatzea erabiliko duten azoka konparaketak aurkitzeko aztarnak digital barruan ikasketak adibideak.
Substantiboa foku Big Datu iturria Citation
polizia indarkeria on shootings Efecto Stop-eta-frisk erregistro Legewie (2016)
September 11, 2001 efektua familiak eta bizilagunak boto-erregistro eta dohaintza erregistro Hersh (2013)
Gizarte kutsatze Komunikazioa eta produktu adopzioa datuak Aral, Muchnik, and Sundararajan (2009)

Ospakizuna, kausazko ondorioak estimatzea ez-esperimentala datuak tik planteamendu inozoa arriskutsuak dira. Hala ere, kausazko kalkuluen indartsuena batetik ahulena den continuum bat batera etzanda egiteko estrategiak, eta ikertzaile ez-esperimentala datuak barruan azoka konparaketak ezagutzeko dezakezu. esperimentu natural eta lotzeko: beti-on, informazio sistemen handien hazkundea gure gaitasuna existitzen diren bi metodo eraginkortasunez erabili handitzen.