2.4.3 Аппроксимационные эксперыменты

Гэты пераклад быў створаны з дапамогай кампутара. ×

2.4.3 Аппроксимационные эксперыменты

Мы можам аппроксимировать эксперыменты , якія мы маем ці не можам зрабіць. Два падыходы , якія асабліва здабываюць выгаду з вялікіх крыніц дадзеных натурных эксперыментаў і ўзгадненне.

Некаторыя важныя навуковыя і палітычныя пытанні прычынныя. Напрыклад, тое, што эфект ад праграмы падрыхтоўкі рабочых па заработнай плаце? Даследчык спрабуе адказаць на гэтае пытанне, можна параўнаць даходы людзей, якія падпісаліся на навучанне тых, хто не зрабіў. Але колькі-небудзь розніца ў заработнай плаце паміж гэтымі групамі з-за падрыхтоўкі і колькі з раней існавалі адрозненняў паміж людзьмі, якія зарэгіструюцца і тыя, якія не робяць? Гэта складанае пытанне, і гэта той, які аўтаматычна не знікне з вялікай колькасцю дадзеных. Іншымі словамі, турботу з нагоды магчымых раней існавалі рознагалоссяў не ўзнікае незалежна ад таго, колькі рабочых у вашых дадзеных.

У многіх выпадках, самы моцны спосаб ацаніць прычынна-выніковую сувязь якога-небудзь лячэння, такія як падрыхтоўка рабочых месцаў, каб запусціць рандомізірованное кантраляванае эксперымент, у якім даследчык выпадкова забяспечвае лячэнне для некаторых людзей, а не іншыя. Я буду прысвячаць увесь кіраўніка 4 эксперыментаў, так што тут я збіраюся засяродзіцца на двух стратэгій, якія могуць быць выкарыстаны з не эксперыментальнымі дадзенымі. Першая стратэгія залежыць ад таго, шукаеце нешта, што адбываецца ў свеце, што выпадкова (ці амаль выпадковым чынам) прызначае лячэнне для некаторых людзей, а не іншыя. Другая стратэгія залежыць ад статыстычна рэгулявальныя без эксперыментальных дадзеных у спробе растлумачыць існавалі раней адрозненні паміж тымі, хто рабіў і не атрымліваў лячэнне.

Скептык мог бы сцвярджаць, што абедзве гэтыя стратэгіі варта пазбягаць, паколькі яны патрабуюць моцных дапушчэнняў, здагадак, якія цяжка ацаніць, і што на практыцы часта парушаюцца. У той час як я стаўлюся да гэтай прэтэнзіі, я думаю, што гэта ідзе занадта далёка. Гэта, вядома, дакладна, што цяжка надзейна зрабіць ацэнкі прычынных ад ня Эксперыментальная інфармацыя, але я не думаю, што азначае, што мы ніколі не павінны спрабаваць. У прыватнасці, не эксперыментальныя падыходы могуць быць карысныя, калі лагістычная абмежаванне перашкаджае вам правядзенне эксперыменту або этычныя абмежаванні азначаюць, што вы не хочаце, каб правесці эксперымент. Акрамя таго, не эксперыментальныя падыходы могуць быць карысныя, калі вы хочаце, каб скарыстацца дадзенымі, якія ўжо існуюць для таго, каб распрацаваць рандомізірованное кантраляванае эксперымент.

Перш чым працягнуць, варта таксама адзначыць, што стварэнне прычынных адзнак з'яўляецца адным з самых складаных тым у сацыяльных даследаваннях, і адзін, што можа прывесці да інтэнсіўнай і эмацыйнай дыскусіі. У далейшым, я забяспечу аптымістычнае апісанне кожнага падыходу, каб пабудаваць інтуіцыю пра гэта, то я апішу некаторыя з праблем, якія ўзнікаюць пры выкарыстанні гэтага падыходу. Больш падрабязная інфармацыя аб кожным падыходзе маецца ў матэрыялах ў канцы гэтай часткі. Калі вы плануеце выкарыстоўваць любога з гэтых падыходаў у сваім уласным даследаванні, я настойліва рэкамендую прачытаць адну з многіх выдатных кніг пра прычынны высноў (Imbens and Rubin 2015; Pearl 2009; Morgan and Winship 2014) .

Адзін з падыходаў да стварэння ацэнкі прычыннай з неэкспериментальных дадзеных шукаць падзея, якое рандомізірованного на лячэнні некаторых людзей, а не для іншых. Такія сітуацыі называюцца натурныя эксперыменты. Адным з найбольш яркіх прыкладаў натуральнага эксперыменту адбываецца ад даследаванні Джошуа Angrist (1990) , які вымярае ўплыў ваеннай службы на прыбытку. Падчас вайны ў В'етнаме, Злучаныя Штаты павялічылі памер сваіх узброеных сіл праз праект. Для таго, каб вырашыць, якія грамадзяне назвалі б у службу, урад ЗША правялі латарэю. Кожная дата нараджэння была напісана на аркушы паперы, і, як паказана на малюнку 2.7, гэтыя кавалачкі паперы былі адабраны па адным для таго, каб вызначыць парадак, у якім маладыя людзі будуць прызваны служыць (маладыя жанчыны, якія не падлягалі да праекту). На падставе вынікаў, людзі, народжаныя 14 верасьня былі названыя першым, людзі, народжаныя 24 красавіка былі названыя другім, і гэтак далей. У рэшце рэшт, у гэтай латарэі, людзі, народжаныя на 195 розныя дні былі распрацаваны, у той час як людзі, народжаныя на 171 дзён не было.

Малюнак 2.7: Кангрэсмэн Александер Пирни (R-Нью-Ёрк) , малюнак першай капсулы для праекта Selective Service на 1 снежня 1969 года Джошуа Angrist (1990) аб'яднаў праект латарэі з дадзенымі аб даходах ад Адміністрацыі сацыяльнага забеспячэння , каб ацаніць уплыў ваеннай службы на заробкі. Гэта прыклад даследаванні з выкарыстаннем натуральнага эксперыменту. Крыніца: Сістэма ЗША павіннасці (1969) / Wikimedia Commons .

Хоць гэта можа быць не адразу, праект латарэі мае крытычнае падабенства з рандомізірованного кантраляванага эксперыменту: у абодвух выпадках ўдзельнікі рандомізірованный на атрыманне лячэння. Для вывучэння ўплыву гэтага рандомізірованного лячэння, Angrist скарыстаўся заўсёды на вялікай інфармацыйнай сістэмы: ЗША Упраўленне сацыяльнага забеспячэння, якая збірае інфармацыю аб практычна даходах кожнага амерыканца ад занятасці. Аб'яднаўшы інфармацыю пра тое, хто быў абраны выпадковым чынам у праекце латарэі з дадзенымі даходаў, якія былі сабраныя ў урадавых адміністрацыйных запісах, Angrist прыйшоў да высновы, што прыбыткі ветэранаў былі прыкладна на 15% менш, чым заробкі супастаўных ня-ветэранаў.

Як паказвае гэты прыклад, часам сацыяльныя, палітычныя ці прыродныя сілы прызначыць працэдуры такім чынам, што могуць быць выкарыстаны даследчыкамі, а часам і наступствы такога лячэння фіксуюцца ў заўсёды на вялікіх крыніц дадзеных. Гэтая стратэгія даследаванні могуць быць абагульнены наступным чынам : $\text{random (or as if random) variation} + \text{always-on data} = \text{natural experiment}$ чынам $\text{random (or as if random) variation} + \text{always-on data} = \text{natural experiment}$ , $\text{random (or as if random) variation} + \text{always-on data} = \text{natural experiment}$

Каб праілюстраваць гэтую стратэгію ў эпоху лічбавых тэхналогій , давайце разгледзім даследаванне па Alexandre Мас і Энрыка Марэці (2009) , якія спрабавалі ацаніць уплыў працы з прадукцыйнымі калегамі па прадукцыйнасці работніка. Перад тым як пабачыць вынікі, то варта адзначыць, што існуюць супярэчлівыя чакання, што вы маглі б мець. З аднаго боку, можна было б чакаць, што праца з прадукцыйнымі калегамі прывяло б работнік, каб павялічыць яе прадукцыйнасць з-за ціску з боку аднагодкаў. Або, з другога боку, можна было б чакаць, што наяўнасць працавітых калегаў можа прывесці работнік цкаваць, таму што праца будзе зроблена сваімі калегамі ў любым выпадку. Найзыркі спосаб вывучэння аднарангавыя ўплыву на прадукцыйнасці будзе ўяўляць сабой рандомізірованное эксперымент, у якім работнікі рандомізірованный да зрухаў з работнікамі розных узроўняў прадукцыйнасці, а затым у выніку прадукцыйнасць вымяраецца для кожнага. Даследчыкі, аднак, не кантралююць графік рабочых у любым рэальным бізнэсе, і таму Мас і Марэці даводзілася спадзявацца на натуральны эксперымент з удзелам касіры ў супермаркеце.

У дадзеным супермаркеце, з-за спосабу, што планаванне было зроблена, і такім чынам, што ссоўвае перакрывалі, кожны касірам былі розныя таварышаў па службе ў розны час сутак. Акрамя таго, у дадзеным супермаркеце, прызначэнне касіраў не было звязана з прадукцыйнасцю сваіх аднагодкаў ці як заняты магазін быў. Іншымі словамі, нават пры тым, што планаванне касіраў не было вызначана з дапамогай латарэі, гэта было, як калі б рабочыя часам выпадковым чынам размеркаваны на працу з высокай (або нізкай) аналагам прадукцыйнасці. На шчасце, гэты супермаркет таксама быў сістэма праверкі лічбавага ўзросту, якія адсочваюцца элементы, кожны касір сканавальных ва ўсе часы. З гэтых дадзеных часопіса касы, Мас і Марэці ўдалося стварыць дакладную, індывідуальны, і заўсёды па меры прадукцыйнасці: колькасць сканаваных у секунду. Спалучэнне гэтых двух рэчаў, у прыродзе змена прадукцыйнасці аднагодкаў і заўсёды па меры прадукцыйнасці Мас і Марэці падлічана, што калі касір прысвоеныя супрацоўнікі, якія былі 10% больш прадукцыйным, чым у сярэднім, яе прадукцыйнасць павялічыцца на 1,5% , Акрамя таго, яны выкарыстоўвалі памер і багацце іх дадзеных для вывучэння два важных пытання: гетэрагеннасць гэтага эфекту (Для якіх відаў працоўных эфект больш?) І механізмы , які ляжыць эфекту (Чаму маючы высокую прадукцыйнасць аднагодкі вядуць да больш высокая прадукцыйнасць?). Мы вернемся да гэтых двух важных пытаннях-гетэрагеннасць эфектаў лячэння і механізмы-ў частцы 4, калі мы абмяркоўваем эксперыменты больш падрабязна.

Абагульняючы з гэтых двух даследаванняў, табліца 2.3 прыведзены іншыя даследаванні, якія маюць тую ж самую структуру: з выкарыстаннем заўсёды на дадзеных крыніцы, каб вымераць эфект некаторай выпадковай варыяцыі. На практыцы, даследчыкі выкарыстоўваюць дзве розныя стратэгіі для пошуку прыродных эксперыментаў, абодва з якіх могуць быць плённымі. Некаторыя даследчыкі пачынаюць з заўсёды-на дадзеных крыніцы і шукаць выпадковыя падзеі ў свеце; іншыя пачынаюць выпадковае падзея ў свеце і шукаць крыніцы дадзеных, якія адлюстроўваюць яго ўздзеянне.

Табліца 2.3: Прыклады натуральных эксперыментаў з выкарыстаннем крыніц вялікіх дадзеных
асноўная ўвага	Крыніца натуральнага эксперыменту	Заўсёды-на дадзеных крыніцы	спасылка
Peer ўплыў на прадукцыйнасць	працэс планавання	Checkout дадзеныя	Mas and Moretti (2009)
фарміраванне дружбы	ураганы	facebook	Phan and Airoldi (2015)
распаўсюджванне эмоцый	дождж	facebook	Lorenzo Coviello et al. (2014)
Роўны-роўнаму эканамічныя пераклады	землятрус	грошы дадзеныя для мабільных	Blumenstock, Fafchamps, and Eagle (2011)
Асабістае спажывецкае паводзіны	2013 закрыцця ўрада ЗША	Асабістыя дадзеныя фінансы	Baker and Yannelis (2015)
Эканамічнае ўздзеянне рэкамендацыйных сістэм	розны	Прагляд дадзеных на Amazon	Sharma, Hofman, and Watts (2015)
Уплыў стрэсу на ненароджаных дзяцей	2006 Ізраіль-Хезболлах вайна	запісы аб нараджэнні	Torche and Shwed (2015)
Чытанне паводзінаў у Вікіпедыі	Snowden адкрыццяў	часопісы Вікіпедыя	Penney (2016)
Peer ўздзеянне на ажыццяўленне	надвор'е	Фітнес-трэкеры	Aral and Nicolaides (2017)

У ходзе абмеркавання да гэтага часу пра натурных эксперыментаў, я пакінуў з адзін важны момант: паходзіць ад таго, што прырода прадугледзела, што вы хочаце, можа часам быць даволі складана. Вернемся да праекту, напрыклад у В'етнаме. У гэтым выпадку, Angrist быў зацікаўлены ў ацэнцы ўплыву ваеннай службы на прыбытак. На жаль, ваенная служба не была выпадковым чынам размеркаваны; а ён распрацоўваецца, які выпадковым чынам. Аднак, не ўсе, хто быў прызваны служыў (там было мноства выключэнняў), і не ўсе, хто служыў было заклікана (людзі маглі добраахвотна служыць). Паколькі на стадыі распрацоўкі быў рандомізірованный, даследчык можа ацаніць уплыў распрацоўваецца для ўсіх людзей у праекце. Але Angrist не хацеў ведаць эфект прызыву; ён хацеў бы ведаць, уплыў службы ў войску. Для таго, каб зрабіць гэтую ацэнку, аднак дадатковыя дапушчэння і ўскладненні неабходныя. Ва- першых, даследчыкі павінны выказаць здагадку , што адзіны спосаб , які распрацоўваецца ўздзейнічалі прыбытак праз ваенную службу, здагадка называецца абмежаваннем выключэнні. Гэтая здагадка можа быць няправільным, калі, напрыклад, людзі, якія складаліся заставаліся ў школе даўжэй, каб пазбегнуць службы або калі працадаўцы былі менш схільныя наймаць людзей, якія былі распрацаваны. Увогуле, абмежаванне выключэння з'яўляецца крытычным здагадкай, і гэта, як правіла, цяжка праверыць. Нават калі абмежаванне выключэння правільна, гэта ўсё яшчэ немагчыма ацаніць уплыў сэрвісу на ўсіх мужчын. Замест гэтага, аказваецца, што даследчыкі могуць толькі ацаніць уплыў на пэўны падмноства людзей , званых законапаслухмяных (людзі , якія будуць служыць , калі складзены, але не будзе служыць , калі ён не падрыхтавана) (Angrist, Imbens, and Rubin 1996) , (Angrist, Imbens, and Rubin 1996) . Законапаслухмяны, аднак, не карэннае насельніцтва цікавасці. Звярніце ўвагу на тое, што гэтыя праблемы ўзнікаюць нават у адносна чыстага выпадку праекта латарэі. Яшчэ мноства ускладненняў ўзнікае, калі лячэнне не прызначаецца фізічнай латарэяй. Напрыклад, у даследаванні Mas і Марэці касіраў, узнікаюць дадатковыя пытанні аб здагадцы, што размеркаванне аднагодкаў па сутнасці выпадковым чынам. Калі гэта здагадка было моцна парушана, гэта можа ссоўваць свае ацэнкі. У зняволенні, натурныя эксперыменты могуць быць магутнай стратэгіяй для атрымання ацэнкі прычыннай ад ня Эксперыментальная інфармацыя, а таксама вялікія крыніцы дадзеных павялічваюць нашу здольнасць капіталізаваць на натурных эксперыментах, калі яны адбываюцца. Тым не менш, гэта, верагодна, запатрабуе вялікай асцярожнасці, а часам моцныя здагадкі, каб перайсці ад таго, што прырода прадугледзела да ацэнкі, якую вы хочаце.

Другая стратэгія, якую я хацеў бы распавесці вам пра для стварэння прычынных адзнак ад неэкспериментальных дадзеных залежыць ад статыстычна рэгулявальных без эксперыментальных дадзеных у спробе растлумачыць існаваўшыя раней адрозненне паміж тымі, хто рабіў і не атрымлівала лячэнне. Ёсць шмат такіх падыходаў перабудовы, але я спынюся на адным называецца супастаўленнем. У адпаведнасці, даследчык праглядае неэкспериментальные дадзеныя для стварэння пары людзей, якія падобныя за выключэннем таго, што адзін атрымалі лячэнне і адзін не мае. У працэсе ўзгаднення, даследчыкі на самай справе таксама абрэзка; гэта значыць, адкідаючы выпадкі, калі няма ніякага відавочнага матчу. Такім чынам, гэты метад будзе больш дакладна называецца супастаўленнем-і-адсячэнне, але я буду прытрымлівацца традыцыйнага тэрміна: ўзгадненне.

Адным з прыкладаў сілы ўзгаднення стратэгій з масіўнымі неэкспериментальными крыніцамі дадзеных адбываюцца з даследавання спажывецкага паводзінаў па Liran Эйнав і яго калегамі (2015) . Яны былі зацікаўлены ў аўкцыёнах, якія праходзяць на eBay, і ў апісанні сваёй працы, я засяроджуся на эфекце аўкцыёну стартавы кошт на вынікі, такія як кошт продажу або верагоднасць продажу аўкцыёну.

Самы наіўны спосаб ацаніць уплыў пачатковай цаны на прадажнай кошце будзе проста вылічыць канчатковую цану для аўкцыёнаў з рознымі коштамі стартавых. Такі падыход быў бы добра, калі вы хочаце, каб прадказаць кошт продажу дадзены стартавы кошт. Але калі ваша пытанне тычыцца ўплыву пачатковай цаны, то гэты падыход не будзе працаваць, таму што яна не заснавана на справядлівых параўнаннях; аўкцыёны з больш нізкімі цэнамі, якія пачынаюцца могуць істотна адрознівацца ад тых, з больш высокімі коштамі, якія пачынаюцца (напрыклад, яны могуць быць для розных відаў тавараў або ўключаць у сябе розныя тыпы прадаўцоў).

Калі вы ўжо дасведчаныя аб праблемах, якія могуць паўстаць пры выкананні прычынных адзнак ад ня Эксперыментальная інфармацыя, вы можаце прапусціць наіўны падыход і разгледзець магчымасць запуску палявога эксперыменту, у якім вы б прадаць пэўны прадмет, скажам, гольфы-клуб-з фіксаваным набор параметраў аўкцыёну, скажам, бясплатная дастаўка і аўкцыён, адкрыты на працягу двух тыдняў, але з рандомізірованный стартавых цэн. Параўноўваючы атрыманыя вынікі на рынку, гэта палявой эксперымент будзе прапаноўваць вельмі дакладнае вымярэнне ўплыву пачатковай цаны на прадажнай цане. Але гэта вымярэнне будзе прымяняцца толькі да аднаго канкрэтнаму прадукту і набор параметраў аўкцыёну. Вынікі могуць быць рознымі, напрыклад, для розных відаў прадукцыі. Без моцнай тэорыі, цяжка экстрапаляваць з гэтага аднаго эксперыменту да поўнага спектру магчымых эксперыментаў, якія можна было б запусціць. Акрамя таго, палявыя эксперыменты досыць дорага, што было б няажыццяўляльна, каб запусціць ўсе змены, якія вы, магчыма, захочаце паспрабаваць.

У адрозненне ад наіўных і эксперыментальных падыходаў, Эйнав і яго калегі ўзялі трэці падыход: супастаўленне. Асноўная хітрасць ў іх стратэгіі заключаецца ў тым, каб выявіць рэчы, падобныя на палявыя эксперыменты, якія ўжо адбыліся на eBay. Напрыклад, лічба 2,8 паказвае некаторыя з 31 спісаў для дакладна такога ж гольф-клуба-а Taylormade гарэлка 09 Драйвер прадаецца сапраўды гэтак жа «budgetgolfer продавца-». Тым не менш, гэтыя 31 аб'яваў маюць крыху розныя характарыстыкі, такія як розны запуск цана, канчатковыя даты і дастаўка зборы. Іншымі словамі, гэта як калі б «budgetgolfer» працуе эксперыменты для даследчыкаў.

Гэтыя спісы ў Taylormade гарэлцы 09 драйвера прадаюцца «budgetgolfer» з'яўляюцца адным з прыкладаў ўзгодненага набору спісаў, дзе сапраўды такі ж тавар прадаецца па тым жа самому прадаўцу, але кожны раз з некалькі іншымі характарыстыкамі. У масіўных бярвення eBay ёсць літаральна сотні тысяч падабраных набораў, якія ўключаюць мільёны запісаў. Такім чынам, замест таго, каб параўноўваць канчатковую цану для ўсіх аўкцыёнаў з зададзенай стартавай цаной, Эйнав і яго калега па параўнанні ў адпаведных наборах. Для таго, каб аб'яднаць вынікі ад параўнанняў у гэтых сотняў тысяч падабраных набораў, Эйнав і яго калегі зноў выказалі стартавую цану і канчатковую цану з пункту гледжання апорнага значэння кожнага элемента (напрыклад, сярэдняя цана продажу). Напрыклад, калі Taylormade гарэлкі 09 Драйвер меў апорнае значэнне $ 100 (у залежнасці ад яе продажу), то стартавы кошт $ 10 будзе выяўляцца як 0.1 і канчатковая цана $ 120, як 1,2.

Малюнак 2.8: Прыклад ўзгодненага набору. Гэта сапраўды такі ж гольф-клуб (а Taylormade гарэлкі 09 Driver) прадаюцца сапраўды такі ж асоба (budgetgolfer), але некаторыя з гэтых продажаў былі выкананы ў розных умовах (напрыклад, розныя стартавыя цэны). Прайграваецца з дазволу Эйнав і соавт. (2015), фігура 1b.

Малюнак 2.8: Прыклад ўзгодненага набору. Гэта сапраўды такі ж гольф-клуб (а Taylormade гарэлкі 09 Driver) прадаюцца дакладна тым жа чалавекам ( «budgetgolfer»), але некаторыя з гэтых продажаў былі выкананы ў розных умовах (напрыклад, розныя стартавыя цэны). Прайграваецца з дазволу Einav et al. (2015) і Einav et al. (2015) , фігура 1b.

Нагадаем, што Эйнав і яго калегі былі зацікаўленыя ва ўплыве пачатковай цаны на вынікі аўкцыёну. Па-першае, яны выкарыстоўвалі лінейную рэгрэсію для ацэнкі, што больш высокія цэны на адпраўныя паменшыць верагоднасць продажу, і што больш высокія цэны на адпраўныя павялічваюць канчатковую цану продажу (умоўна на продаж, якія адбыліся). Сам па сабе гэтым ацэнак, якія апісваюць-лінейную залежнасць і усредняются па ўсіх прадуктам, не ўсё, што цікава. Затым Эйнав і яго калегі выкарысталі масавы памер сваіх дадзеных, каб стварыць шмат танчэйшых ацэнак. Так, напрыклад, шляхам ацэнкі эфекту асобна для мноства розных коштаў зыходных, яны выявілі, што сувязь паміж стартавай цаной і коштам продажу з'яўляецца нелінейным (мал 2.9). У прыватнасці, для пачатку кошты ў дыяпазоне ад 0,05 да 0,85, стартавы кошт мае вельмі невялікае ўплыў на цане продажу, знаходжанне, які быў цалкам прапусціў іх першы аналіз. Акрамя таго, замест асерадненні па ўсіх пунктах, Эйнав і яго калегі ацанілі ўплыў пачатковай цаны на 23 розных катэгорый прадметаў (напрыклад, тавараў для хатніх жывёл, электронікі і спартыўных памятных рэчаў) (малюнак 2.10). Гэтыя ацэнкі паказваюць, што для больш адметныя элементы, такія як памятныя-стартавы кошт мае меншы ўплыў на верагоднасць продажу і большы ўплыў на канчатковую цану продажу. Акрамя таго, для больш коммодифицированных элементаў, такіх як DVD-дыскаў-стартавай цана амаль не ўплывае на канчатковым кошце. Іншымі словамі, у сярэднім, што спалучае ў сабе вынікі з 23 розных катэгорый прадметаў хавае важныя адрозненні паміж гэтымі дэталямі.

Малюнак 2.9: Узаемасувязь паміж пачатковай цаной аўкцыёну і верагоднасцю продажу (а) і цаной продажу (б). Існуе прыкладна лінейная залежнасць паміж пачатковай коштам і верагоднасцю продажу, але нелінейнай залежнасцю паміж пачатковай коштам і коштам продажу; для пачатку кошты ў дыяпазоне ад 0,05 да 0,85, стартавы кошт вельмі мала ўплывае на кошт продажу. У абодвух выпадках адносіны ў асноўным залежыць ад кошту тавару. Адаптавана з Einav et al. (2015) і Einav et al. (2015) , фігуры 4а і 4b.

Малюнак 2.10: Ацэнкі ад кожнай катэгорыі элементаў; цвёрдая кропка з'яўляецца ацэнкай для ўсіх катэгорый аб'яднаных разам (Эйнав і інш. 2015). Гэтыя ацэнкі паказваюць, што для больш адметных элементаў, такіх як памятныя рэчы, стартавая цана мае меншы ўплыў на верагоднасць продажу (вось х) і большы ўплыў на канчатковую цану продажу (вось). Адаптавана з Эйнав і соавт. (2015), лічба 8.

Малюнак 2.10: Ацэнкі ад кожнай катэгорыі элементаў; цвёрдая кропка з'яўляецца ацэнкай для ўсіх катэгорый аб'яднаных разам (Einav et al. 2015) і (Einav et al. 2015) . Гэтыя ацэнкі паказваюць , што для больш адметных элементаў, такіх як памятныя рэчы, стартавая цана мае меншы ўплыў на верагоднасць продажу ( $x$ Оу) і большы ўплыў на канчатковую цану продажу ( $y$ оу). Адаптавана з Einav et al. (2015) і Einav et al. (2015) , лічба 8.

Нават калі вы не асабліва зацікаўлены ў аўкцыёне на eBay, вы павінны захапляцца такім чынам, што малюнкі 2.9 і 2.10 прапановы больш глыбокае разуменнем eBay, чым простыя ацэнкі, якія апісваюць лінейную залежнасць і камбінуюць мноства розных катэгорый элементаў. Акрамя таго, хоць бы з навуковага пункту гледжання можна генераваць гэтыя больш тонкія ацэнкі з палявых эксперыментаў, варта было б зрабіць такія эксперыменты практычна немагчыма.

Як і натурных эксперыментаў, існуе цэлы шэраг спосабаў, якія ўзгадненне можа прывесці да дрэнным ацэнак. Я думаю, што самае вялікае непакой з адпаведнымі ацэнкамі, што яны могуць быць недакладнымі рэчы, якія не былі выкарыстаныя ва ўзгадненні. Напрыклад, у іх асноўных выніках, Эйнав і калега дакладнага адпаведнасці на чатыры характарыстыкі: прадавец ID нумар, катэгорыя пункта, назва пункта, і субтытры. Калі элементы былі рознымі спосабамі, якія не былі выкарыстаны для супастаўлення, то гэта можа стварыць несправядлівае параўнанне. Напрыклад, калі «budgetgolfer" знізіла цэны на Taylormade гарэлкі 09 драйвера зімой (калі гольф-клубы менш папулярныя), то гэта можа здацца, што больш нізкія цэны на адпраўныя прыводзяць да зніжэння канчатковых цэн, калі на самай справе гэта было б артэфакт сезонныя ваганні попыту. Адзін з падыходаў да вырашэння гэтай праблемы спрабуюць шмат розных відаў адпаведнасці. Напрыклад, Эйнав і яго калегі паўтарылі аналіз, вар'іруючы акно часу, якое выкарыстоўваецца для параўнання (супадаючыя наборы ўключаны пункты па продажы на працягу аднаго года, на працягу аднаго месяца, і адначасова). На шчасце, яны знайшлі аналагічныя вынікі для ўсіх часовых вокнаў. Яшчэ адна праблема з узгадненнем ўзнікае з інтэрпрэтацыі. Ацэнкі ад адпаведнасці адносіцца толькі да супадальным дадзеных; яны не распаўсюджваюцца на выпадкі, якія не могуць быць узгодненымі. Напрыклад, абмяжоўваючы свае даследаванні прадметаў, якія мелі некалькі спісаў, Эйнав і яго калегі засяродзіліся на прафесійных і паўпрафесійных прадаўцах. Такім чынам, пры інтэрпрэтацыі гэтых параўнанняў мы павінны памятаць, што яны ўжываюцца толькі да гэтага падмноства eBay.

Matching з'яўляецца магутнай стратэгіяй для пошуку справядлівага параўнання ў ня эксперыментальных дадзеных. Для многіх сацыёлагаў, ўзгадненне адчувае сябе другога гатунку для эксперыментаў, але гэта перакананне, што можа быць перагледжана, няшмат. Ўзгадненне ў масіўных дадзеных можа быць лепш, чым невялікі лік палявых эксперыментаў, калі (1) гетэрагеннасць эфектаў мае важнае значэнне і (2) важныя зменныя, неабходныя для ўзгаднення былі вымераныя. Табліца 2.4 дае некаторыя іншыя прыклады таго, як адпаведнасць можа быць выкарыстана з вялікімі крыніцамі дадзеных.

Табліца 2.4: Прыклады даследаванняў, у якіх выкарыстоўваюцца Matching з вялікімі крыніцамі дадзеных
асноўная ўвага	Вялікі крыніца дадзеных	спасылка
Ўплыў здымак на паліцэйскім гвалце	Стоп-і-FRISK запісу	Legewie (2016)
Эфект ад 11 верасня 2001 году на членаў сям'і і суседзяў	Галасаванне запіс і ахвяраванні	Hersh (2013)
сацыяльная заразы	Сувязь і прыняцце прадукту дадзеных	Aral, Muchnik, and Sundararajan (2009)

У зняволенні, ацэньваючы прычынныя эфекты ад ня Эксперыментальная інфармацыя цяжка, але такія падыходы, як натуральныя эксперыменты і статыстычныя карэкціроўкі (напрыклад, адпаведнасць) можа быць выкарыстана. У некаторых выпадках гэтыя падыходы могуць ісці жудасна няправільна, але калі абачлівасць, гэтыя падыходы могуць быць карысным дадаткам да эксперыментальнага падыходу, які я апісаў у чале 4. Акрамя таго, гэтыя два падыходу здаецца асабліва верагодна, каб атрымаць выгаду з росту always- на, вялікія інфармацыйныя сістэмы.