2.4.3.2 Matching

Passende erstellen faire Vergleiche von Fällen Rebschnitt entfernt.

Fair-Vergleiche aus kommen entweder randomisierten kontrollierten Experimenten oder natürliche Experimente. Aber es gibt viele Situationen, in denen Sie nicht die ideale Experiment laufen kann und die Natur hat kein natürliches Experiment zur Verfügung gestellt. In diesen Einstellungen zu erstellen , um die beste Art und Weise ein fairer Vergleich ist passend. In Matching, sieht der Forscher durch nichtexperimentelle Datenpaare von Menschen zu schaffen, die ähnlich sind, außer dass man die Behandlung erhalten hat, und man hat es nicht. Im Prozess der Anpassung, Forscher Beschneidung eigentlich auch; das heißt, verwirft Fällen, in denen es keine offensichtlichen Vergleich. Somit wäre dieses Verfahren noch genauer matching-und-Schnitt genannt, aber ich werde mit dem traditionellen Begriff bleiben: Matching.

Ein schönes Beispiel für die Macht von Strategien mit massiven nichtexperimentelle Datenquellen stammen aus der Forschung auf das Konsumverhalten von Liran Einav und Kollegen passend (2015) . Einav und Kollegen waren in Auktionen interessiert am eBay nehmen, und ihre Arbeit zu beschreiben, werde ich den Schwerpunkt auf einen bestimmten Aspekt: ​​die Wirkung der Auktion Startpreis der Auktion Ergebnisse, wie der Verkaufspreis oder die Wahrscheinlichkeit eines Verkaufs.

Die naive Art und Weise die Frage nach der Wirkung der Einstiegspreis auf Verkaufspreis zu beantworten wäre, einfach den Endpreis für Auktionen mit unterschiedlichen Startpreise berechnen. Dieser Ansatz wäre schön, wenn man einfach den Verkaufspreis eines Artikels vorhersagen wollen, die auf eBay mit einem bestimmten Startpreis gesetzt worden war. Aber, wenn Ihre Frage ist , was die Wirkung ist Preis ab Marktergebnisse dieser Ansatz wird nicht funktionieren , weil es nicht auf faire Vergleiche basiert; die Auktionen mit niedriger Startpreise könnten durchaus von Auktionen mit höheren Startpreise unterschiedlich sein (zB sie für verschiedene Arten von Waren sein könnte oder umfassen verschiedene Arten von Anbietern).

Wenn Sie bereits besorgt darum, faire Vergleiche sind, können Sie den naiven Ansatz überspringen und betrachten ein Feldversuch läuft, auf dem Sie ein bestimmtes Element-sagen, einen Golfschläger-mit einem festen Satz von Auktion verkaufen würde Parameter-sagen, freies Verschiffen, Auktion offen für zwei Wochen usw., aber mit Preisen ab zufällig gesetzt. Durch den Vergleich der daraus resultierenden Marktergebnisse, würde dieses Feldexperiment bieten eine sehr klare Messung der Wirkung des Preises auf Verkaufspreis beginnt. Aber würde diese Messung nur auf ein bestimmtes Produkt und eine Reihe von Auktions Parameter gelten. Die Ergebnisse könnten unterschiedlich sein, beispielsweise für verschiedene Arten von Produkten. Ohne eine starke Theorie, ist es schwierig, aus diesem einzigen Experiment die gesamte Palette der möglichen Experimente zur Extrapolation, die ausgeführt worden sein könnte. Ferner sind Feldversuche ausreichend teuer, dass es unmöglich sein würde, genug davon zu laufen, den gesamten Parameterraum von Produkten und Auktionstypen abzudecken.

Im Gegensatz zu den naiven Ansatz und dem experimentellen Ansatz, Einav und Kollegen nehmen einen dritten Ansatz: Matching. Der wichtigste Trick ihrer Strategie ist es, Dinge zu entdecken, ähnlich wie Feldversuche, die bei eBay schon passiert ist. Zum Beispiel Abbildung 2.6 zeigt einige der 31 Angebote für genau den gleichen Golfclub-a Taylormade Burner 09 Treiber-wird durch genau die gleiche seller- "budgetgolfer" verkauft. Jedoch haben diese Auflistungen geringfügig unterschiedliche Eigenschaften. Elf von ihnen bieten den Treiber für einen Festpreis von $ 124,99, während die anderen 20 Auktionen mit unterschiedlichen Enddaten sind. Außerdem haben die Inserate unterschiedliche Versandkosten, entweder $ 7,99 oder $ 9,99. In anderen Worten ist es, als ob "budgetgolfer" wird Experimente für die Forscher aktiv.

Die Objekte des Taylormade Burner 09 Fahrer durch "budgetgolfer" verkauft werden, sind ein Beispiel für einen aufeinander abgestimmten Satz von Listen, in denen genau das gleiche Produkt wird von der exakt gleichen Verkäufer verkauft werden, aber jedes Mal mit leicht unterschiedlichen Eigenschaften. Innerhalb der massiven Protokolle von eBay gibt es buchstäblich Hunderte von Tausenden von abgestimmte Sets Millionen Listings beteiligt sind. Anstatt also den Endpreis für alle Auktionen, die innerhalb eines bestimmten Startpreis zu vergleichen, Einav und Kollegen Vergleiche innerhalb abgestimmte Sets. Um die Ergebnisse der Vergleiche zu kombinieren innerhalb dieser Hunderttausende von aufeinander abgestimmten Sets, Einav und Kollegen erneut drücken den Startpreis und Endpreis in Bezug auf den Referenzwert der einzelnen Elemente (zB den durchschnittlichen Verkaufspreis). Zum Beispiel, wenn der Taylormade Burner 09 Fahrer einen Referenzwert von $ 100 (basierend auf den Umsatz) hat, dann einen Startpreis von $ 10 würde als 0,1 und Endpreis von 120 als 1,2 ausgedrückt würde $ ausgedrückt werden.

Abbildung 2.6: Ein Beispiel für einen abgestimmten Satz. Dies ist genau die gleiche Golfclub (a Taylormade Burner 09-Treiber) durch die exakt gleiche Person verkauft werden (budgetgolfer), aber einige dieser Verkäufe wurden verschiedene Bedingungen (zum Beispiel unterschiedliche Startpreis). Abbildung von Einav et al genommen. (2015).

Abbildung 2.6: Ein Beispiel für einen abgestimmten Satz. Dies ist genau die gleiche Golfclub (a Taylormade Burner 09-Treiber) durch die exakt gleiche Person verkauft werden ( "budgetgolfer"), aber einige dieser Verkäufe wurden unterschiedliche Bedingungen (zB unterschiedliche Startpreis) durchgeführt. Abbildung entnommen aus Einav et al. (2015) .

Daran erinnern, dass Einav und Kollegen in der Wirkung der Startpreis der Auktion Ergebnisse interessiert waren. Zunächst lineare Regression sie geschätzt, dass höhere Startpreise die Wahrscheinlichkeit eines Verkaufs zu verringern, und dass höhere Startpreise den endgültigen Verkaufspreis zu erhöhen, unter der Bedingung ein Verkauf stattfindet. Indem sie sich, diese Schätzungen-die alle Produkte gemittelt über und übernehmen eine lineare Beziehung zwischen Startpreis und Endergebnisse-sind gar nicht so interessant. Aber Einav und Kollegen auch die massive Größe ihrer Daten verwenden, um eine Vielzahl von subtiler Ergebnisse abzuschätzen. Zunächst machte Einav und Kollegen separat diese Schätzungen für Gegenstände aus verschiedenen Preisen und ohne lineare Regression. Sie fanden heraus, dass, während die Beziehung zwischen Startpreis und die Wahrscheinlichkeit eines Verkaufs linear ist, ist die Beziehung zwischen Startpreis und Verkaufspreis ist eindeutig nichtlinear (Abbildung 2.7). Insbesondere für Preise zwischen 0,05 und 0,85, der Startpreis hat sehr wenig Einfluss auf die Verkaufspreis beginnt, ein Befund, der in der Analyse abgeschlossen wurde verpasst, die eine lineare Beziehung angenommen hatte.

Abbildung 2.7: Beziehung zwischen Auktionsstartpreis und die Wahrscheinlichkeit eines Verkaufs (links) und dem Verkaufspreis (rechtes Bild). Es gibt etwa eine lineare Beziehung zwischen Startpreis und Verkaufswahrscheinlichkeit, aber es ist eine nicht-lineare Beziehung zwischen Startpreis und dem Verkaufspreis; für Preise zwischen 0,05 und 0,85, der Startpreis hat sehr wenig Einfluss auf die Verkaufspreis beginnt. In beiden Fällen sind die Beziehungen grundsätzlich unabhängig von Elementwert. Diese Graphen reproduzieren 4a und 4b Einav et al. (2015).

Abbildung 2.7: Beziehung zwischen Auktionsstartpreis und die Wahrscheinlichkeit eines Verkaufs (links) und dem Verkaufspreis (rechtes Bild). Es gibt etwa eine lineare Beziehung zwischen Startpreis und Verkaufswahrscheinlichkeit, aber es ist eine nicht-lineare Beziehung zwischen Startpreis und dem Verkaufspreis; für Preise zwischen 0,05 und 0,85, der Startpreis hat sehr wenig Einfluss auf die Verkaufspreis beginnt. In beiden Fällen sind die Beziehungen grundsätzlich unabhängig von Elementwert. Diese Graphen reproduzieren 4a und 4b Einav et al. (2015) .

Zweitens, anstatt alle Elemente von durchschnittlich über, Einav und Kollegen auch die massiven Umfang ihrer Daten verwenden, um die Auswirkungen der Einstiegspreis für 23 verschiedene Kategorien von Elementen (zB Tierbedarf, Elektronik und Sport-Erinnerungsstücke) zu schätzen (Abbildung 2.8). Diese Schätzungen zeigen, dass für weitere Erkennungszeichen-wie Memorabilia-Startpreis hat einen geringeren Effekt auf die Wahrscheinlichkeit eines Verkaufs und eine größere Wirkung auf den abschließenden Verkaufspreis. Ferner wird für mehr kommodifizierte Artikel-wie DVDs und Video-Startpreis hat fast keinen Einfluss auf den Endpreis. Mit anderen Worten, ein Mittelwert, der sich aus 23 verschiedenen Kategorien von Elementen verbirgt wichtige Informationen über die Unterschiede zwischen diesen Einzelteilen kombiniert.

Abbildung 2.8: Ergebnisse einzeln Schätzungen aus jeder Kategorie zeigte; der feste Punkt in der Schätzung für alle Kategorien zusammengelegt, Table 11 (Einav et al. 2015, Tabelle 11). Diese Schätzungen zeigen, dass für weitere Erkennungszeichen-wie Memorabilia-der Startpreis hat einen geringeren Effekt auf die Wahrscheinlichkeit eines Verkaufs (x-Achse) und eine größere Wirkung auf den abschließenden Verkaufspreis (y-Achse).

Abbildung 2.8: Ergebnisse einzeln Schätzungen aus jeder Kategorie zeigte; der feste Punkt in der Schätzung für alle Kategorien zusammen gepoolt (Einav et al. 2015, Table 11) . Diese Schätzungen zeigen, dass für weitere Erkennungszeichen-wie Memorabilia-der Startpreis hat einen geringeren Effekt auf die Wahrscheinlichkeit eines Verkaufs (x-Achse) und eine größere Wirkung auf den abschließenden Verkaufspreis (y-Achse).

Auch wenn Sie in Auktionen auf eBay nicht besonders daran interessiert sind, müssen Sie die Art und Weise zu bewundern, die Abbildung 2.7 und Abbildung 2.8 bieten ein reicheres Verständnis von eBay als einfache lineare Regression schätzt, dass lineare Beziehungen annehmen und viele verschiedene Kategorien von Elementen kombinieren. Diese subtilere Schätzungen zeigen die Kraft der in massiven Daten übereinstimmt; Diese Schätzungen würden ohne eine enorme Anzahl von Feldversuchen nicht möglich gewesen, die zu teuer gewesen wäre.

Natürlich sollten wir weniger Vertrauen in die Ergebnisse eines bestimmten Anpassungs Studie haben, als wir in den Ergebnissen einer vergleichbaren Experiment würde. Wenn die Ergebnisse von jeder passenden Studie zur Bewertung gibt es zwei wichtige Anliegen. Zuerst müssen wir uns daran erinnern, dass wir nur faire Vergleiche auf Dinge sicherstellen können, die für den Abgleich verwendet wurden. Einav und Kollegen in ihren wichtigsten Ergebnisse, hat passend genau auf vier Merkmale: Verkäufer-ID-Nummer, Positionstyp, Titel und Untertitel. Wenn die Einzelteile waren unterschiedlich in einer Weise, die nicht für den Abgleich verwendet wurden, die einen unfairen Vergleich schaffen könnte. Zum Beispiel, wenn "budgetgolfer" gesenkt Preise für Taylormade Burner 09 Fahrer im Winter (wenn Golfclubs weniger beliebt sind), dann könnte es scheinen, dass niedrigere Anfangs Preise sind Endpreise zu senken, führen, wenn in der Tat wäre dies ein Artefakt der saisonalen sein Veränderung der Nachfrage. Im Allgemeinen scheint die beste Lösung für dieses Problem viele verschiedene Arten von Übereinstimmungen zu versuchen. Zum Beispiel Einav und Kollegen wiederholen ihre Analyse, wo abgestimmte Sets Produkte zum Verkauf innerhalb eines Jahres enthalten, innerhalb eines Monats, und gleichzeitig. Wodurch das Zeitfenster enger verringert die Anzahl von angepaßten Sätzen, sondern reduziert Bedenken über saisonale Schwankungen. Glücklicherweise finden sie, dass Ergebnisse von diesen Änderungen in der Abfrage nicht entsprechen unverändert sind. In der passenden Literatur wird diese Art von Besorgnis in der Regel in Bezug auf die Observablen und unobservables ausgedrückt, aber die Grundidee ist wirklich , dass die Forscher faire Vergleiche zu den Features in Anpassung verwendet nur erstellen.

Die zweite große Sorge bei der Zuordnung der Interpretation der Ergebnisse ist, dass sie nur auf abgestimmte Daten gelten; sie gelten nicht für die Fälle, die nicht zugeordnet werden konnten. Zum Beispiel durch ihre Forschung, um Elemente zu begrenzen, die mehrere Angebote Einav und Kollegen hatten auf professionellen und semi-professionellen Anbietern konzentrieren. Wenn also diese Vergleiche zu interpretieren müssen wir daran denken, dass sie nur auf diese Untergruppe von eBay anzuwenden.

Matching ist eine leistungsfähige Strategie für faire Vergleiche in großen Datensätzen zu finden. Für viele Sozialwissenschaftler, fühlt sich wie Matching zweitbeste auf Experimente, aber das ist ein Glaube, der geändert werden soll, leicht. Matching in massiven Daten könnte besser sein, als eine kleine Anzahl von Feldversuchen, wenn: 1) Heterogenität Effekte wichtig ist und 2) gibt es gute Observablen für den Abgleich. Tabelle 2.4 enthält einige andere Beispiele dafür, wie passend mit großen Datenquellen verwendet werden.

Tabelle 2.4: Beispiele für Studien, die passende verwenden faire Vergleiche innerhalb der digitalen Spuren zu finden.
Inhaltliche Schwerpunkte Große Datenquelle Zitat
Wirkung von Schießereien auf Polizeigewalt Stop-and-Frisk Aufzeichnungen Legewie (2016)
Wirkung vom 11. September 2001 über die Familien und Nachbarn Abstimmungsunterlagen und Donationsurkunden Hersh (2013)
Soziale Ansteckung Kommunikation und Produktannahme Daten Aral, Muchnik, and Sundararajan (2009)

Abschließend sind naive Ansätze zur kausalen Wirkungen von nichtexperimentellen Daten Schätzung gefährlich. Allerdings Strategien für die entlang eines Kontinuums kausalen Schätzungen von der stärksten zur schwächsten liegen und Forscher können faire Vergleiche in nicht-experimentellen Daten zu entdecken. Das Wachstum der Always-on, große Datensysteme erhöht unsere Fähigkeit, effektiv zwei bestehenden Methoden verwenden: natürliche Experimente und Matching.