3.6 Opnames gekoppel aan groot databronne

Koppel opnames aan groot databronne stel u in staat om ramings te maak wat onmoontlik met enige data bron individueel sou wees.

Die meeste opnames is stand-alone, selfstandige pogings. Hulle bou nie op mekaar nie en gebruik nie al die ander data wat in die wêreld bestaan ​​nie. Dit sal verander. Daar is net te veel te wyte aan die koppeling van opname data aan die groot data bronne wat in hoofstuk 2 bespreek is. Deur hierdie twee tipes data te kombineer, is dit dikwels moontlik om iets wat onmoontlik was met een individueel te doen.

Daar is 'n paar verskillende maniere waarop opname data gekombineer kan word met groot databronne. In hierdie afdeling beskryf ek twee benaderings wat bruikbaar en afsonderlik is, en ek sal hulle verryk, vra en versterk, vra (figuur 3.12). Alhoewel ek elke benadering met 'n gedetailleerde voorbeeld gaan illustreer, moet u erken dat dit algemene resepte is wat gebruik kan word met verskillende tipes opname data en verskillende tipes groot data. Verder moet u daarop let dat elk van hierdie voorbeelde op twee verskillende maniere besigtig kan word. Om terug te dink aan die idees in hoofstuk 1, sal sommige mense hierdie studies beskou as voorbeelde van "custommade" -opname-data wat "gereedgemaakte" groot data verbeter, en ander sal hulle beskou as voorbeelde van "gereedgemaakte" groot dataverbeterende "custommade" opname data. U moet beide aansigte kan sien. Ten slotte moet jy sien hoe hierdie voorbeelde verduidelik dat opnames en groot databronne komplemente en nie plaasvervangers is nie.

Figuur 3.12: Twee maniere om groot data bronne en opname data te kombineer. In verrykte vraag (afdeling 3.6.1) het die groot databron 'n belangrike maatstaf van belang en die opname data bou die nodige konteks daar rondom. In versterkte vraag (afdeling 3.6.2) het die groot data bron nie 'n kernmaatreël nie, maar dit word gebruik om die opname data te versterk.

Figuur 3.12: Twee maniere om groot data bronne en opname data te kombineer. In verrykte vraag (afdeling 3.6.1) het die groot databron 'n belangrike maatstaf van belang en die opname data bou die nodige konteks daar rondom. In versterkte vraag (afdeling 3.6.2) het die groot data bron nie 'n kernmaatreël nie, maar dit word gebruik om die opname data te versterk.