3.6 Հետազոտություններ, կապված մեծ տվյալների աղբյուրների հետ

Հարցումների կապը մեծ տվյալների աղբյուրների հետ կապահովի, որպեսզի գնահատեն այնպիսի գնահատականներ, որոնք անհնար կդառնան տվյալների աղբյուրի առանձին:

Շատ հարցումներն անհատական, ինքնուրույն ջանքեր են: Նրանք միմյանց վրա չեն կառուցում, եւ չեն օգտվում աշխարհի բոլոր մյուս տվյալներից: Դա կփոխվի: Հետազոտության տվյալները կապում են գլխի 2-ում քննարկված մեծ տվյալների աղբյուրների հետ կապակցելով, շատերի համար: Այս երկու տիպի տվյալների համադրմամբ հաճախ հնարավոր է մի բան անել, որը անհնար է ոչ մեկի հետ:

Կան մի քանի տարբեր ձեւեր, որոնցում հետազոտության տվյալները կարող են համակցվել մեծ տվյալների աղբյուրների հետ: Այս բաժնում ես նկարագրում եմ երկու մոտեցումներ, որոնք օգտակար եւ հստակ են, եւ ես կոչ եմ անում նրանց հարստացնելու խնդրելու եւ ուժեղացնելու հարցում (նկար 3.12): Թեեւ ես պատրաստվում եմ նկարագրել յուրաքանչյուր մոտեցման մանրամասն օրինակով, դուք պետք է ընդունեք, որ դրանք ընդհանուր բաղադրատոմսեր են, որոնք կարող են օգտագործվել տարբեր տեսակի հետազոտության տվյալների եւ մեծ տվյալների տարբեր տեսակների հետ: Բացի այդ, պետք է նկատել, որ յուրաքանչյուր օրինակ կարող է դիտվել երկու տարբեր ձեւերով: Մտածելով 1-ին գլխում գաղափարների մասին, որոշ մարդիկ այս ուսումնասիրությունները կքննարկեն որպես «պահպոմադային» հետազոտության տվյալների արտացոլման «պատրաստված» մեծ տվյալներ, իսկ մյուսները դրանք կքննարկեն որպես «պատրաստված» մեծ տվյալների ընդլայնման «custommade» հետազոտության տվյալները: Դուք պետք է կարողանաք տեսնել երկու տեսակետները: Վերջապես, պետք է նկատել, թե ինչպես են այս օրինակներ պարզաբանել, որ հետազոտությունները եւ մեծ տվյալների աղբյուրները լրացնում են եւ չեն փոխարինում:

Նկար 3.12. Մեծ տվյալների աղբյուրների եւ հետազոտության տվյալների համատեղման երկու եղանակ: Բավարարված հարցման մեջ (բաժին 3.6.1) մեծ տվյալների աղբյուրն ունի հետաքրքրության հիմնական չափանիշ, եւ հետազոտության տվյալները կառուցում են դրա շուրջ անհրաժեշտ համատեքստը: Բարձրացված հարցման մեջ (բաժին 3.6.2) մեծ տվյալների աղբյուրը չունի հետաքրքրության հիմնական չափանիշ, սակայն այն օգտագործվում է ընդլայնելու հետազոտության տվյալները:

Նկար 3.12. Մեծ տվյալների աղբյուրների եւ հետազոտության տվյալների համատեղման երկու եղանակ: Բավարարված հարցման մեջ (բաժին 3.6.1) մեծ տվյալների աղբյուրն ունի հետաքրքրության հիմնական չափանիշ, եւ հետազոտության տվյալները կառուցում են դրա շուրջ անհրաժեշտ համատեքստը: Բարձրացված հարցման մեջ (բաժին 3.6.2) մեծ տվյալների աղբյուրը չունի հետաքրքրության հիմնական չափանիշ, սակայն այն օգտագործվում է ընդլայնելու հետազոտության տվյալները: