3.6 મોટું ડેટા સ્ત્રોતો સાથે સંકળાયેલા સર્વેક્ષણો

મોટું ડેટા સ્ત્રોતોમાં સર્વેક્ષણોને જોડવાથી તમે એવા અંદાજોનું નિર્માણ કરી શકો છો કે જે ડેટા સ્રોત સાથે વ્યક્તિગત રૂપે અશક્ય હશે.

મોટા ભાગનાં સર્વેક્ષણ એકલા, સ્વયં પર્યાપ્ત પ્રયત્નો છે તેઓ એકબીજા પર બિલ્ડ કરતા નથી, અને તેઓ અન્ય બધી માહિતીનો લાભ લેતા નથી જે વિશ્વમાં અસ્તિત્વમાં છે. આ બદલાશે પ્રકરણ 2 માં ચર્ચા કરાયેલા મોટા ડેટા સ્ત્રોતોને સર્વેક્ષણ ડેટાને લિંક કરીને ખૂબ જ ફાયદો થયો છે. આ બે પ્રકારનાં ડેટાને સંયોજિત કરીને, તે કોઈક કરવું શક્ય છે જે કોઈ એક સાથે વ્યક્તિગત રીતે અશક્ય હતું.

મોટું ડેટા સ્ત્રોતો સાથે સર્વેક્ષણ ડેટાને એક સાથે જોડી શકાય તેવા વિવિધ રસ્તાઓ છે. આ વિભાગમાં, હું એવા બે અભિગમોનું વર્ણન કરું છું જે ઉપયોગી અને વિશિષ્ટ છે, અને હું તેમને પૂછવા અને વિસ્તૃત પૂછવા (3.1.2 આકૃતિ) કહીશ. હું દરેક ઉદાહરણને વિગતવાર ઉદાહરણ સાથે સમજાવીશ, તેમ છતાં, તમારે ઓળખવું જોઈએ કે આ સામાન્ય વાનગીઓ છે જેનો ઉપયોગ વિવિધ પ્રકારનાં મોજણી ડેટા અને વિવિધ પ્રકારના મોટા ડેટા સાથે થઈ શકે છે. વધુમાં, તમારે નોંધવું જોઈએ કે આ દરેક ઉદાહરણ બે અલગ અલગ રીતે જોઈ શકાય છે. પ્રકરણ 1 માં વિચારો પર વિચાર કરવાથી, કેટલાક લોકો આ અભ્યાસને "રેડીમેડ" મોટા ડેટાને વધારવા માટેના "કસ્ટમાઇડ" સર્વેક્ષણ ડેટાના ઉદાહરણ તરીકે જોશે અને અન્ય લોકો તેને "રેડીમેડ" ના મોટા ડેટા "કસ્ટમાઈડ" સર્વેક્ષણ ડેટાને વધારવા માટેના ઉદાહરણ તરીકે જોશે. તમે બંને દૃશ્યો જોવા માટે સમર્થ હોવા જોઈએ. છેલ્લે, તમારે નોંધવું જોઈએ કે કેવી રીતે આ ઉદાહરણો સ્પષ્ટ કરે છે કે સર્વેક્ષણો અને મોટા ડેટા સ્ત્રોતો પરિપૂર્ણ છે અને અવેજી નથી.

આકૃતિ 3.12: મોટા ડેટા સ્ત્રોતો અને સર્વેક્ષણ ડેટાને સંયોજિત કરવાની બે રીતો. સઘન પૂછાતા (વિભાગ 3.6.1) માં, મોટા ડેટા સ્રોતમાં રુચિનો મુખ્ય માપ છે અને સર્વેક્ષણ ડેટા તેની આસપાસ જરૂરી સંદર્ભને બનાવે છે. વિસ્તૃત પૂછવા (વિભાગ 3.6.2) માં, મોટા ડેટા સ્રોતમાં કોઈ રુચિનું મુખ્ય માપ નથી, પરંતુ તેનો ઉપયોગ સર્વેક્ષણ ડેટાને વધારવા માટે થાય છે.

આકૃતિ 3.12: મોટા ડેટા સ્ત્રોતો અને સર્વેક્ષણ ડેટાને સંયોજિત કરવાની બે રીતો. સઘન પૂછાતા (વિભાગ 3.6.1) માં, મોટા ડેટા સ્રોતમાં રુચિનો મુખ્ય માપ છે અને સર્વેક્ષણ ડેટા તેની આસપાસ જરૂરી સંદર્ભને બનાવે છે. વિસ્તૃત પૂછવા (વિભાગ 3.6.2) માં, મોટા ડેટા સ્રોતમાં કોઈ રુચિનું મુખ્ય માપ નથી, પરંતુ તેનો ઉપયોગ સર્વેક્ષણ ડેટાને વધારવા માટે થાય છે.