2.2 મોટા ડેટા

મોટા ડેટા બનાવવામાં અને સંશોધન કરતાં અન્ય હેતુઓ માટે સરકાર દ્વારા સંગ્રહ કરવામાં આવે છે. સંશોધન માટે આ માહિતી વાપરીને, એના પરિણામ રૂપે, Repurposing જરૂરી છે.

સામાજિક સંશોધન એક આદર્શ દૃશ્ય એક વૈજ્ઞાનિક એક વિચાર કર્યા અને પછી તે વિચાર ચકાસવા માટે માહિતી એકઠી કલ્પના. સંશોધન આ શૈલી સંશોધન પ્રશ્ન અને માહિતી વચ્ચે એક ચુસ્ત ફિટ તરફ દોરી જાય છે, પરંતુ તે મર્યાદિત વ્યક્તિગત સંશોધક વારંવાર સાધનો જેમ કે, મોટા સમૃદ્ધ, અને રાષ્ટ્રીય પ્રતિનિધિ માહિતી તરીકે માહિતી તેઓ જરૂર એકત્રિત કરવા માટે જરૂરી નથી, કારણ કે છે. આવા સામાન્ય સામાજિક સર્વેક્ષણ (GSS), અમેરિકન નેશનલ ઇલેક્શન અભ્યાસ (ANES), અને આવક ડાયનામિક્સ પેનલ અભ્યાસ (પીએસાઆઇડી) તરીકે તેથી, ભૂતકાળમાં સામાજિક સંશોધન ઘણો ઉપયોગ કર્યો છે મોટા પાયે સામાજિક સર્વેક્ષણ. આ મોટા પાયે સર્વે સામાન્ય રીતે સંશોધકો એક ટીમ દ્વારા ચલાવવામાં આવે છે અને તેઓ ડેટા કે ઘણા સંશોધકો દ્વારા વાપરી શકાય છે બનાવવા માટે રચાયેલ છે. આ મોટા પાયે સર્વે ગોલ કારણે, મહાન કાળજી માહિતી સંગ્રહ ડિઝાઇન અને સંશોધકો દ્વારા ઉપયોગ માટે પરિણામી માહિતી તૈયાર માં મૂકવામાં આવે છે. આ માહિતી સંશોધકો દ્વારા અને સંશોધકો માટે છે.

ડિજિટલ ઉંમર સ્ત્રોત વાપરીને મોટા ભાગના સામાજિક સંશોધન, જો કે, મૂળભૂત રીતે જુદા છે. તેના બદલે સંશોધકો દ્વારા અને સંશોધકો માટે એકત્રિત માહિતી મદદથી, તે માહિતી સ્ત્રોત બનાવવામાં અને, જેમ કે નફો બનાવવા એક સેવા પૂરી પાડે છે, અથવા કાયદા કરાવતી તરીકે તેમના પોતાના હેતુ માટે વ્યવસાયો અને સરકારો દ્વારા એકત્રિત કરવામાં આવ્યા હતા કે ઉપયોગ કરે છે. આ બિઝનેસ અને સરકાર માહિતી સ્ત્રોત મોટા માહિતી કહેવામાં આવે છે આવે છે. મોટા ડેટા સાથે સંશોધન કરી માહિતી કે જે મૂળભૂત સંશોધન માટે બનાવવામાં આવી હતી સાથે સંશોધન કરી કરતાં અલગ છે. સરખામણી કરો, ઉદાહરણ તરીકે, ટ્વિટર જેવા સોશિયલ મીડિયા વેબસાઇટ, જેમ કે સામાન્ય સામાજિક સર્વેક્ષણ (GSS) તરીકે પરંપરાગત જાહેર અભિપ્રાય મોજણી સાથે. માતાનો Twitter પર મુખ્ય ગોલ તેના વપરાશકર્તાઓ માટે એક સેવા પૂરી પાડે છે અને નફો બનાવવા માટે હોય છે. આ ધ્યેયો સિદ્ધ પ્રક્રિયા, પક્ષીએ માહિતી કે જાહેર અભિપ્રાય કેટલાક નિશ્ચિત પાસાઓ અભ્યાસ માટે ઉપયોગી હોઈ શકે છે બનાવે છે. પરંતુ, સામાન્ય સામાજિક સર્વેક્ષણ (GSS) જેમ નહિં પણ, પક્ષીએ મુખ્યત્વે સામાજિક સંશોધન પર ધ્યાન કેન્દ્રિત કર્યું છે.

શબ્દ મોટા માહિતી frustratingly અસ્પષ્ટ છે, અને તે ઘણા વિવિધ વસ્તુઓ જૂથો સાથે. સામાજિક સંશોધન હેતુ માટે, મને લાગે છે કે તે મોટા માહિતી સ્ત્રોત બે પ્રકારના વચ્ચે તફાવત કરવામાં સહાયરૂપ છે. સરકાર વહીવટી રેકોર્ડ અને બિઝનેસ વહીવટી રેકોર્ડ સરકાર વહીવટી માહિતી રેકોર્ડ તેમના નિયમિત પ્રવૃત્તિઓ ભાગ તરીકે સરકારો દ્વારા બનાવવામાં આવે છે છે. રેકોર્ડ આ પ્રકારના જેમ કે ભૂતકાળમાં અભ્યાસ જન્મ, લગ્ન અને મૃત્યુ રેકોર્ડ પણ સરકારો વધુને વધુ એકઠી કરે છે અને વિશ્લેષણ સ્વરૂપો વિગતવાર રેકોર્ડ પ્રકાશિત થાય છે વસ્તીવિષયકો તરીકે સંશોધકો દ્વારા ઉપયોગ કરવામાં આવે છે. ઉદાહરણ તરીકે, ન્યુ યોર્ક સિટી સરકાર શહેરમાં દરેક ટેક્સી ની અંદર ડિજિટલ મીટર સ્થાપિત થયેલ છે. આ મીટર ડ્રાઈવર, પ્રારંભ સમય અને સ્થાન, સ્ટોપ સમય અને સ્થાન, અને ભાડું સહિત દરેક ટેક્સી સવારી વિશે માહિતી તમામ પ્રકારના રેકોર્ડ કરે છે. એક અભ્યાસ કે હું આ પ્રકરણમાં પછીથી કહી શકશો માં, હેનરી Farber (2015) કલાકદીઠ વેતન અને કલાક કામ કર્યું હતું સંખ્યા વચ્ચે સંબંધ વિશે શ્રમ અર્થશાસ્ત્ર મૂળભૂત ચર્ચા સંબોધવા માટે આ માહિતી repurposed.

સામાજિક સંશોધન માટે મોટા માહિતી બીજા મુખ્ય પ્રકાર બિઝનેસ વહીવટી રેકોર્ડ છે. આ માહિતી કે જે બિઝનેસ બનાવવા અને તેમના નિયમિત પ્રવૃત્તિઓ ભાગ તરીકે એકત્રિત છે. આ વ્યાપાર વહીવટી રેકોર્ડ ઘણી વખત ડિજિટલ નિશાનો કહેવામાં આવે છે, અને શોધ એન્જિન ક્વેરી લોગ, સામાજિક મીડિયા પોસ્ટ્સ જેવી વસ્તુઓ સમાવેશ થાય છે, અને મોબાઇલ ફોનથી રેકોર્ડ કૉલ કરો. ભારે, આ બિઝનેસ વહીવટી રેકોર્ડ માત્ર ઓનલાઇન વર્તન વિશે નથી. ઉદાહરણ તરીકે, સ્ટોર્સ ચેક-આઉટ સ્કેનર્સ ઉપયોગ કામદારની ઉત્પાદકતા વાસ્તવિક સમય પગલાં બનાવવા આવે છે. એક અભ્યાસ કે હું તમને આ પ્રકરણ વિશે પાછળથી કહી શકશો માં, એલેક્ઝાન્ડ્રે માસ અને એનરિકો Moretti (2009) અભ્યાસ માટે ઑનલાઇન કેવી રીતે કામદારોના ઉત્પાદકતા તેમના સાથીદારોએ ઉત્પાદકતા ઘણી અસર થઈ, આ સુપરમાર્કેટ ચેક-આઉટ માહિતી repurposed.

આ ઉદાહરણો બંને સમજાવે છે, Repurposing વિચાર મોટા માહિતી પરથી શીખવા માટે મૂળભૂત છે. મારા અનુભવ, સામાજિક વૈજ્ઞાનિકો અને માહિતી વૈજ્ઞાનિકો આ ખૂબ જ અલગ repurposing અભિગમ. સામાજિક વિજ્ઞાનીઓ, જે સંશોધન માટે ડિઝાઇન કરવામાં આવેલા ડેટા સાથે કામ કરવા માટે ટેવાયેલું છે, repurposed માહિતી સાથે સમસ્યાઓ નિર્દેશ જ્યારે તેની શક્તિ અવગણીને ઝડપી છે. બીજી બાજુ પર, માહિતી વૈજ્ઞાનિકો repurposed માહિતી લાભ માટે નિર્દેશ કરે છે, જ્યારે તેની નબળાઈઓ અવગણીને ઝડપી છે. કુદરતી રીતે, શ્રેષ્ઠ અભિગમ એક વર્ણસંકર હશે. સંશોધકો માહિતી બંને સારા અને ખરાબ અને પછી તેમની પાસેથી શીખવા માટે કેવી રીતે બહાર આકૃતિ આ નવા સ્ત્રોત લાક્ષણિકતાઓ સમજવા માટે જરૂર છે. અને, આ પ્રકરણનું બાકીનું માટે યોજના છે. આગળ, હું બિઝનેસ અને સરકાર વહીવટી માહિતી દસ સામાન્ય લાક્ષણિકતાઓ વર્ણવે છે. કે પછી, હું ત્રણ સંશોધન અભિગમ છે કે આ માહિતી, અભિગમ સાથે સાથે આ માહિતી લાક્ષણિકતાઓ માટે અનુરૂપ છે સાથે વાપરી શકાય છે વર્ણન કરશે.