2.3.7 ડ્રિફ્ટિંગ

વસ્તી પ્રવાહો, ઉપયોગ પ્રવાહ અને સિસ્ટમ ડ્રિફ્ટ લાંબા ગાળાની વલણોનો અભ્યાસ કરવા માટે મોટા ડેટા સ્ત્રોતોનો ઉપયોગ કરવાનું મુશ્કેલ બનાવે છે.

ઘણા મોટા ડેટા સ્ત્રોતોમાંના એક મહાન ફાયદા એ છે કે તેઓ સમય જતાં માહિતી એકત્રિત કરે છે. સામાજિક વૈજ્ઞાનિકો આ પ્રકારની ઓવર-ટાઇમ ડેટા સમાંતર ડેટાને કૉલ કરે છે . અને, કુદરતી રીતે, પરિવર્તનનો અભ્યાસ કરવા માટે સમાંતર માહિતી ખૂબ મહત્વપૂર્ણ છે. જો કે, વિશ્વસનીય પરિવર્તન માપવા માટે, માપ સિસ્ટમ પોતે સ્થિર હોવી જોઈએ. સમાજશાસ્ત્રી ઓટીસ ડુડલી ડંકનના શબ્દોમાં, "જો તમે ફેરફાર માપવા માગો છો, તો માપ બદલો નહીં" (Fischer 2011) .

કમનસીબે, ઘણી મોટી માહિતી સિસ્ટમો-ખાસ કરીને બિઝનેસ સિસ્ટમ્સ-દરેક સમય બદલાતા રહે છે, એવી પ્રક્રિયા જે હું ડ્રિફ્ટ કહીશ. ખાસ કરીને, આ પદ્ધતિઓ ત્રણ મુખ્ય રીતોમાં બદલાય છે: વસ્તીનું વલણ (જેઓ તેનો ઉપયોગ કરે છે તેમાં પરિવર્તન), વર્તન વલણ (લોકો તેનો ઉપયોગ કેવી રીતે કરે છે તે બદલાવો) અને સિસ્ટમ ડ્રિફ્ટ ( સિસ્ટમમાં ફેરફાર). ડ્રિફ્ટના ત્રણ સ્રોતોનો અર્થ એવો થાય છે કે મોટા ડેટા સ્રોતમાં કોઈ પણ પધ્ધતિ વિશ્વની મહત્વપૂર્ણ પરિવર્તનને કારણે થઈ શકે છે, અથવા તે કોઈ પ્રકારનું પ્રવાહ દ્વારા થઈ શકે છે.

ડ્રિફ્ટ વસ્તી ડ્રિફ્ટનું પ્રથમ સ્ત્રોત - જે સિસ્ટમનો ઉપયોગ કરે છે તેના ફેરફારોને લીધે થાય છે અને આ ફેરફારો ટૂંકા અને લાંબા સમયના કેલ્સલ પર થઈ શકે છે. દાખલા તરીકે, 2012 ની અમેરિકી રાષ્ટ્રપતિ ચુંટણી દરમિયાન રાજકારણ વિશેના ટ્વીટ્સના પ્રમાણમાં સ્ત્રીઓ દ્વારા લખવામાં આવતી હતી, જે દિવસે દિવસે (Diaz et al. 2016) બદલાતી હતી. આમ, ટ્વિટર-શ્લોકના મૂડમાં શું બદલાયું હોઈ શકે છે તે વાસ્તવમાં કોઈપણ સમયે વાત કરી રહેલા લોકોમાં ફેરફાર હોઈ શકે છે. આ ટૂંકા ગાળાના વધઘટ ઉપરાંત, કેટલાક વસ્તીવિષયક જૂથો ટ્વિટરને અપનાવીને અને ત્યજી દેવાનો એક લાંબા ગાળાનો ટ્રેન્ડ પણ છે.

જે સિસ્ટમનો ઉપયોગ કરે છે તેમાં ફેરફાર કરવા ઉપરાંત, સિસ્ટમ કેવી રીતે ઉપયોગમાં લેવામાં આવે છે તે પણ બદલાય છે, જે હું વર્તન વલણને કૉલ કરું છું. દાખલા તરીકે, તુર્કીમાં 2013 ઑક્યુપિ ગેઝી વિરોધ પ્રદર્શન દરમિયાન, વિરોધીઓએ હેશટેગ્સનો ઉપયોગ બદલ્યો છે કારણ કે વિરોધનો વિકાસ થયો છે. અહીં કેવી રીતે ઝેનેપ તુફ્કી (2014) વર્તન વલણ વર્ણવે છે, જે તે શોધવામાં સક્ષમ હતી કારણ કે તે ટ્વિટર પર અને વ્યક્તિમાં વર્તન નિરીક્ષણ કરતી હતી:

"શું થયું હતું તે જલદી વિરોધ પ્રબળ બન્યો, મોટાભાગના લોકો ... નવી ઘટના પર ધ્યાન દોરવા સિવાય હેશટેગનો ઉપયોગ કરવાનું બંધ કરી દીધું ... જ્યારે વિરોધ ચાલુ રહ્યો, અને તે પણ તીવ્ર બન્યો, હેશટેગ્સ મૃત્યુ પામ્યા હતા ઇન્ટરવ્યૂઝે આ માટે બે કારણો રજૂ કર્યા. પ્રથમ, એકવાર દરેક વિષયને જાણતા હતા, હેશટેગ અક્ષર-મર્યાદિત ટ્વિટર પ્લેટફોર્મ પર એક વખત અનાવશ્યક અને ઉડાઉ હતી. બીજું, હેશટેગ્સ કોઈ વિશિષ્ટ વિષય પર ધ્યાન આકર્ષિત કરવા માટે માત્ર એટલું જ ઉપયોગી હતું, તે વિશે વાત કરવા માટે નહીં. "

આમ, સંશોધકો છે, જેઓ વિરોધ સંબંધિત hashtags સાથે ટ્વીટ્સ વિશ્લેષણ દ્વારા વિરોધ અભ્યાસ કરવામાં આવ્યા હતા શું આ વર્તણૂક વલણની કારણ કે બની રહ્યું હતું એક વિકૃત અર્થમાં હશે. ઉદાહરણ તરીકે, તેઓ માને છે કે શકે છે કે વિરોધ ચર્ચા લાંબા ઘટાડો પહેલાં તે ખરેખર ઘટાડો થયો છે.

ડ્રિફ્ટ ત્રીજા પ્રકારની સિસ્ટમ ડ્રિફ્ટ છે. આ કિસ્સામાં, તે લોકો બદલાતા નથી અથવા તેમની વર્તણૂક બદલાતી નથી, પરંતુ સિસ્ટમ પોતે બદલાતી રહે છે. ઉદાહરણ તરીકે, સમય જતાં ફેસબુકએ સ્થિતિ અપડેટ્સની લંબાઈ પર મર્યાદા વધારી છે. આ રીતે, સ્થિતિના સુધારાઓનો કોઈ સમાંતર અભ્યાસ આ પરિવર્તનને કારણે થતી વસ્તુઓનો સંવેદનશીલ હશે. સિસ્ટમ ડ્રિફ્ટ એલ્ગોરિધમિક સમન્વય કહેવાય સમસ્યા સાથે નજીકથી સંબંધિત છે, જે હું કલમ 2.3.8 માં આવરી કરીશું.

નિષ્કર્ષ પર, ઘણા મોટા ડેટા સ્ત્રોતો તેનો ઉપયોગ કરી રહ્યા છે તેના બદલાવને કારણે, તેઓ કેવી રીતે ઉપયોગમાં લેવામાં આવે છે, અને કેવી રીતે સિસ્ટમો કાર્ય કરે છે તેના કારણે બદલાતા રહે છે. ફેરફારના આ સ્ત્રોત ક્યારેક રસપ્રદ સંશોધન પ્રશ્નો હોય છે, પરંતુ આ ફેરફારો સમયાંતરે લાંબા ગાળાના ફેરફારોને ટ્રેક કરવા મોટા ડેટા સ્ત્રોતોની ક્ષમતાને જટિલ કરે છે.