2.3.2 എല്ലായ്പ്പോഴും ഓണാണ്

എല്ലായ്പ്പോഴും-ന് ബിഗ് ഡാറ്റ അപ്രതീക്ഷിത ഇവന്റുകൾ തത്സമയ അളവിന്റെ പഠനം സജ്ജമാക്കുന്നു.

പല വൻകിട ഡേറ്റാ സിസ്റ്റംസ് എപ്പോഴും ഓൺ-ആകുന്നു; അവർ നിരന്തരം ഡാറ്റ ശേഖരിക്കുന്നത്. ഇത് എപ്പോഴും മുഖമുദ്ര രേഖാംശ ഡാറ്റ (അതായത്, കാലാകാലങ്ങളിൽ ഡാറ്റ) ഉപയോഗിച്ച് ഗവേഷകർ ലഭ്യമാക്കുന്നു. എപ്പോഴും ഒരാളായി റിസർച്ച് രണ്ട് പ്രധാന പ്രാധാന്യമുണ്ടെന്ന്.

ഒന്നാമതായി, ഡാറ്റ ശേഖരത്തിൽ എല്ലായ്പ്പോഴും സാധിക്കാത്ത വിധത്തിൽ അപ്രതീക്ഷിത സംഭവങ്ങളെ കുറിച്ച് പഠിക്കാൻ ഗവേഷകർക്ക് കഴിയും. ഉദാഹരണമായി, 2013 ലെ വേനൽക്കാലത്ത് തുർക്കിയിലെ ജിസി ഏറ്റെടുക്കുന്നതിൽ താല്പര്യമുള്ള ഗവേഷകർ, പ്രതിഷേധപ്രകടനക്കാരുടെ പെരുമാറ്റം ശ്രദ്ധയിൽപെടും. Ceren Budak ഉം Duncan Watts ഉം (2015) ട്വിറ്റർ എല്ലായ്പ്പോഴും ട്വിറ്റർ ഉപയോഗിച്ചു കൊണ്ട് കൂടുതൽ കാര്യങ്ങൾ ചെയ്യാൻ സാധിച്ചു. കൂടാതെ, ഇവന് മുമ്പും, അതിനുശേഷവും, സംഭവത്തിനു ശേഷവും (non-partisanipants) താരതമ്യഘടന സൃഷ്ടിക്കാൻ കഴിഞ്ഞിട്ടുണ്ട് (ചിത്രം 2.2). മൊത്തത്തിൽ, അവരുടെ മുൻ പോസ്റ്റ് പാനലിൽ രണ്ട് വർഷത്തെ 30,000 ആളുകളുടെ ട്വീറ്റുകൾ ഉൾപ്പെടുന്നു. ഈ വിവരങ്ങളോടൊപ്പം സാധാരണയായി ഉപയോഗിക്കുന്ന വിവരങ്ങളുടെ വർദ്ധനവ് മൂലം, ബഡക്, വാട്ട്സ് എന്നിവർ കൂടുതൽ കൂടുതൽ പഠിക്കുവാൻ തുടങ്ങി: ഗീസി പ്രക്ഷോഭങ്ങളിൽ പങ്കെടുക്കാൻ കൂടുതൽ ആളുകൾ എങ്ങനെയുള്ള ആളുകളാണ് എന്ന് അവർ കണക്കുകൂട്ടാൻ കഴിഞ്ഞു. ഹ്രസ്വ കാലഘട്ടത്തിൽ (ഗീസി കാലഘട്ടത്തെ താരതമ്യം ചെയ്യുക), ദീർഘകാലാടിസ്ഥാനത്തിൽ (പോസ്റ്റ്-ഗൈസി പോസ്റ്റ്കോട് ചേർത്ത് ഗജി).

ചിത്രം 2.2: 2013 വേനൽക്കാലത്ത് തുർക്കിക്കിൽ തുർക്കിയിലെ ജിസി പ്രക്ഷോഭങ്ങളെക്കുറിച്ച് പഠിക്കാൻ ബഡാക്കും വാറ്റ്സ്സും (2015) ഉപയോഗിച്ചിരുന്ന ഡിസൈൻ. ഗവേഷകരാണ് ട്വിറ്ററിന്റെ സ്വഭാവം ഉപയോഗിച്ച്, രണ്ട് വർഷത്തിനുള്ളിൽ 30,000 ആൾക്കാർ. പ്രതിഷേധങ്ങളിൽ പങ്കെടുക്കുന്നവരിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്ന ഒരു സാധാരണ പഠനത്തിന് വിപരീതമായി, മുൻ പോസ്റ്റ് പാനൽ 1) ഇവന്റിന് മുമ്പും ശേഷവും പങ്കെടുക്കുന്നവരിൽ നിന്നുള്ള ഡാറ്റയും 2) ഡേറ്റായും മുൻപും, അതിനു ശേഷവും, പങ്കെടുക്കാത്തവരിൽ നിന്നുള്ള ഡാറ്റയും ചേർക്കുന്നു. ഈ സമൃദ്ധമായ ഡേറ്റാ ഘടന ബഡാക്കിന്റേയും വാട്ടുടേയും ഭാഗമായി ഗീസി പ്രക്ഷോഭങ്ങളിൽ പങ്കുചേരാൻ കൂടുതൽ സാധ്യതയുള്ളതും, ഹ്രസ്വ കാലഘട്ടത്തിൽ (പങ്കെടുക്കുന്ന പ്രീ-ഗൈസി, ജിസി ) ദീർഘകാലാടിസ്ഥാനത്തിൽ (പോസ്റ്റ്ഗീസിനു മുൻപുള്ള ഗീസി താരതമ്യം ചെയ്യുക).

ചിത്രം 2.2: ഉപയോഗിക്കുന്ന ഡിസൈൻ Budak and Watts (2015) 2013-ലെ വേനൽക്കാലത്ത്, തുർക്കി ലെ ഗെജി പ്രതിഷേധം പിടിച്ചടക്കൽ എപ്പോഴും ട്വിറ്റർ സ്വഭാവം, ഗവേഷകർ ഏകദേശം അടങ്ങിയ ഒരു മുൻ പോസ്റ്റ് പാനൽ എന്ന സൃഷ്ടിച്ചു ഉപയോഗിക്കുന്നതിലൂടെ പഠിക്കാൻ രണ്ട് വർഷത്തിനുള്ളിൽ 30,000 ആൾക്കാർ. പ്രതിഷേധങ്ങളിൽ പങ്കെടുക്കുന്നവരിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്ന ഒരു സാധാരണ പഠനത്തിന് വിപരീതമായി, മുൻ പോസ്റ്റ് പാനൽ 1) ഇവന്റിന് മുമ്പും ശേഷവും പങ്കെടുക്കുന്നവരിൽ നിന്നുള്ള ഡാറ്റയും 2) ഡേറ്റായും മുൻപും, അതിനു ശേഷവും, പങ്കെടുക്കാത്തവരിൽ നിന്നുള്ള ഡാറ്റയും ചേർക്കുന്നു. ഈ സമൃദ്ധമായ ഡേറ്റാ ഘടന ബഡാക്കിന്റേയും വാട്ടുടേയും ഭാഗമായി ഗീസി പ്രക്ഷോഭങ്ങളിൽ പങ്കുചേരാൻ കൂടുതൽ സാധ്യതയുള്ളതും, ഹ്രസ്വ കാലഘട്ടത്തിൽ (പങ്കെടുക്കുന്ന പ്രീ-ഗൈസി, ജിസി ) ദീർഘകാലാടിസ്ഥാനത്തിൽ (പോസ്റ്റ്ഗീസിനു മുൻപുള്ള ഗീസി താരതമ്യം ചെയ്യുക).

ഡാറ്റാ ശേഖരണ സ്രോതസ്സുകളിൽ (ഉദാഹരണത്തിന്, ദീർഘകാലാടിസ്ഥാനത്തിലുള്ള മനോഭാവം കണക്കിലെടുക്കാതെ) ഈ കണക്കുകൂട്ടലുകളിൽ ചിലത് ഉണ്ടായിരിക്കാമെന്നാണ് ഒരു നിഗമനത്തിൽ ചൂണ്ടിക്കാണിക്കപ്പെടുന്നത്. ഇത് ശരിയാണ്, 30,000 ആളുകൾക്ക് ഇത്തരത്തിലുള്ള ഡാറ്റ ശേഖരണം ഉണ്ടായിരുന്നെങ്കിൽ ചെലവേറിയത് എന്നിരുന്നാലും, പരിമിതിയില്ലാത്ത ബജറ്റ് പോലും, ഗവേഷകർക്ക് സമയത്തിൽ തിരികെ പോകാനും നേരിട്ട് പങ്കെടുക്കുന്നവരുടെ പെരുമാറ്റത്തെ നേരിട്ട് നിരീക്ഷിക്കാനും കഴിയുന്ന മറ്റേതെങ്കിലും രീതിയെക്കുറിച്ച് എനിക്ക് ചിന്തിക്കാനാവില്ല. ഏറ്റവും മികച്ച ബദൽ പെരുമാറ്റരീതികളുടെ മുൻകാല റിപ്പോർട്ടുകൾ ശേഖരിക്കുക എന്നതാണ്, എന്നാൽ ഈ റിപ്പോർട്ടുകൾ പരിമിതമായ ഗ്രാനുലാരിറ്റിയും സംശയാസ്പദമായ കൃത്യതയും ആയിരിക്കും. ഒരു അപ്രതീക്ഷിത പരിപാടി പഠിക്കാൻ എല്ലായ്പ്പോഴും ഒരു ഡാറ്റ ഉറവിടം ഉപയോഗിക്കുന്ന പഠനങ്ങളുടെ ഉദാഹരണം പട്ടിക 2.1 നൽകുന്നു.

പട്ടിക 2.1: എല്ലായ്പ്പോഴും വലിയ ഡാറ്റ ഉറവിടങ്ങൾ ഉപയോഗിച്ച് അപ്രതീക്ഷിത പരിപാടികളുടെ പഠനങ്ങൾ.
അപ്രതീക്ഷിത ഇവന്റ് എല്ലായ്പ്പോഴും ഡാറ്റ ഉറവിടത്തിൽ ഉദ്ധരണി
ടർക്കിയിൽ ഗീസി പ്രസ്ഥാനം നയിക്കുക ട്വിറ്റർ Budak and Watts (2015)
ഹോംഗ്കോങ്ങിലെ കുണ്ടപ്രതിഷേധം വെയ്ബോ Zhang (2016)
ന്യൂ യോർക്ക് നഗരത്തിലെ പോലീസ് വെടിയുതിർത്ത് സ്റ്റോപ്പ് ആൻഡ് ഫിഷർക് റിപ്പോർട്ടുകൾ Legewie (2016)
ഐസിസ്സിൽ ചേരുന്ന വ്യക്തി ട്വിറ്റർ Magdy, Darwish, and Weber (2016)
സെപ്റ്റംബർ 11, 2001 ആക്രമണം livejournal.com Cohn, Mehl, and Pennebaker (2004)
സെപ്റ്റംബർ 11, 2001 ആക്രമണം പേജർ സന്ദേശങ്ങൾ Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

അപ്രതീക്ഷിത പരിപാടികൾ പഠിക്കുന്നതിനു പുറമേ, എല്ലായ്പ്പോഴും വലിയ ഡാറ്റാ സംവിധാനങ്ങൾ ഗവേഷകരെ യഥാസമയ അവലോകനങ്ങളാക്കാൻ സഹായിക്കുന്നു. പോളിസി നിർമ്മാതാക്കളായ-സർക്കാർ അല്ലെങ്കിൽ വ്യവസായത്തിൽ-സാഹചര്യങ്ങളിൽ അവബോധം അടിസ്ഥാനമാക്കി പ്രതികരിക്കാൻ ആഗ്രഹിക്കുന്ന സംവിധാനങ്ങളിൽ ഇത് പ്രധാനമാണ്. ഉദാഹരണത്തിന്, പ്രകൃതി ദുരന്തങ്ങൾക്ക് (Castillo 2016) അടിയന്തിര പ്രതികരണം നൽകുന്നതിന് സോഷ്യൽ മീഡിയ ഡാറ്റ ഉപയോഗിക്കാനും, വിവിധ വലിയ ഡാറ്റാ ഉറവിടങ്ങൾ സാമ്പത്തിക പ്രവർത്തനത്തിന്റെ (Choi and Varian 2012) യഥാസമയ (Choi and Varian 2012) സൃഷ്ടിക്കാൻ ഉപയോഗിക്കും.

ഉപസംഹാരമായി, എല്ലായ്പ്പോഴും ഡാറ്റ സംവിധാനങ്ങൾ ഗവേഷകരെ അപ്രതീക്ഷിത പരിപാടികൾ പഠിക്കാനും നയ നിർമാതാക്കൾക്ക് തൽസമയ വിവരങ്ങൾ ലഭ്യമാക്കാനും പ്രാപ്തമാക്കും. വളരെയധികം സമയങ്ങളിൽ ട്രാക്കുചെയ്യൽ മാറ്റങ്ങൾക്കായി എല്ലായ്പ്പോഴും ഡാറ്റ സിസ്റ്റങ്ങൾക്ക് യോജിച്ചതായി ഞാൻ കരുതുന്നില്ല. പല വലിയ ഡാറ്റ സിസ്റ്റങ്ങൾ നിരന്തരം മാറിക്കൊണ്ടിരിക്കുന്ന-ഒരു കാരണം ഞാൻ അധ്യായം (ഭാഗം ൨.൩.൭) പിന്നീട് ചായ് വിളിക്കാം ആ പ്രക്രിയ എന്നതാണ്.