2.3.7 ಡ್ರಿಫ್ಟಿಂಗ್

ಜನಸಾಂದ್ರತೆಯ ಡ್ರಿಫ್ಟ್, ಬಳಕೆಯ ಡ್ರಿಫ್ಟ್, ಮತ್ತು ಸಿಸ್ಟಮ್ ಡ್ರಿಫ್ಟ್ಗಳು ದೀರ್ಘಾವಧಿಯ ಪ್ರವೃತ್ತಿಯನ್ನು ಅಧ್ಯಯನ ಮಾಡಲು ದೊಡ್ಡ ಡೇಟಾ ಮೂಲಗಳನ್ನು ಬಳಸಲು ಕಷ್ಟವಾಗಿಸುತ್ತವೆ.

ಅನೇಕ ದೊಡ್ಡ ಡೇಟಾ ಮೂಲಗಳ ಉತ್ತಮ ಪ್ರಯೋಜನವೆಂದರೆ ಅವುಗಳು ಕಾಲಕಾಲಕ್ಕೆ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸುತ್ತವೆ. ಸಾಮಾಜಿಕ ವಿಜ್ಞಾನಿಗಳು ಈ ರೀತಿಯ ಅತಿ-ಸಮಯದ ದತ್ತಾಂಶವನ್ನು ದೀರ್ಘಾವಧಿಯ ಡೇಟಾ ಎಂದು ಕರೆಯುತ್ತಾರೆ . ಮತ್ತು, ನೈಸರ್ಗಿಕವಾಗಿ, ಬದಲಾವಣೆಯನ್ನು ಅಧ್ಯಯನ ಮಾಡಲು ಉದ್ದವಾದ ಡೇಟಾ ಬಹಳ ಮುಖ್ಯ. ವಿಶ್ವಾಸಾರ್ಹವಾಗಿ ಬದಲಾವಣೆಯನ್ನು ಅಳತೆ ಮಾಡಲು, ಆದಾಗ್ಯೂ, ಮಾಪನ ವ್ಯವಸ್ಥೆಯು ಸ್ವತಃ ಸ್ಥಿರವಾಗಿರಬೇಕು. ಸಮಾಜಶಾಸ್ತ್ರಜ್ಞ ಓಟಿಸ್ ಡಡ್ಲಿ ಡಂಕನ್ ಅವರ ಮಾತುಗಳಲ್ಲಿ, "ನೀವು ಬದಲಾವಣೆಯನ್ನು ಅಳೆಯಲು ಬಯಸಿದರೆ, ಅಳತೆಯನ್ನು ಬದಲಾಯಿಸಬೇಡಿ" (Fischer 2011) .

ದುರದೃಷ್ಟವಶಾತ್, ಹಲವಾರು ದೊಡ್ಡ ಡೇಟಾ ವ್ಯವಸ್ಥೆಗಳು-ವಿಶೇಷವಾಗಿ ವ್ಯವಹಾರ ವ್ಯವಸ್ಥೆಗಳು-ಎಲ್ಲಾ ಸಮಯದಲ್ಲೂ ಬದಲಾಗುತ್ತಿವೆ, ನಾನು ಡ್ರಿಫ್ಟ್ ಎಂದು ಕರೆಯುವ ಪ್ರಕ್ರಿಯೆ. ನಿರ್ದಿಷ್ಟವಾಗಿ ಹೇಳುವುದಾದರೆ, ಈ ವ್ಯವಸ್ಥೆಗಳು ಮೂರು ಪ್ರಮುಖ ವಿಧಾನಗಳಲ್ಲಿ ಬದಲಾಗುತ್ತವೆ: ಜನಸಂಖ್ಯೆಯ ಡ್ರಿಫ್ಟ್ (ಅವುಗಳನ್ನು ಯಾರು ಬಳಸುತ್ತಾರೆ), ವರ್ತನೆಯ ಡ್ರಿಫ್ಟ್ (ಜನರು ಹೇಗೆ ಬಳಸುತ್ತಾರೆ ಎಂಬುದನ್ನು ಬದಲಾಯಿಸುವುದು), ಮತ್ತು ಸಿಸ್ಟಮ್ ಡ್ರಿಫ್ಟ್ ( ಸಿಸ್ಟಮ್ನಲ್ಲಿ ಬದಲಾವಣೆ). ಮೂರು ದಿಕ್ಕುಗಳ ಮೂಲವೆಂದರೆ, ಒಂದು ದೊಡ್ಡ ದತ್ತಾಂಶ ಮೂಲದ ಯಾವುದೇ ಮಾದರಿಯು ಪ್ರಪಂಚದ ಪ್ರಮುಖ ಬದಲಾವಣೆಯಿಂದ ಉಂಟಾಗಿರಬಹುದು, ಅಥವಾ ಅದು ಕೆಲವು ರೀತಿಯ ಡ್ರಿಫ್ಟ್ನಿಂದ ಉಂಟಾಗುತ್ತದೆ.

ಡ್ರಿಫ್ಟ್-ಜನಸಂಖ್ಯೆಯ ಡ್ರಿಫ್ಟ್ನ ಮೊದಲ ಮೂಲವು ಯಾರು ವ್ಯವಸ್ಥೆಯನ್ನು ಬಳಸುತ್ತಿರುವ ಬದಲಾವಣೆಗಳಿಂದ ಉಂಟಾಗುತ್ತದೆ, ಮತ್ತು ಈ ಬದಲಾವಣೆಗಳು ಸಣ್ಣ ಮತ್ತು ದೀರ್ಘಕಾಲೀನ ಸಮಯಗಳಲ್ಲಿ ಸಂಭವಿಸಬಹುದು. ಉದಾಹರಣೆಗೆ, 2012 ರ ಯುಎಸ್ ಅಧ್ಯಕ್ಷೀಯ ಚುನಾವಣೆಯ ಸಮಯದಲ್ಲಿ ಮಹಿಳೆಯರು ಬರೆದ ರಾಜಕೀಯದ ಬಗ್ಗೆ ಟ್ವೀಟ್ಗಳ ಪ್ರಮಾಣ ದಿನದಿಂದ ದಿನಕ್ಕೆ ಏರಿತು (Diaz et al. 2016) . ಹೀಗಾಗಿ, ಟ್ವಿಟರ್-ಪದ್ಯದ ಮನಸ್ಥಿತಿಯಲ್ಲಿ ಬದಲಾವಣೆಯನ್ನು ಕಾಣುವವರು ಯಾವ ಸಮಯದಲ್ಲಾದರೂ ಮಾತನಾಡುತ್ತಿರುವವರಲ್ಲಿ ಒಂದು ಬದಲಾವಣೆಯೇ ಆಗಿರಬಹುದು. ಈ ಅಲ್ಪಾವಧಿಯ ಏರಿಳಿತಗಳಿಗೆ ಹೆಚ್ಚುವರಿಯಾಗಿ, ಕೆಲವು ಜನಸಂಖ್ಯಾ ಗುಂಪುಗಳ ಟ್ವಿಟ್ಟರ್ ಅನ್ನು ಅಳವಡಿಸಿ ಮತ್ತು ತ್ಯಜಿಸುವ ದೀರ್ಘಕಾಲೀನ ಪ್ರವೃತ್ತಿ ಕೂಡಾ ಇದೆ.

ಒಬ್ಬ ವ್ಯವಸ್ಥೆಯನ್ನು ಯಾರು ಬಳಸುತ್ತಿದ್ದಾರೆ ಎಂಬ ಬದಲಾವಣೆಗಳ ಜೊತೆಗೆ, ವ್ಯವಸ್ಥೆಯನ್ನು ಹೇಗೆ ಬಳಸಲಾಗುತ್ತದೆ ಎಂಬ ಬದಲಾವಣೆಗಳಿವೆ, ನಾನು ನಡವಳಿಕೆಯ ಡ್ರಿಫ್ಟ್ ಎಂದು ಕರೆಯುತ್ತಿದ್ದೇನೆ. ಉದಾಹರಣೆಗೆ, ಟರ್ಕಿಯ 2013 ರ ಗಜಿ ಪ್ರತಿಭಟನೆಯಲ್ಲಿ, ಪ್ರತಿಭಟನಾಕಾರರು ವಿರೋಧಿ ಪ್ರತಿಭಟನೆಯಂತೆ ಹ್ಯಾಶ್ಟ್ಯಾಗ್ಗಳ ಬಳಕೆಯನ್ನು ಬದಲಾಯಿಸಿದರು. ಜೆಯೆನೆಪ್ ಟುಫೆಕ್ಕಿ (2014) ಹೇಗೆ ವರ್ತನೆಯ ಡ್ರಿಫ್ಟ್ ಅನ್ನು ವಿವರಿಸಿದ್ದಾಳೆ, ಆಕೆ ಪತ್ತೆಹಚ್ಚಲು ಸಾಧ್ಯವಾಯಿತು ಏಕೆಂದರೆ ಅವರು ಟ್ವಿಟ್ಟರ್ನಲ್ಲಿ ಮತ್ತು ವೈಯಕ್ತಿಕವಾಗಿ ವರ್ತಿಸುವುದನ್ನು ಗಮನಿಸುತ್ತಿದ್ದರು:

"ಏನು ನಡೆಯುತ್ತಿದೆ ಎಂದು ಪ್ರತಿಭಟನೆಯು ಪ್ರಬಲ ಕಥೆಯಾಯಿತು, ಹೆಚ್ಚಿನ ಸಂಖ್ಯೆಯ ಜನರು ... ಒಂದು ಹೊಸ ವಿದ್ಯಮಾನಕ್ಕೆ ಗಮನವನ್ನು ಸೆಳೆಯಲು ಹೊರತುಪಡಿಸಿ ಹ್ಯಾಶ್ಟ್ಯಾಗ್ಗಳನ್ನು ಬಳಸುವುದನ್ನು ನಿಲ್ಲಿಸಿದರು ... ಪ್ರತಿಭಟನೆಗಳು ಮುಂದುವರಿದವು ಮತ್ತು ಇನ್ನೂ ತೀವ್ರಗೊಂಡವು, ಹ್ಯಾಶ್ಟ್ಯಾಗ್ಗಳು ನಿಧನರಾದರು. ಇಂಟರ್ವ್ಯೂ ಈ ಎರಡು ಕಾರಣಗಳನ್ನು ಬಹಿರಂಗಪಡಿಸಿತು. ಮೊದಲನೆಯದಾಗಿ, ಪ್ರತಿಯೊಬ್ಬರೂ ವಿಷಯವನ್ನು ತಿಳಿದಿರುವಾಗ, ಹ್ಯಾಶ್ಟ್ಯಾಗ್ ಒಮ್ಮೆ ಪಾತ್ರ-ಸೀಮಿತ ಟ್ವಿಟರ್ ಪ್ಲಾಟ್ಫಾರ್ಮ್ನಲ್ಲಿ ಅತೀವವಾಗಿ ಮತ್ತು ದುರ್ಬಲವಾಗಿತ್ತು. ಎರಡನೆಯದಾಗಿ, ಹ್ಯಾಶ್ಟ್ಯಾಗ್ಗಳು ನಿರ್ದಿಷ್ಟ ವಿಷಯದ ಬಗ್ಗೆ ಗಮನ ಸೆಳೆಯುವಲ್ಲಿ ಮಾತ್ರ ಉಪಯುಕ್ತವೆಂದು ಕಂಡುಬಂದಿದೆ, ಅದರ ಬಗ್ಗೆ ಮಾತನಾಡಲು ಅಲ್ಲ. "

ಹೀಗಾಗಿ, ಪ್ರತಿಭಟನೆ ಸಂಬಂಧಿತ ಹ್ಯಾಶ್ಟ್ಯಾಗ್ಗಳೊಂದಿಗೆ ಟ್ವಿಟ್ಗಳು ವಿಶ್ಲೇಷಿಸುವ ಮೂಲಕ ಪ್ರತಿಭಟನೆ ಓದುತ್ತಿದ್ದರು ಸಂಶೋಧಕರು ಏಕೆಂದರೆ ಈ ವರ್ತನೆಯ ಡ್ರಿಫ್ಟ್ ನಡೆಯುತ್ತಿದೆಯೆಂದು ಒಂದು ವಿಕೃತ ಅರ್ಥದಲ್ಲಿ ಹೊಂದಿರುತ್ತದೆ. ಉದಾಹರಣೆಗೆ, ಅವರು ವಾಸ್ತವವಾಗಿ ಕಡಿಮೆ ಮೊದಲಿಗೆ ಪ್ರತಿಭಟನೆಯ ಚರ್ಚೆ ದೀರ್ಘ ಕಡಿಮೆಗೊಳಿಸುವಂತೆ ನಂಬಿಕೆ ಇರಬಹುದು.

ಮೂರನೇ ರೀತಿಯ ಡ್ರಿಫ್ಟ್ ಸಿಸ್ಟಮ್ ಡ್ರಿಫ್ಟ್ ಆಗಿದೆ. ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಜನರು ಬದಲಾಗುತ್ತಿಲ್ಲ ಅಥವಾ ಅವರ ನಡವಳಿಕೆ ಬದಲಾಗುತ್ತಿಲ್ಲ, ಆದರೆ ವ್ಯವಸ್ಥೆಯು ಬದಲಾಗುತ್ತಿಲ್ಲ. ಉದಾಹರಣೆಗೆ, ಕಾಲಾನಂತರದಲ್ಲಿ ಫೇಸ್ಬುಕ್ ಸ್ಥಿತಿ ನವೀಕರಣಗಳ ಉದ್ದದ ಮಿತಿಯನ್ನು ಹೆಚ್ಚಿಸಿದೆ. ಹೀಗಾಗಿ, ಸ್ಥಿತಿಯ ನವೀಕರಣಗಳ ಯಾವುದೇ ದೀರ್ಘಾವಧಿಯ ಅಧ್ಯಯನವು ಈ ಬದಲಾವಣೆಯಿಂದ ಉಂಟಾಗುವ ಹಸ್ತಕೃತಿಗಳಿಗೆ ದುರ್ಬಲವಾಗಿರುತ್ತದೆ. ಸಿಸ್ಟಮ್ ಡ್ರಿಫ್ಟ್ ಅಲ್ಗಾರಿಥಮಿಕ್ ಗೊಂದಲ ಎಂಬ ಸಮಸ್ಯೆಗೆ ಸಂಬಂಧಿಸಿದೆ, ಇದು ನಾನು ವಿಭಾಗ 2.3.8 ರಲ್ಲಿ ರಕ್ಷಣೆ ಮಾಡುತ್ತೇವೆ.

ತೀರ್ಮಾನಿಸಲು, ಹಲವಾರು ದೊಡ್ಡ ಡೇಟಾ ಮೂಲಗಳು ಯಾರನ್ನು ಬಳಸುತ್ತಿದ್ದಾರೆ ಎಂಬ ಬದಲಾವಣೆಗಳಿಂದಾಗಿ, ಅವುಗಳು ಹೇಗೆ ಬಳಸಲ್ಪಡುತ್ತವೆ ಮತ್ತು ವ್ಯವಸ್ಥೆಗಳು ಹೇಗೆ ಕೆಲಸ ಮಾಡುತ್ತವೆ ಎಂಬ ಕಾರಣದಿಂದಾಗಿ ಡ್ರಿಫ್ಟಿಂಗ್ ಮಾಡಲಾಗುತ್ತದೆ. ಬದಲಾವಣೆಯ ಈ ಮೂಲಗಳು ಕೆಲವೊಮ್ಮೆ ಕುತೂಹಲಕಾರಿ ಸಂಶೋಧನಾ ಪ್ರಶ್ನೆಗಳು, ಆದರೆ ಈ ಬದಲಾವಣೆಗಳನ್ನು ದೀರ್ಘಕಾಲೀನ ಬದಲಾವಣೆಗಳನ್ನು ಕಾಲಾನಂತರದಲ್ಲಿ ಟ್ರ್ಯಾಕ್ ಮಾಡಲು ದೊಡ್ಡ ಡೇಟಾ ಮೂಲಗಳ ಸಾಮರ್ಥ್ಯವನ್ನು ಸಂಕೀರ್ಣಗೊಳಿಸುತ್ತದೆ.