2.1 ಪರಿಚಯ

ಅನಲಾಗ್ ವಯಸ್ಸಿನಲ್ಲಿ, ನಡವಳಿಕೆಯ ಬಗ್ಗೆ ಮಾಹಿತಿ ಸಂಗ್ರಹಿಸುವುದು-ಯಾರು, ಮತ್ತು ಯಾವಾಗ-ದುಬಾರಿ, ಮತ್ತು ಆದ್ದರಿಂದ ತುಲನಾತ್ಮಕವಾಗಿ ಅಪರೂಪ. ಈಗ, ಡಿಜಿಟಲ್ ಯುಗದಲ್ಲಿ, ಬಿಲಿಯನ್ಗಟ್ಟಲೆ ಜನರ ನಡವಳಿಕೆಗಳನ್ನು ದಾಖಲಿಸಲಾಗುತ್ತದೆ, ಸಂಗ್ರಹಿಸಲಾಗುತ್ತದೆ ಮತ್ತು ವಿಶ್ಲೇಷಿಸಬಹುದಾಗಿದೆ. ಉದಾಹರಣೆಗೆ, ನೀವು ವೆಬ್ಸೈಟ್ನಲ್ಲಿ ಕ್ಲಿಕ್ ಮಾಡಿದ ಪ್ರತಿ ಬಾರಿಯೂ ನಿಮ್ಮ ಮೊಬೈಲ್ ಫೋನ್ನಲ್ಲಿ ಕರೆ ಮಾಡಿ ಅಥವಾ ನಿಮ್ಮ ಕ್ರೆಡಿಟ್ ಕಾರ್ಡ್ನೊಂದಿಗೆ ಏನನ್ನಾದರೂ ಪಾವತಿಸಿ, ನಿಮ್ಮ ನಡವಳಿಕೆಯ ಡಿಜಿಟಲ್ ದಾಖಲೆಯನ್ನು ರಚಿಸಲಾಗಿದೆ ಮತ್ತು ವ್ಯವಹಾರದಿಂದ ಸಂಗ್ರಹಿಸಲಾಗುತ್ತದೆ. ಈ ವಿಧದ ಮಾಹಿತಿಯು ಜನರ ದೈನಂದಿನ ಕ್ರಿಯೆಗಳ ಒಂದು ಉಪಉತ್ಪನ್ನವಾಗಿದ್ದು, ಅವುಗಳನ್ನು ಡಿಜಿಟಲ್ ಟ್ರೇಸಸ್ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ. ವ್ಯವಹಾರಗಳು ನಡೆಸಿದ ಈ ಕುರುಹುಗಳನ್ನು ಹೊರತುಪಡಿಸಿ, ಸರ್ಕಾರಗಳು ಕೂಡಾ ಜನರು ಮತ್ತು ವ್ಯವಹಾರಗಳ ಬಗ್ಗೆ ನಂಬಲಾಗದಷ್ಟು ಶ್ರೀಮಂತ ಮಾಹಿತಿಯನ್ನು ಹೊಂದಿವೆ. ಈ ವ್ಯವಹಾರ ಮತ್ತು ಸರ್ಕಾರಿ ದಾಖಲೆಗಳನ್ನು ಒಟ್ಟಾಗಿ ದೊಡ್ಡ ಡೇಟಾ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ.

ದೊಡ್ಡ ಮಾಹಿತಿಯ ನಿರಂತರ ಪ್ರವಾಹದ ಅರ್ಥವೇನೆಂದರೆ ನಡವಳಿಕೆಯ ದತ್ತಾಂಶವು ಸಮೃದ್ಧವಾಗಿರುವ ಜಗತ್ತಿಗೆ ನಡವಳಿಕೆಯ ಮಾಹಿತಿಯು ವಿರಳವಾಗಿರುವುದರಿಂದ ನಾವು ಪ್ರಪಂಚದಿಂದ ಸ್ಥಳಾಂತರಗೊಂಡಿದ್ದೇವೆ. ದೊಡ್ಡ ಡೇಟಾದಿಂದ ಕಲಿತುಕೊಳ್ಳುವ ಒಂದು ಮೊದಲ ಹೆಜ್ಜೆ ಇದು ಅನೇಕ ವರ್ಷಗಳವರೆಗೆ ಸಾಮಾಜಿಕ ಸಂಶೋಧನೆಗಾಗಿ ಬಳಸಲಾದ ಡೇಟಾದ ಒಂದು ವಿಶಾಲವಾದ ವರ್ಗ ಭಾಗವಾಗಿದೆ ಎಂದು ಅರಿತುಕೊಂಡಿದೆ: ಅವಲೋಕನದ ಡೇಟಾ . ಸ್ಥೂಲವಾಗಿ, ವೀಕ್ಷಣೆಯ ಮಾಹಿತಿಯು ಸಾಮಾಜಿಕ ವ್ಯವಸ್ಥೆಯನ್ನು ಕೆಲವು ರೀತಿಯಲ್ಲಿ ಮಧ್ಯಸ್ಥಿಸದೆ ವೀಕ್ಷಿಸುವುದರಿಂದ ಉಂಟಾದ ಯಾವುದೇ ಡೇಟಾ. ಅದರ ಬಗ್ಗೆ ಯೋಚಿಸಲು ಕಚ್ಚಾ ಮಾರ್ಗವೆಂದರೆ ವೀಕ್ಷಣೆ ಮಾಹಿತಿಯು ಜನರು (ಉದಾ, ಸಮೀಕ್ಷೆಗಳು, 3 ನೇ ಅಧ್ಯಾಯದ ವಿಷಯ) ಮಾತನಾಡುವುದನ್ನು ಒಳಗೊಂಡಿರುವುದಿಲ್ಲ ಅಥವಾ ಜನರ ವಾತಾವರಣವನ್ನು ಬದಲಾಯಿಸುವುದು (ಉದಾಹರಣೆಗೆ, ಅಧ್ಯಾಯ 4 ರ ವಿಷಯ). ಹೀಗಾಗಿ, ವ್ಯವಹಾರ ಮತ್ತು ಸರ್ಕಾರಿ ದಾಖಲೆಗಳ ಜೊತೆಗೆ, ಅವಲೋಕನದ ಮಾಹಿತಿಯು ವೃತ್ತಪತ್ರಿಕೆ ಲೇಖನಗಳು ಮತ್ತು ಉಪಗ್ರಹ ಫೋಟೋಗಳ ಪಠ್ಯವನ್ನು ಒಳಗೊಂಡಿದೆ.

ಈ ಅಧ್ಯಾಯವು ಮೂರು ಭಾಗಗಳನ್ನು ಹೊಂದಿದೆ. ಮೊದಲನೆಯದಾಗಿ, ವಿಭಾಗ 2.2 ರಲ್ಲಿ ನಾನು ದೊಡ್ಡ ಡೇಟಾ ಮೂಲಗಳನ್ನು ಹೆಚ್ಚು ವಿವರವಾಗಿ ವಿವರಿಸುತ್ತೇನೆ ಮತ್ತು ಅವುಗಳನ್ನು ಹಿಂದೆ ಮತ್ತು ಹಿಂದೆ ಸಾಮಾಜಿಕ ಸಂಶೋಧನೆಗೆ ಬಳಸಿದ ಡೇಟಾಗಳ ನಡುವೆ ಮೂಲಭೂತ ವ್ಯತ್ಯಾಸವನ್ನು ವಿವರಿಸುತ್ತೇನೆ. ನಂತರ, ವಿಭಾಗ 2.3 ರಲ್ಲಿ, ನಾನು ದೊಡ್ಡ ಡೇಟಾ ಮೂಲಗಳ ಹತ್ತು ಸಾಮಾನ್ಯ ಗುಣಲಕ್ಷಣಗಳನ್ನು ವಿವರಿಸುತ್ತೇನೆ. ಈ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಅರ್ಥೈಸಿಕೊಳ್ಳುವುದು ಅಸ್ತಿತ್ವದಲ್ಲಿರುವ ಮೂಲಗಳ ಸಾಮರ್ಥ್ಯ ಮತ್ತು ದೌರ್ಬಲ್ಯಗಳನ್ನು ತ್ವರಿತವಾಗಿ ಗುರುತಿಸಲು ನಿಮಗೆ ಅನುವು ಮಾಡಿಕೊಡುತ್ತದೆ ಮತ್ತು ಭವಿಷ್ಯದಲ್ಲಿ ಲಭ್ಯವಾಗುವ ಹೊಸ ಮೂಲಗಳನ್ನು ನಿವಾರಿಸಲು ನಿಮಗೆ ಸಹಾಯ ಮಾಡುತ್ತದೆ. ಅಂತಿಮವಾಗಿ, ವಿಭಾಗ 2.4 ರಲ್ಲಿ, ನಾನು ಮೂರು ಪ್ರಮುಖ ಸಂಶೋಧನಾ ಕಾರ್ಯತಂತ್ರಗಳನ್ನು ವಿವರಿಸುತ್ತೇನೆ, ಇದು ನೀವು ವೀಕ್ಷಣೆ ದತ್ತಾಂಶದಿಂದ ಕಲಿಯಲು ಬಳಸಿಕೊಳ್ಳಬಹುದು: ವಿಷಯಗಳನ್ನು ಎಣಿಸುವುದು, ವಿಷಯಗಳನ್ನು ಮುಂಗಾಣುವುದು ಮತ್ತು ಪ್ರಯೋಗವನ್ನು ಅಂದಾಜು ಮಾಡುವುದು.