5.2.1 ಗ್ಯಾಲಕ್ಸಿ ಝೂ

ಈ ಅನುವಾದ ಒಂದು ಕಂಪ್ಯೂಟರ್ ರಚಿಸಲಾಗಿದೆ. ×

5.2.1 ಗ್ಯಾಲಕ್ಸಿ ಝೂ

ಗ್ಯಾಲಕ್ಸಿ ಝೂ ಮಿಲಿಯನ್ ಗ್ಯಾಲಕ್ಸಿಗಳನ್ನು ವರ್ಗೀಕರಿಸಲು ಅನೇಕ ಪರಿಣಿತ ಸ್ವಯಂಸೇವಕರ ಪ್ರಯತ್ನಗಳನ್ನು ಸಂಯೋಜಿಸಿತು.

2007 ರಲ್ಲಿ ಆಕ್ಸ್ಫರ್ಡ್ ವಿಶ್ವವಿದ್ಯಾನಿಲಯದಲ್ಲಿ ಖಗೋಳವಿಜ್ಞಾನದ ಪದವೀಧರ ವಿದ್ಯಾರ್ಥಿ ಕೆವಿನ್ ಸ್ಕವಿನ್ಸ್ಕಿ ಅವರು ಎದುರಿಸುತ್ತಿರುವ ಸಮಸ್ಯೆಯಿಂದಾಗಿ ಗ್ಯಾಲಕ್ಸಿ ಝೂ ಎದುರಾಗಿದೆ. ಸ್ವಲ್ಪಮಟ್ಟಿಗೆ ಸರಳಗೊಳಿಸುವಿಕೆ, ಷಾವಿನ್ಸ್ಕಿ ಗೆಲಕ್ಸಿಗಳ ಬಗ್ಗೆ ಆಸಕ್ತರಾಗಿದ್ದರು ಮತ್ತು ಗ್ಯಾಲಕ್ಸಿಯನ್ನು ಅವುಗಳ ರೂಪವಿಜ್ಞಾನ-ಅಂಡಾಕಾರದ ಅಥವಾ ಸುರುಳಿಯಿಂದ ವರ್ಗೀಕರಿಸಬಹುದು ಮತ್ತು ಅವುಗಳ ಬಣ್ಣ-ನೀಲಿ ಅಥವಾ ಕೆಂಪು ಬಣ್ಣದಿಂದ. ಸಮಯದಲ್ಲಿ, ಖಗೋಳಶಾಸ್ತ್ರಜ್ಞರಲ್ಲಿ ಸಾಂಪ್ರದಾಯಿಕ ಬುದ್ಧಿವಂತಿಕೆಯು ನಮ್ಮ ಕ್ಷೀರ ಪಥದಂತಹ ಸುರುಳಿಯಾಕಾರದ ನಕ್ಷತ್ರಪುಂಜಗಳು ನೀಲಿ ಬಣ್ಣದಲ್ಲಿದೆ (ಯುವಕರನ್ನು ಸೂಚಿಸುತ್ತದೆ) ಮತ್ತು ಅಂಡಾಕಾರದ ನಕ್ಷತ್ರಪುಂಜಗಳು ಕೆಂಪು ಬಣ್ಣದ್ದಾಗಿವೆ (ಹಳೆಯ ವಯಸ್ಸನ್ನು ಸೂಚಿಸುತ್ತದೆ). ಷಾವಿನ್ಸ್ಕಿ ಈ ಸಾಂಪ್ರದಾಯಿಕ ಜ್ಞಾನವನ್ನು ಸಂಶಯಿಸುತ್ತಾನೆ. ಈ ಮಾದರಿಯು ಸಾಮಾನ್ಯವಾಗಿ ನಿಜವಾಗಿದ್ದರೂ, ಸಾಕಷ್ಟು ಸಂಖ್ಯೆಯ ವಿನಾಯಿತಿಗಳಿವೆ ಮತ್ತು ಈ ಅಪರೂಪದ ಗೆಲಕ್ಸಿಗಳ ಕುರಿತು ಅಧ್ಯಯನ ಮಾಡುವ ಮೂಲಕ-ನಿರೀಕ್ಷಿತ ಮಾದರಿಯು ಹೊಂದಿರದಂತಹವುಗಳನ್ನು-ಅವರು ಈ ಪ್ರಕ್ರಿಯೆಯ ಬಗ್ಗೆ ಏನನ್ನಾದರೂ ಕಲಿಯಬಹುದು ಗೆಲಕ್ಸಿಗಳು ರೂಪುಗೊಂಡವು.

ಹೀಗಾಗಿ, ಸಾಂಪ್ರದಾಯಿಕ ಬುದ್ಧಿವಂತಿಕೆಯನ್ನು ಉಲ್ಲಂಘಿಸುವ ಸಲುವಾಗಿ ಸ್ಕಾವಿನ್ಸ್ಕಿಯ ಅವಶ್ಯಕತೆಯು ಅಸಂಖ್ಯಾತ ರೂಪವಿಜ್ಞಾನದ ವರ್ಗೀಕರಣದ ಗ್ಯಾಲಕ್ಸಿಗಳಾಗಿವೆ; ಅಂದರೆ, ಸುರುಳಿ ಅಥವಾ ಅಂಡಾಕಾರದ ರೀತಿಯಲ್ಲಿ ವರ್ಗೀಕರಿಸಲ್ಪಟ್ಟ ಗೆಲಕ್ಸಿಗಳು. ಆದಾಗ್ಯೂ, ವರ್ಗೀಕರಣಕ್ಕೆ ಇರುವ ಅಸ್ತಿತ್ವದಲ್ಲಿರುವ ಕ್ರಮಾವಳಿ ವಿಧಾನಗಳು ವೈಜ್ಞಾನಿಕ ಸಂಶೋಧನೆಗೆ ಬಳಸಬೇಕಾದಷ್ಟು ಉತ್ತಮವಾಗಲಿಲ್ಲ; ಬೇರೆ ರೀತಿಯಲ್ಲಿ ಹೇಳುವುದಾದರೆ, ಆ ಸಮಯದಲ್ಲಿ, ಕಂಪ್ಯೂಟರ್ಗಳಿಗೆ ಕಠಿಣವಾದ ಸಮಸ್ಯೆ ಎಂದು ವರ್ಗೀಕರಿಸುವ ಗೆಲಕ್ಸಿಗಳು. ಆದ್ದರಿಂದ, ಮಾನವ- ವರ್ಗೀಕರಿಸಿದ ಗೆಲಕ್ಸಿಗಳ ದೊಡ್ಡ ಸಂಖ್ಯೆಯ ಅಗತ್ಯವಿತ್ತು. ಸ್ಚಾವಿನ್ಸ್ಕಿ ಈ ವರ್ಗೀಕರಣದ ಸಮಸ್ಯೆಯನ್ನು ಪದವೀಧರ ವಿದ್ಯಾರ್ಥಿ ಉತ್ಸಾಹದಿಂದ ಕೈಗೊಂಡರು. ಏಳು 12-ಗಂಟೆಗಳ ದಿನಗಳ ಮ್ಯಾರಥಾನ್ ಅಧಿವೇಶನದಲ್ಲಿ ಅವರು 50,000 ಗ್ಯಾಲಕ್ಸಿಗಳನ್ನು ವರ್ಗೀಕರಿಸಲು ಸಾಧ್ಯವಾಯಿತು. 50,000 ಗೆಲಕ್ಸಿಗಳು ಬಹಳಷ್ಟು ರೀತಿಯಲ್ಲಿ ಧ್ವನಿಸಬಹುದು, ಆದರೆ ವಾಸ್ತವವಾಗಿ ಇದು ಸ್ಲೋನ್ ಡಿಜಿಟಲ್ ಸ್ಕೈ ಸಮೀಕ್ಷೆಯಲ್ಲಿ ಛಾಯಾಚಿತ್ರ ಮಾಡಲ್ಪಟ್ಟ ಸುಮಾರು ಒಂದು ದಶಲಕ್ಷ ಗ್ಯಾಲಕ್ಸಿಯ 5% ನಷ್ಟಿರುತ್ತದೆ. ಸ್ಕಾವಿನ್ಸ್ಕಿ ಅವರು ಹೆಚ್ಚು ಸ್ಕೇಲೆಬಲ್ ವಿಧಾನದ ಅಗತ್ಯವಿದೆ ಎಂದು ಅರಿತುಕೊಂಡರು.

ಅದೃಷ್ಟವಶಾತ್, ಇದು ವರ್ಗೀಕರಿಸುವ ಗೆಲಕ್ಸಿಗಳ ಕೆಲಸವನ್ನು ಖಗೋಳಶಾಸ್ತ್ರದಲ್ಲಿ ಮುಂದುವರಿದ ತರಬೇತಿ ಅಗತ್ಯವಿರುವುದಿಲ್ಲ ಎಂದು ತಿರುಗಿದರೆ; ನೀವು ಬಹಳ ಬೇಗನೆ ಅದನ್ನು ಯಾರಾದರೂ ಕಲಿಸಲು ಮಾಡಬಹುದು. ಅರ್ಥಾತ್, ಸಹ ಗೆಲಕ್ಸಿಗಳ ವರ್ಗೀಕರಿಸುವ ಕಂಪ್ಯೂಟರ್ಗಳಿಗೆ ಹಾರ್ಡ್ ಎಂದು ಕೆಲಸ ಮನುಷ್ಯರು ಬಹಳ ಸುಲಭವಾಗಿತ್ತು. ಆದ್ದರಿಂದ, ಆಕ್ಸ್ಫರ್ಡ್, Schawinski ಮತ್ತು ಸಹ ಖಗೋಳಶಾಸ್ತ್ರಜ್ಞ ಕ್ರಿಸ್ Lintott ಪಬ್ ಕುಳಿತಾಗ ಸ್ವಯಂಸೇವಕರು ಗೆಲಕ್ಸಿಗಳ ಚಿತ್ರಗಳನ್ನು ವರ್ಗೀಕರಿಸಲು ಎಲ್ಲಿ ವೆಬ್ಸೈಟ್ ಅಪ್ ಕನಸು. ಕೆಲವು ತಿಂಗಳ ನಂತರ, ಗ್ಯಾಲಕ್ಸಿ ಝೂ ಜನಿಸಿದರು.

ಗ್ಯಾಲಕ್ಸಿ ಝೂ ವೆಬ್ಸೈಟ್ನಲ್ಲಿ, ಸ್ವಯಂಸೇವಕರು ಕೆಲವು ನಿಮಿಷಗಳ ತರಬೇತಿಯನ್ನು ಪಡೆಯುತ್ತಾರೆ; ಉದಾಹರಣೆಗೆ, ಸುರುಳಿಯಾಕಾರದ ಮತ್ತು ಅಂಡಾಕಾರದ ಗ್ಯಾಲಕ್ಸಿ (ಅಂಕಿ 5.2) ನಡುವಿನ ವ್ಯತ್ಯಾಸವನ್ನು ಕಲಿಯುವುದು. ಈ ತರಬೇತಿಯ ನಂತರ, ಪ್ರತಿ ಸ್ವಯಂಸೇವಕನು ಸುಲಭವಾಗಿ ತಿಳಿದಿರುವ ರಸಪ್ರಶ್ನೆ -15 ರ ನಕ್ಷತ್ರಪುಂಜಗಳನ್ನು ಪರಿಚಿತ ವರ್ಗೀಕರಣಗಳೊಂದಿಗೆ 11 ವರ್ಗೀಕರಿಸುವುದು-ನಂತರ ಸರಳವಾದ ವೆಬ್-ಆಧಾರಿತ ಇಂಟರ್ಫೇಸ್ (ಚಿತ್ರ 5.3) ಮೂಲಕ ಅಜ್ಞಾತ ಗೆಲಕ್ಸಿಗಳ ನೈಜ ವರ್ಗೀಕರಣವನ್ನು ಪ್ರಾರಂಭಿಸುತ್ತದೆ. ಸ್ವಯಂಸೇವಕರಿಂದ ಖಗೋಳವಿಜ್ಞಾನಿಗೆ ಪರಿವರ್ತನೆಯು 10 ನಿಮಿಷಗಳಿಗಿಂತಲೂ ಕಡಿಮೆಯಲ್ಲೇ ನಡೆಯುತ್ತದೆ ಮತ್ತು ಸರಳವಾದ ರಸಪ್ರಶ್ನೆ, ಕಡಿಮೆ ಹರ್ಡಲ್ಗಳನ್ನು ಹಾದುಹೋಗುವ ಅಗತ್ಯವಿರುತ್ತದೆ.

ಚಿತ್ರ 5.2: ಎರಡು ಮುಖ್ಯ ವಿಧದ ಗೆಲಕ್ಸಿಗಳ ಉದಾಹರಣೆಗಳು: ಸುರುಳಿಯಾಕಾರದ ಮತ್ತು ಅಂಡಾಕಾರದ. ಗ್ಯಾಲಕ್ಸಿ ಝೂ ಯೋಜನೆಯು 900,000 ಕ್ಕಿಂತ ಹೆಚ್ಚು ಚಿತ್ರಗಳನ್ನು ವರ್ಗೀಕರಿಸಲು 100,000 ಕ್ಕಿಂತ ಹೆಚ್ಚು ಸ್ವಯಂಸೇವಕರನ್ನು ಬಳಸಿದೆ. Http://www.GalaxyZoo.org ಮತ್ತು ಸ್ಲೋನ್ ಡಿಜಿಟಲ್ ಸ್ಕೈ ಸಮೀಕ್ಷೆಯ ಅನುಮತಿಯಿಂದ ಪುನರುತ್ಪಾದಿಸಲಾಗಿದೆ.

ಚಿತ್ರ 5.3: ಸ್ವಯಂ ಸೇವಕರಿಗೆ ಏಕ ಚಿತ್ರಣವನ್ನು ವರ್ಗೀಕರಿಸಲು ಕೇಳಲಾದ ಇನ್ಪುಟ್ ಸ್ಕ್ರೀನ್. ಸ್ಲೋನ್ ಡಿಜಿಟಲ್ ಸ್ಕೈ ಸಮೀಕ್ಷೆಯಿಂದ ಆಯ್ದ ಚಿತ್ರದ ಆಧಾರದ ಮೇಲೆ ಕ್ರಿಸ್ ಲಿಂಟಾಟ್ರಿಂದ ಅನುಮತಿ ಪುನರುಜ್ಜೀವನಗೊಂಡಿದೆ.

ಯೋಜನೆಯು ಸುದ್ದಿ ಲೇಖನದಲ್ಲಿ ಕಾಣಿಸಿಕೊಂಡ ನಂತರ ಗ್ಯಾಲಕ್ಸಿ ಝೂ ತನ್ನ ಆರಂಭಿಕ ಸ್ವಯಂಸೇವಕರನ್ನು ಆಕರ್ಷಿಸಿತು ಮತ್ತು ಸುಮಾರು ಆರು ತಿಂಗಳುಗಳಲ್ಲಿ ಈ ಯೋಜನೆಯು 100,000 ನಾಗರಿಕ ವಿಜ್ಞಾನಿಗಳನ್ನು ಒಳಗೊಂಡಿತ್ತು, ಅವರು ಭಾಗವಹಿಸಿದ ಜನರು ಭಾಗವಹಿಸಿದ ಕಾರಣ ಅವರು ಖಗೋಳಶಾಸ್ತ್ರವನ್ನು ಮುಂದುವರಿಸಲು ಸಹಾಯ ಮಾಡಿದರು. ಒಟ್ಟಾಗಿ, ಈ 100,000 ಸ್ವಯಂಸೇವಕರು ಒಟ್ಟಾರೆಯಾಗಿ 40 ದಶಲಕ್ಷಕ್ಕೂ ಹೆಚ್ಚಿನ ವರ್ಗೀಕರಣಗಳನ್ನು ಕೊಡುಗೆಯಾಗಿ ನೀಡಿದರು, ಬಹುಪಾಲು ವರ್ಗೀಕರಣಗಳು ತುಲನಾತ್ಮಕವಾಗಿ ಸಣ್ಣ, ಕೋರ್ ಗುಂಪುಗಳ (Lintott et al. 2008) ಬರುವವು.

ಸ್ನಾತಕಪೂರ್ವ ಸಂಶೋಧನಾ ಸಹಾಯಕರನ್ನು ನೇಮಕ ಮಾಡಿಕೊಳ್ಳುವ ಸಂಶೋಧಕರು ತಕ್ಷಣವೇ ಡೇಟಾದ ಗುಣಮಟ್ಟದ ಬಗ್ಗೆ ಸಂಶಯ ವ್ಯಕ್ತಪಡಿಸಬಹುದು. ಈ ಸಂದೇಹವಾದವು ಸಮಂಜಸವಾದದ್ದಾಗಿದ್ದರೂ, ಸ್ವಯಂಸೇವಕ ಕೊಡುಗೆಗಳನ್ನು ಸರಿಯಾಗಿ ಸ್ವಚ್ಛಗೊಳಿಸಿದಾಗ, ದೋಷಪೂರಿತವಾಗಿ, ಮತ್ತು ಒಟ್ಟುಗೂಡಿಸಿದಾಗ, ಅವರು ಉತ್ತಮ-ಗುಣಮಟ್ಟದ ಫಲಿತಾಂಶಗಳನ್ನು ಉತ್ಪಾದಿಸಬಹುದು (Lintott et al. 2008) ಎಂದು ಗ್ಯಾಲಕ್ಸಿ ಝೂ ತೋರಿಸುತ್ತದೆ. ವೃತ್ತಿಪರ ಗುಣಮಟ್ಟದ ಡೇಟಾವನ್ನು ರಚಿಸಲು ಪ್ರೇಕ್ಷಕರನ್ನು ಪಡೆಯುವ ಪ್ರಮುಖ ಟ್ರಿಕ್ ಪುನರುಕ್ತಿಯಾಗಿದೆ , ಅಂದರೆ, ವಿಭಿನ್ನ ಜನರಿಂದ ಮಾಡಿದ ಅದೇ ಕೆಲಸವನ್ನು ಹೊಂದಿದೆ. ಗ್ಯಾಲಕ್ಸಿ ಮೃಗಾಲಯದಲ್ಲಿ, ಗ್ಯಾಲಕ್ಸಿಯ ಸುಮಾರು 40 ವರ್ಗೀಕರಣಗಳು ಇದ್ದವು; ಪದವಿಪೂರ್ವ ಸಂಶೋಧನಾ ಸಹಾಯಕರು ಬಳಸುವ ಸಂಶೋಧಕರು ಈ ಮಟ್ಟದ ಪುನರುಜ್ಜೀವನವನ್ನು ನಿಭಾಯಿಸಲಾರರು ಮತ್ತು ಆದ್ದರಿಂದ ಪ್ರತಿಯೊಂದು ವ್ಯಕ್ತಿಯ ವರ್ಗೀಕರಣದ ಗುಣಮಟ್ಟವನ್ನು ಹೆಚ್ಚು ಕಾಳಜಿ ವಹಿಸಬೇಕಾಗಿದೆ. ಸ್ವಯಂಸೇವಕರು ತರಬೇತಿ ಹೊಂದಿರದಿದ್ದರೆ, ಅವರು ಪುನರಾವರ್ತನೆಯೊಂದಿಗೆ ಮಾಡಿದರು.

ಆದಾಗ್ಯೂ, ಗ್ಯಾಲಕ್ಸಿಯ ಬಹು ವರ್ಗೀಕರಣಗಳು ಸಹ, ಒಮ್ಮತದ ವರ್ಗೀಕರಣವನ್ನು ಉತ್ಪಾದಿಸಲು ಸ್ವಯಂಸೇವಕ ವರ್ಗೀಕರಣಗಳ ಸಂಯೋಜನೆಯನ್ನು ತುಲನೆ ಮಾಡುವುದು ಟ್ರಿಕಿ. ಹೆಚ್ಚಿನ ಮಾನವ ಗಣನಾ ಯೋಜನೆಗಳಲ್ಲಿ ಇದೇ ರೀತಿಯ ಸವಾಲುಗಳು ಉಂಟಾಗುತ್ತವೆ, ಗ್ಯಾಲಕ್ಸಿ ಝೂ ಸಂಶೋಧಕರು ತಮ್ಮ ಒಮ್ಮತದ ವರ್ಗೀಕರಣಗಳನ್ನು ತಯಾರಿಸಲು ಬಳಸಿದ ಮೂರು ಹಂತಗಳನ್ನು ಸಂಕ್ಷಿಪ್ತವಾಗಿ ಪರಿಶೀಲಿಸಲು ಇದು ಸಹಾಯ ಮಾಡುತ್ತದೆ. ಮೊದಲಿಗೆ, ನಕಲಿ ವರ್ಗೀಕರಣಗಳನ್ನು ತೆಗೆದುಹಾಕಿ ಸಂಶೋಧಕರು "ಸ್ವಚ್ಛಗೊಳಿಸಿದ್ದಾರೆ". ಉದಾಹರಣೆಗೆ, ಫಲಿತಾಂಶಗಳನ್ನು ಕುಶಲತೆಯಿಂದ ಪ್ರಯತ್ನಿಸುತ್ತಿರುವಾಗ ಅದೇ ಗ್ಯಾಲಕ್ಸಿಯನ್ನು-ಪುನರಾವರ್ತಿತವಾಗಿ ವರ್ಗೀಕರಿಸಿದ ಜನರು-ತಮ್ಮ ಎಲ್ಲ ವರ್ಗೀಕರಣಗಳನ್ನು ತಿರಸ್ಕರಿಸಿದರು. ಈ ಮತ್ತು ಇತರ ರೀತಿಯ ಸ್ವಚ್ಛಗೊಳಿಸುವಿಕೆ ಎಲ್ಲಾ ವರ್ಗೀಕರಣಗಳ 4% ನಷ್ಟು ತೆಗೆದುಹಾಕಲಾಗಿದೆ.

ಎರಡನೆಯದಾಗಿ, ಸ್ವಚ್ಛಗೊಳಿಸುವ ನಂತರ, ವರ್ಗೀಕರಣದಲ್ಲಿ ವ್ಯವಸ್ಥಿತ ಪಕ್ಷಪಾತವನ್ನು ತೆಗೆದುಹಾಕಲು ಸಂಶೋಧಕರು ಅಗತ್ಯವಿದೆ. ಮೂಲ ಯೋಜನೆಯೊಳಗೆ ಅಳವಡಿಸಲಾಗಿರುವ ಬಯಾಸ್ ಪತ್ತೆಹಚ್ಚುವಿಕೆ ಅಧ್ಯಯನಗಳ ಸರಣಿಯ ಮೂಲಕ - ಉದಾಹರಣೆಗೆ, ಕೆಲವು ಸ್ವಯಂಸೇವಕರನ್ನು ಏಕವರ್ಣದ ಬಣ್ಣಕ್ಕೆ ಬದಲಾಗಿ ಬಣ್ಣವರ್ಧಕವನ್ನು ತೋರಿಸುವ-ಸಂಶೋಧಕರು ಅನೇಕ ವ್ಯವಸ್ಥಿತ ಪೂರ್ವಗ್ರಹಗಳನ್ನು ಕಂಡುಹಿಡಿದರು, ಉದಾಹರಣೆಗೆ ದೀರ್ಘವೃತ್ತಾಕಾರದ ಗೆಲಕ್ಸಿಗಳಂತೆ ದೂರದ ಸುರುಳಿ ಗೆಲಕ್ಸಿಗಳನ್ನು ವರ್ಗೀಕರಿಸಲು ವ್ಯವಸ್ಥಿತ ಪಕ್ಷಪಾತವು (Bamford et al. 2009) . ಈ ವ್ಯವಸ್ಥಿತ ಪಕ್ಷಪಾತವನ್ನು ಸರಿಹೊಂದಿಸುವುದು ಬಹಳ ಮುಖ್ಯವಾಗಿದೆ ಏಕೆಂದರೆ ಪುನರುಕ್ತಿವು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ವ್ಯವಸ್ಥಿತ ಪಕ್ಷಪಾತವನ್ನು ತೆಗೆದುಹಾಕುವುದಿಲ್ಲ; ಇದು ಯಾದೃಚ್ಛಿಕ ದೋಷವನ್ನು ತೆಗೆದುಹಾಕಲು ಮಾತ್ರ ಸಹಾಯ ಮಾಡುತ್ತದೆ.

ಅಂತಿಮವಾಗಿ, ಡೆಬಿಯಾಸಿಂಗ್ ನಂತರ, ಸಂಶೋಧಕರು ಪ್ರತ್ಯೇಕ ವರ್ಗೀಕರಣವನ್ನು ಸಂಯೋಜಿಸಲು ಪ್ರತ್ಯೇಕ ವರ್ಗೀಕರಣಗಳನ್ನು ಸಂಯೋಜಿಸುವ ಒಂದು ವಿಧಾನದ ಅಗತ್ಯವಿದೆ. ಪ್ರತಿ ನಕ್ಷತ್ರಪುಂಜದ ವರ್ಗೀಕರಣಗಳನ್ನು ಸಂಯೋಜಿಸುವ ಸರಳವಾದ ವಿಧಾನವೆಂದರೆ ಸಾಮಾನ್ಯ ವರ್ಗೀಕರಣವನ್ನು ಆಯ್ಕೆ ಮಾಡಿಕೊಳ್ಳುವುದು. ಆದಾಗ್ಯೂ, ಈ ವಿಧಾನವು ಪ್ರತಿ ಸ್ವಯಂಸೇವಕರಿಗೆ ಸಮನಾದ ತೂಕವನ್ನು ನೀಡುತ್ತದೆ, ಮತ್ತು ಕೆಲವು ಸ್ವಯಂಸೇವಕರು ಇತರರಿಗಿಂತ ವರ್ಗೀಕರಣದಲ್ಲಿ ಉತ್ತಮ ಎಂದು ಸಂಶೋಧಕರು ಶಂಕಿಸಿದ್ದಾರೆ. ಆದ್ದರಿಂದ, ಸಂಶೋಧಕರು ಉತ್ತಮ ವರ್ಗೀಕರಣಕಾರರನ್ನು ಪತ್ತೆಹಚ್ಚಲು ಮತ್ತು ಹೆಚ್ಚು ತೂಕವನ್ನು ನೀಡಲು ಪ್ರಯತ್ನಿಸುವ ಹೆಚ್ಚು ಸಂಕೀರ್ಣವಾದ ಪುನರಾವರ್ತನೆಯ ವೈಶಿಂಗ್ ಪ್ರಕ್ರಿಯೆಯನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಿದರು.

ಹೀಗಾಗಿ, ಮೂರು-ಹಂತದ ಪ್ರಕ್ರಿಯೆ-ಸ್ವಚ್ಛಗೊಳಿಸುವಿಕೆ, ಡೆಬಿಯಾಸಿಂಗ್ ಮತ್ತು ತೂಕದ-ನಂತರ ಗ್ಯಾಲಕ್ಸಿ ಝೂ ಸಂಶೋಧನಾ ತಂಡವು 40 ದಶಲಕ್ಷ ಸ್ವಯಂಸೇವಕ ವರ್ಗೀಕರಣಗಳನ್ನು ಒಮ್ಮತದ ರೂಪವಿಜ್ಞಾನದ ವರ್ಗೀಕರಣಗಳ ಒಂದು ಪರಿವರ್ತನೆಯಾಗಿ ಪರಿವರ್ತಿಸಿತು. ಈ ಗ್ಯಾಲಕ್ಸಿ ಝೂ ವರ್ಗೀಕರಣಗಳನ್ನು ವೃತ್ತಿಪರ ಖಗೋಳಶಾಸ್ತ್ರಜ್ಞರ ಮೂರು ಹಿಂದಿನ ಸಣ್ಣ-ಪ್ರಮಾಣದ ಪ್ರಯತ್ನಗಳೊಂದಿಗೆ ಹೋಲಿಸಿದಾಗ, ಗ್ಯಾಲಕ್ಸಿ ಮೃಗಾಲಯವನ್ನು ಸ್ಫೂರ್ತಿ ಮಾಡಲು ನೆರವಾದ ಸ್ಕಾವಿನ್ಸ್ಕಿಯ ವರ್ಗೀಕರಣವನ್ನೂ ಒಳಗೊಂಡಂತೆ, ಬಲವಾದ ಒಪ್ಪಂದವಿದೆ. ಹೀಗಾಗಿ, ಸ್ವಯಂಸೇವಕರು, ಒಟ್ಟಾರೆಯಾಗಿ, ಉತ್ತಮ-ಗುಣಮಟ್ಟದ ವರ್ಗೀಕರಣಗಳನ್ನು ಮತ್ತು ಸಂಶೋಧಕರಿಗೆ ಹೊಂದಿಕೆಯಾಗದಂತೆ ಪ್ರಮಾಣದಲ್ಲಿ (Lintott et al. 2008) ಒದಗಿಸಲು ಸಾಧ್ಯವಾಯಿತು. ವಾಸ್ತವವಾಗಿ, ಅಂತಹ ದೊಡ್ಡ ಸಂಖ್ಯೆಯ ಗೆಲಕ್ಸಿಗಳ ಮಾನವನ ವರ್ಗೀಕರಣಗಳನ್ನು ಹೊಂದುವ ಮೂಲಕ, ಷಾವಿನ್ಸ್ಕಿ, ಲಿಂಟಾಟ್ ಮತ್ತು ಇತರರು 80% ನಷ್ಟು ನಕ್ಷತ್ರಪುಂಜಗಳು ಮಾತ್ರ ನಿರೀಕ್ಷಿತ ಮಾದರಿ-ನೀಲಿ ಸುರುಳಿಗಳು ಮತ್ತು ಕೆಂಪು ಅಂಡಾಕಾರಗಳನ್ನು ಅನುಸರಿಸುತ್ತಾರೆ ಎಂದು ತೋರಿಸಲು ಸಮರ್ಥರಾಗಿದ್ದಾರೆ ಮತ್ತು ಹಲವಾರು ಪೇಪರ್ಗಳನ್ನು ಕುರಿತು ಬರೆಯಲಾಗಿದೆ ಈ ಆವಿಷ್ಕಾರ (Fortson et al. 2011) .

ಈ ಹಿನ್ನೆಲೆಯಿಂದಾಗಿ, ಗ್ಯಾಲಕ್ಸಿ ಝೂ ವಿಭಜನೆ-ಅನ್ವಯಿಕೆ-ಒಗ್ಗೂಡಿ ಪಾಕವಿಧಾನವನ್ನು ಹೇಗೆ ಅನುಸರಿಸುತ್ತದೆ ಎಂಬುದನ್ನು ನೀವು ಈಗ ನೋಡಬಹುದು, ಇದು ಹೆಚ್ಚಿನ ಮಾನವ ಕಂಪ್ಯೂಟೇಶನ್ ಯೋಜನೆಗಳಿಗೆ ಬಳಸಲಾಗುವ ಅದೇ ಸೂತ್ರ. ಮೊದಲಿಗೆ, ಒಂದು ದೊಡ್ಡ ಸಮಸ್ಯೆಯನ್ನು ತುಂಡುಗಳಾಗಿ ವಿಭಜಿಸಲಾಗಿದೆ . ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಒಂದು ಮಿಲಿಯನ್ ಗ್ಯಾಲಕ್ಸಿಗಳನ್ನು ವರ್ಗೀಕರಿಸುವ ಸಮಸ್ಯೆಯನ್ನು ಒಂದು ಗ್ಯಾಲಕ್ಸಿ ವರ್ಗೀಕರಿಸುವ ಮಿಲಿಯನ್ ಸಮಸ್ಯೆಗಳಾಗಿ ವಿಭಜಿಸಲಾಗಿತ್ತು. ಮುಂದೆ, ಕಾರ್ಯಾಚರಣೆಯನ್ನು ಪ್ರತಿ ಚಂಕ್ಗೆ ಸ್ವತಂತ್ರವಾಗಿ ಅನ್ವಯಿಸಲಾಗುತ್ತದೆ . ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಸ್ವಯಂಸೇವಕರು ಪ್ರತಿ ನಕ್ಷತ್ರಪುಂಜವನ್ನು ಸುರುಳಿಯಾಗಿ ಅಥವಾ ಅಂಡಾಕಾರದ ರೀತಿಯಲ್ಲಿ ವರ್ಗೀಕರಿಸುತ್ತಾರೆ. ಅಂತಿಮವಾಗಿ, ಒಮ್ಮತದ ಪರಿಣಾಮವನ್ನು ಉಂಟುಮಾಡುವ ಫಲಿತಾಂಶಗಳನ್ನು ಒಟ್ಟುಗೂಡಿಸಲಾಗುತ್ತದೆ . ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಪ್ರತಿ ಗ್ಯಾಲಕ್ಸಿಯ ಒಮ್ಮತದ ವರ್ಗೀಕರಣವನ್ನು ತಯಾರಿಸಲು ಒಗ್ಗೂಡಿಸುವಿಕೆಯ ಹಂತದಲ್ಲಿ ಶುಚಿಗೊಳಿಸುವಿಕೆ, ಡೆಬಿಯಾಸಿಂಗ್ ಮತ್ತು ತೂಕವಿರುತ್ತದೆ. ಹೆಚ್ಚಿನ ಯೋಜನೆಗಳು ಈ ಸಾಮಾನ್ಯ ಪಾಕವಿಧಾನವನ್ನು ಬಳಸುತ್ತಿದ್ದರೂ ಸಹ, ಪ್ರತಿ ಹಂತದಲ್ಲೂ ನಿರ್ದಿಷ್ಟವಾದ ಸಮಸ್ಯೆಯನ್ನು ಸರಿಪಡಿಸಲಾಗುವುದು. ಉದಾಹರಣೆಗೆ, ಕೆಳಗೆ ವಿವರಿಸಲಾದ ಮಾನವ ಗಣನಾ ಯೋಜನೆಯಲ್ಲಿ, ಒಂದೇ ಸೂತ್ರವನ್ನು ಅನುಸರಿಸಲಾಗುವುದು, ಆದರೆ ಅನ್ವಯಗಳು ಮತ್ತು ಸಂಯೋಜನೆಯ ಹಂತಗಳು ವಿಭಿನ್ನವಾಗಿರುತ್ತದೆ.

ಗ್ಯಾಲಕ್ಸಿ ಝೂ ತಂಡಕ್ಕಾಗಿ, ಈ ಮೊದಲ ಯೋಜನೆ ಕೇವಲ ಆರಂಭವಾಗಿತ್ತು. ಒಂದು ಮಿಲಿಯನ್ ಗೆಲಕ್ಸಿಗಳ ಹತ್ತಿರ ವರ್ಗೀಕರಿಸಲು ಅವರು ಸಮರ್ಥರಾಗಿದ್ದರೂ ಸಹ, ಈ ಪ್ರಮಾಣವು ಹೊಸ ಡಿಜಿಟಲ್ ಆಕಾಶ ಸಮೀಕ್ಷೆಗಳೊಂದಿಗೆ ಕಾರ್ಯನಿರ್ವಹಿಸಲು ಸಾಕಾಗುವುದಿಲ್ಲ, ಅದು 10 ಶತಕೋಟಿ ಗ್ಯಾಲಕ್ಸಿಗಳ (Kuminski et al. 2014) ಚಿತ್ರಗಳನ್ನು ಉತ್ಪಾದಿಸಬಹುದು ಎಂದು ಅವರು ಬಹಳ ಬೇಗನೆ ಅರಿತುಕೊಂಡರು. 1 ಮಿಲಿಯನ್ ರಿಂದ 10 ಬಿಲಿಯನ್ ಹೆಚ್ಚಳವನ್ನು ನಿರ್ವಹಿಸಲು-10,000-ಗ್ಯಾಲಕ್ಸಿ ಮೃಗಾಲಯದ ಅಂಶವು ಸರಿಸುಮಾರು 10,000 ಪಟ್ಟು ಹೆಚ್ಚು ಭಾಗವಹಿಸುವವರನ್ನು ನೇಮಿಸಬೇಕಾಗಿದೆ. ಇಂಟರ್ನೆಟ್ನಲ್ಲಿ ಸ್ವಯಂಸೇವಕರ ಸಂಖ್ಯೆಯು ದೊಡ್ಡದಾಗಿದ್ದರೂ, ಅದು ಅನಂತವಾಗಿಲ್ಲ. ಆದ್ದರಿಂದ, ಸಂಶೋಧಕರು ಅವರು ನಿರಂತರವಾಗಿ ಬೆಳೆಯುತ್ತಿರುವ ಮಾಹಿತಿಯ ನಿರ್ವಹಣೆಯನ್ನು ನಿರ್ವಹಿಸುತ್ತಿದ್ದರೆ, ಒಂದು ಹೊಸ, ಇನ್ನೂ ಹೆಚ್ಚು ಸ್ಕೇಲೆಬಲ್ ವಿಧಾನವು ಅವಶ್ಯಕವಾಗಿತ್ತು ಎಂದು ಅರಿತುಕೊಂಡರು.

ಆದ್ದರಿಂದ, ಷಾಂಕಿನ್ಸ್ಕಿ, ಲಿಂಟಾಟ್ ಮತ್ತು ಗ್ಯಾಲಾಕ್ಸಿ ಝೂ ತಂಡದ ಇತರ ಸದಸ್ಯರು (2010) ಜೊತೆಯಲ್ಲಿ ಕೆಲಸ ಮಾಡುತ್ತಿರುವ ಮಂಡಾ ಬ್ಯಾನರ್ಜಿ- ನಕ್ಷತ್ರಪುಂಜಗಳನ್ನು ವರ್ಗೀಕರಿಸಲು ಕಂಪ್ಯೂಟರ್ಗಳನ್ನು ಬೋಧಿಸಿದರು. ಹೆಚ್ಚು ನಿರ್ದಿಷ್ಟವಾಗಿ, ಗ್ಯಾಲಕ್ಸಿ ಝೂ ರಚಿಸಿದ ಮಾನವ ವರ್ಗೀಕರಣವನ್ನು ಬಳಸಿ, ಬ್ಯಾನರ್ಜಿ ಯಂತ್ರದ ಕಲಿಕೆಯ ಮಾದರಿಯನ್ನು ನಿರ್ಮಿಸಿದನು, ಅದು ಚಿತ್ರದ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಆಧರಿಸಿ ಗ್ಯಾಲಕ್ಸಿಯ ಮಾನವ ವರ್ಗೀಕರಣವನ್ನು ಊಹಿಸಲು ಸಾಧ್ಯವಾಯಿತು. ಈ ಮಾದರಿಯು ಮಾನವ ವರ್ಗೀಕರಣವನ್ನು ಹೆಚ್ಚು ನಿಖರತೆಯಿಂದ ಸಂತಾನೋತ್ಪತ್ತಿ ಮಾಡಬಹುದಾದರೆ, ಗ್ಯಾಲಕ್ಸಿ ಝೂ ಸಂಶೋಧಕರು ಇದನ್ನು ಅತ್ಯಲ್ಪ ಸಂಖ್ಯೆಯ ನಕ್ಷತ್ರಪುಂಜಗಳನ್ನು ವರ್ಗೀಕರಿಸಲು ಬಳಸಬಹುದು.

ಬ್ಯಾನರ್ಜಿ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳ ವಿಧಾನದ ಮುಖ್ಯಭಾಗವು ಸಾಮಾನ್ಯವಾಗಿ ಸಾಮಾಜಿಕ ಸಂಶೋಧನೆಯಲ್ಲಿ ಬಳಸಿದ ತಂತ್ರಗಳಿಗೆ ಬಹಳ ಹೋಲುತ್ತದೆ, ಆದರೆ ಅದೇ ಹೋಲಿಕೆಗೆ ಹೋಲಿಸಿದರೆ ಸದೃಶತೆ ಸ್ಪಷ್ಟವಾಗಿಲ್ಲ. ಮೊದಲಿಗೆ, ಬ್ಯಾನರ್ಜಿ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳು ಪ್ರತಿ ಚಿತ್ರವನ್ನೂ ಅದರ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಸಂಕ್ಷಿಪ್ತಗೊಳಿಸಿದ ಸಾಂಖ್ಯಿಕ ವೈಶಿಷ್ಟ್ಯಗಳ ಗುಂಪಿಗೆ ಪರಿವರ್ತಿಸಿದರು. ಉದಾಹರಣೆಗೆ, ಗೆಲಕ್ಸಿಗಳ ಚಿತ್ರಗಳಿಗಾಗಿ, ಮೂರು ವೈಶಿಷ್ಟ್ಯಗಳು ಇರಬಹುದಾಗಿರುತ್ತದೆ: ಚಿತ್ರದಲ್ಲಿ ನೀಲಿ ಬಣ್ಣ, ಪಿಕ್ಸೆಲ್ಗಳ ಹೊಳಪಿನ ವ್ಯತ್ಯಾಸ ಮತ್ತು ಬಿಳಿ-ಅಲ್ಲದ ಪಿಕ್ಸೆಲ್ಗಳ ಅನುಪಾತ. ಸರಿಯಾದ ವೈಶಿಷ್ಟ್ಯಗಳ ಆಯ್ಕೆಯು ಸಮಸ್ಯೆಯ ಒಂದು ಪ್ರಮುಖ ಭಾಗವಾಗಿದೆ, ಮತ್ತು ಇದು ಸಾಮಾನ್ಯವಾಗಿ ವಿಷಯ-ಪ್ರದೇಶದ ಪರಿಣತಿಗೆ ಅಗತ್ಯವಾಗಿರುತ್ತದೆ. ವೈಶಿಷ್ಟ್ಯದ ಎಂಜಿನಿಯರಿಂಗ್ ಎಂದು ಸಾಮಾನ್ಯವಾಗಿ ಕರೆಯಲ್ಪಡುವ ಈ ಮೊದಲ ಹೆಜ್ಜೆ, ಒಂದು ಪ್ರತಿ ಮ್ಯಾಟ್ರಿಕ್ಸ್ನಲ್ಲಿ ಒಂದು ಪ್ರತಿ ಚಿತ್ರಕ್ಕೆ ಒಂದು ಸಾಲಿನೊಂದಿಗೆ ಮತ್ತು ಆ ಚಿತ್ರವನ್ನು ವಿವರಿಸುವ ಮೂರು ಕಾಲಮ್ಗಳನ್ನು ಫಲಿತಾಂಶ ಮಾಡುತ್ತದೆ. ಡೇಟಾ ಮ್ಯಾಟ್ರಿಕ್ಸ್ ಮತ್ತು ಅಪೇಕ್ಷಿತ ಔಟ್ಪುಟ್ (ಉದಾ, ಚಿತ್ರವನ್ನು ಎಲಿಪ್ಟಿಕಲ್ ಗ್ಯಾಲಕ್ಸಿಯಂತೆ ವರ್ಗೀಕರಿಸಲಾಗಿದೆಯೆ ಎಂದು), ಸಂಶೋಧಕರು ಅಂಕಿ-ಅಂಶಗಳನ್ನು ಅಥವಾ ಯಂತ್ರ ಕಲಿಕೆಯ ಮಾದರಿಯನ್ನು ಸೃಷ್ಟಿಸುತ್ತಾರೆ-ಉದಾಹರಣೆಗೆ, ಲಾಜಿಸ್ಟಿಕ್ ರಿಗ್ರೆಷನ್-ವೈಶಿಷ್ಟ್ಯಗಳ ಆಧಾರದ ಮೇಲೆ ಮಾನವ ವರ್ಗೀಕರಣವನ್ನು ಊಹಿಸುತ್ತದೆ ಚಿತ್ರದ. ಅಂತಿಮವಾಗಿ, ಸಂಶೋಧಕರು ಹೊಸ ಗ್ಯಾಲಕ್ಸಿಯ ಅಂದಾಜು ವರ್ಗೀಕರಣಗಳನ್ನು ಉತ್ಪತ್ತಿ ಮಾಡಲು ಈ ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಮಾದರಿಯಲ್ಲಿ ಮಾನದಂಡಗಳನ್ನು ಬಳಸುತ್ತಾರೆ (ಚಿತ್ರ 5.4). ಯಂತ್ರ ಕಲಿಕೆಯಲ್ಲಿ, ಹೊಸ ವಿಧಾನವನ್ನು ಲೇಬಲ್ ಮಾಡಬಹುದಾದ ಮಾದರಿಯನ್ನು ರಚಿಸಲು ಈ ವಿಧಾನವು ಲೇಬಲ್ ಮಾಡಲಾದ ಉದಾಹರಣೆಗಳನ್ನು- ಮೇಲ್ವಿಚಾರಣೆ ಕಲಿಕೆ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ.

ಚಿತ್ರ 5.4: ಬ್ಯಾನರ್ಜಿ ಮತ್ತು ಇತರರು ಹೇಗೆ ಸರಳ ವಿವರಣೆ. (2010) ಗ್ಯಾಲಾಕ್ಸಿ ವರ್ಗೀಕರಣವನ್ನು ಮಾಡಲು ಯಂತ್ರ ಕಲಿಕೆಯ ಮಾದರಿಯನ್ನು ತರಬೇತಿ ಮಾಡಲು ಗ್ಯಾಲಕ್ಸಿ ಝೂ ವರ್ಗೀಕರಣಗಳನ್ನು ಬಳಸಿಕೊಂಡರು. ಗೆಲಕ್ಸಿಗಳ ಚಿತ್ರಗಳು ವೈಶಿಷ್ಟ್ಯಗಳ ಮ್ಯಾಟ್ರಿಕ್ಸ್ನಲ್ಲಿ ಪರಿವರ್ತಿಸಲ್ಪಟ್ಟವು. ಈ ಸರಳೀಕೃತ ಉದಾಹರಣೆಯಲ್ಲಿ, ಮೂರು ವೈಶಿಷ್ಟ್ಯಗಳಿವೆ (ಚಿತ್ರದಲ್ಲಿ ನೀಲಿ ಬಣ್ಣ, ಪಿಕ್ಸೆಲ್ಗಳ ಹೊಳಪಿನ ವ್ಯತ್ಯಾಸ, ಮತ್ತು ನಾನ್ವೈಟ್ ಪಿಕ್ಸೆಲ್ಗಳ ಪ್ರಮಾಣ). ನಂತರ, ಚಿತ್ರಗಳ ಉಪವಿಭಾಗಕ್ಕಾಗಿ, ಗ್ಯಾಲಕ್ಸಿ ಝೂ ಲೇಬಲ್ಗಳನ್ನು ಯಂತ್ರ ಕಲಿಕೆಯ ಮಾದರಿಯನ್ನು ತರಬೇತಿ ಮಾಡಲು ಬಳಸಲಾಗುತ್ತದೆ. ಅಂತಿಮವಾಗಿ, ಉಳಿದ ಕಲಾಕೃತಿಗಳಿಗೆ ವರ್ಗೀಕರಣವನ್ನು ಅಂದಾಜು ಮಾಡಲು ಯಂತ್ರ ಕಲಿಕೆ ಬಳಸಲಾಗುತ್ತದೆ. ನಾನು ಇದನ್ನು ಗಣಕ-ನೆರವಿನ ಮಾನವ ಗಣನಾ ಯೋಜನೆ ಎಂದು ಕರೆದಿದ್ದೇನೆ, ಏಕೆಂದರೆ ಮಾನವರು ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸುವುದಕ್ಕಿಂತ ಹೆಚ್ಚಾಗಿ, ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸಲು ಗಣಕವನ್ನು ತರಬೇತಿ ಮಾಡಲು ಬಳಸಬಹುದಾದ ದತ್ತಾಂಶ ಸಂಗ್ರಹವನ್ನು ಮಾನವರು ನಿರ್ಮಿಸಿದ್ದಾರೆ. ಈ ಕಂಪ್ಯೂಟರ್-ನೆರವಿನ ಮಾನವ ಕಂಪ್ಯೂಟೇಶನ್ ಸಿಸ್ಟಮ್ನ ಪ್ರಯೋಜನವೆಂದರೆ, ಇದು ಒಂದು ಸೀಮಿತ ಪ್ರಮಾಣದ ಮಾನವ ಪ್ರಯತ್ನವನ್ನು ಬಳಸಿಕೊಂಡು ಮೂಲಭೂತವಾಗಿ ಅನಂತ ಪ್ರಮಾಣದ ಡೇಟಾವನ್ನು ನಿಭಾಯಿಸಲು ನಿಮಗೆ ಅನುವು ಮಾಡಿಕೊಡುತ್ತದೆ. ಸ್ಲೋನ್ ಡಿಜಿಟಲ್ ಸ್ಕೈ ಸಮೀಕ್ಷೆಯಿಂದ ಅನುಮತಿಯಿಂದ ಮರುಉತ್ಪಾದಿಸಲ್ಪಟ್ಟ ಗೆಲಕ್ಸಿಗಳ ಚಿತ್ರಗಳು.

ಚಿತ್ರ 5.4: Banerji et al. (2010) ಹೇಗೆ ಸರಳ ವಿವರಣೆ Banerji et al. (2010) ಗ್ಯಾಲಾಕ್ಸಿ ವರ್ಗೀಕರಣವನ್ನು ಮಾಡಲು ಯಂತ್ರ ಕಲಿಕೆಯ ಮಾದರಿಯನ್ನು ತರಬೇತಿ ಮಾಡಲು ಗ್ಯಾಲಕ್ಸಿ ಝೂ ವರ್ಗೀಕರಣಗಳನ್ನು ಬಳಸಿಕೊಂಡರು. ಗೆಲಕ್ಸಿಗಳ ಚಿತ್ರಗಳು ವೈಶಿಷ್ಟ್ಯಗಳ ಮ್ಯಾಟ್ರಿಕ್ಸ್ನಲ್ಲಿ ಪರಿವರ್ತಿಸಲ್ಪಟ್ಟವು. ಈ ಸರಳೀಕೃತ ಉದಾಹರಣೆಯಲ್ಲಿ, ಮೂರು ವೈಶಿಷ್ಟ್ಯಗಳಿವೆ (ಚಿತ್ರದಲ್ಲಿ ನೀಲಿ ಬಣ್ಣ, ಪಿಕ್ಸೆಲ್ಗಳ ಹೊಳಪಿನ ವ್ಯತ್ಯಾಸ, ಮತ್ತು ನಾನ್ವೈಟ್ ಪಿಕ್ಸೆಲ್ಗಳ ಪ್ರಮಾಣ). ನಂತರ, ಚಿತ್ರಗಳ ಉಪವಿಭಾಗಕ್ಕಾಗಿ, ಗ್ಯಾಲಕ್ಸಿ ಝೂ ಲೇಬಲ್ಗಳನ್ನು ಯಂತ್ರ ಕಲಿಕೆಯ ಮಾದರಿಯನ್ನು ತರಬೇತಿ ಮಾಡಲು ಬಳಸಲಾಗುತ್ತದೆ. ಅಂತಿಮವಾಗಿ, ಉಳಿದ ಕಲಾಕೃತಿಗಳಿಗೆ ವರ್ಗೀಕರಣವನ್ನು ಅಂದಾಜು ಮಾಡಲು ಯಂತ್ರ ಕಲಿಕೆ ಬಳಸಲಾಗುತ್ತದೆ. ನಾನು ಇದನ್ನು ಗಣಕ-ನೆರವಿನ ಮಾನವ ಗಣನಾ ಯೋಜನೆ ಎಂದು ಕರೆದಿದ್ದೇನೆ, ಏಕೆಂದರೆ ಮಾನವರು ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸುವುದಕ್ಕಿಂತ ಹೆಚ್ಚಾಗಿ, ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸಲು ಗಣಕವನ್ನು ತರಬೇತಿ ಮಾಡಲು ಬಳಸಬಹುದಾದ ದತ್ತಾಂಶ ಸಂಗ್ರಹವನ್ನು ಮಾನವರು ನಿರ್ಮಿಸಿದ್ದಾರೆ. ಈ ಕಂಪ್ಯೂಟರ್-ನೆರವಿನ ಮಾನವ ಕಂಪ್ಯೂಟೇಶನ್ ಸಿಸ್ಟಮ್ನ ಪ್ರಯೋಜನವೆಂದರೆ, ಇದು ಒಂದು ಸೀಮಿತ ಪ್ರಮಾಣದ ಮಾನವ ಪ್ರಯತ್ನವನ್ನು ಬಳಸಿಕೊಂಡು ಮೂಲಭೂತವಾಗಿ ಅನಂತ ಪ್ರಮಾಣದ ಡೇಟಾವನ್ನು ನಿಭಾಯಿಸಲು ನಿಮಗೆ ಅನುವು ಮಾಡಿಕೊಡುತ್ತದೆ. ಸ್ಲೋನ್ ಡಿಜಿಟಲ್ ಸ್ಕೈ ಸಮೀಕ್ಷೆಯಿಂದ ಅನುಮತಿಯಿಂದ ಮರುಉತ್ಪಾದಿಸಲ್ಪಟ್ಟ ಗೆಲಕ್ಸಿಗಳ ಚಿತ್ರಗಳು.

ಬ್ಯಾನರ್ಜಿ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳ ಯಂತ್ರ ಕಲಿಕೆಯ ಮಾದರಿಯು ನನ್ನ ಆಟಿಕೆ ಉದಾಹರಣೆಯಲ್ಲಿ ಕಂಡುಬಂದಂತೆಯೇ ಹೆಚ್ಚು ಸಂಕೀರ್ಣವಾಗಿದೆ-ಉದಾಹರಣೆಗೆ, "ಡಿ ವೌಕೌಲ್ಯರ್ಸ್ ಫಿಟ್ ಅಕ್ಷೀಯ ಅನುಪಾತ" ನಂತಹ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ಬಳಸಿದ-ಮತ್ತು ಅವಳ ಮಾದರಿ ಲಾಜಿಸ್ಟಿಕ್ ರಿಗ್ರೆಷನ್ ಆಗಿರಲಿಲ್ಲ, ಇದು ಕೃತಕ ನರಮಂಡಲವಾಗಿದೆ. ತನ್ನ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು, ಅವಳ ಮಾದರಿ ಮತ್ತು ಒಮ್ಮತದ ಗ್ಯಾಲಕ್ಸಿ ಝೂ ವರ್ಗೀಕರಣಗಳನ್ನು ಬಳಸಿಕೊಳ್ಳುತ್ತಾ, ಪ್ರತಿ ವೈಶಿಷ್ಟ್ಯದ ಮೇಲೆ ತೂಕವನ್ನು ಸೃಷ್ಟಿಸಲು ಅವರು ಸಾಧ್ಯವಾಯಿತು, ಮತ್ತು ನಂತರ ಗ್ಯಾಲಕ್ಸಿಗಳ ವರ್ಗೀಕರಣದ ಬಗ್ಗೆ ಭವಿಷ್ಯವನ್ನು ಮಾಡಲು ಈ ತೂಕವನ್ನು ಬಳಸಿದರು. ಉದಾಹರಣೆಗೆ, ಕಡಿಮೆ "ಡಿ ವೌಕೌಲರ್ಸ್ಗಳು ಅಕ್ಷೀಯ ಅನುಪಾತಕ್ಕೆ ಸರಿಹೊಂದುವಂತೆ" ಹೊಂದಿರುವ ಚಿತ್ರಗಳು ಸುರುಳಿಯಾಕಾರದ ಗೆಲಕ್ಸಿಗಳಾಗಬಹುದೆಂದು ಅವಳ ವಿಶ್ಲೇಷಣೆ ಕಂಡುಹಿಡಿದಿದೆ. ಈ ತೂಕಗಳ ಪ್ರಕಾರ, ಸಮಂಜಸವಾದ ನಿಖರತೆ ಹೊಂದಿರುವ ಗ್ಯಾಲಕ್ಸಿಯ ಮಾನವ ವರ್ಗೀಕರಣವನ್ನು ಅವರು ಊಹಿಸಲು ಸಾಧ್ಯವಾಯಿತು.

ಬ್ಯಾನರ್ಜಿ ಮತ್ತು ಸಹೋದ್ಯೋಗಿಗಳ ಕೆಲಸ ಗ್ಯಾಲಕ್ಸಿ ಝೂವನ್ನು ಗಣಕ-ನೆರವಿನ ಮಾನವ ಕಂಪ್ಯೂಟೇಶನ್ ಸಿಸ್ಟಮ್ ಎಂದು ಕರೆದೊಯ್ಯುತ್ತದೆ. ಈ ಹೈಬ್ರಿಡ್ ಸಿಸ್ಟಮ್ಗಳ ಬಗ್ಗೆ ಯೋಚಿಸುವುದು ಉತ್ತಮ ಮಾರ್ಗವಾಗಿದೆ, ಮಾನವರು ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸುವುದಕ್ಕಿಂತ ಹೆಚ್ಚಾಗಿ, ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸಲು ಕಂಪ್ಯೂಟರ್ ಅನ್ನು ತರಬೇತಿ ಮಾಡಲು ಬಳಸಬಹುದಾದ ಡೇಟಾಸಮೂಹವನ್ನು ಮಾನವರು ನಿರ್ಮಿಸಿದ್ದಾರೆ. ಕೆಲವೊಮ್ಮೆ, ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸಲು ಒಂದು ಕಂಪ್ಯೂಟರ್ಗೆ ತರಬೇತಿ ನೀಡಬೇಕಾದರೆ ಅನೇಕ ಉದಾಹರಣೆಗಳ ಅಗತ್ಯವಿರುತ್ತದೆ ಮತ್ತು ಸಾಕಷ್ಟು ಸಂಖ್ಯೆಯ ಉದಾಹರಣೆಗಳನ್ನು ಉತ್ಪಾದಿಸುವ ಏಕೈಕ ಮಾರ್ಗವೆಂದರೆ ಸಾಮೂಹಿಕ ಸಹಯೋಗದೊಂದಿಗೆ. ಈ ಕಂಪ್ಯೂಟರ್-ನೆರವಿನ ವಿಧಾನವು ಲಾಭದಾಯಕವಾಗಿದ್ದು, ಇದು ಕೇವಲ ಒಂದು ಸೀಮಿತ ಪ್ರಮಾಣದ ಮಾನವ ಪ್ರಯತ್ನವನ್ನು ಬಳಸಿಕೊಂಡು ಮೂಲಭೂತವಾಗಿ ಅನಂತ ಪ್ರಮಾಣದ ಡೇಟಾವನ್ನು ನಿರ್ವಹಿಸಲು ನಿಮಗೆ ಅನುವು ಮಾಡಿಕೊಡುತ್ತದೆ. ಉದಾಹರಣೆಗೆ, ಒಂದು ಮಿಲಿಯನ್ ಮಾನವ ವರ್ಗೀಕರಿಸಿದ ಗೆಲಕ್ಸಿಗಳೊಂದಿಗಿನ ಸಂಶೋಧಕರು ಭವಿಷ್ಯದ ಮಾದರಿಯನ್ನು ರಚಿಸಬಹುದು, ಅದನ್ನು ನಂತರ ಒಂದು ಬಿಲಿಯನ್ ಅಥವಾ ಟ್ರಿಲಿಯನ್ ಗ್ಯಾಲಕ್ಸಿಗಳನ್ನು ವರ್ಗೀಕರಿಸಲು ಬಳಸಲಾಗುತ್ತದೆ. ಅಗಾಧ ಸಂಖ್ಯೆಯ ಗೆಲಕ್ಸಿಗಳಿದ್ದರೆ, ಈ ರೀತಿಯ ಮಾನವ-ಕಂಪ್ಯೂಟರ್ ಹೈಬ್ರಿಡ್ ನಿಜವಾಗಿಯೂ ಏಕೈಕ ಸಂಭವನೀಯ ಪರಿಹಾರವಾಗಿದೆ. ಈ ಅನಂತ ಸ್ಕೇಲೆಬಿಲಿಟಿ ಆದಾಗ್ಯೂ, ಉಚಿತ ಅಲ್ಲ. ಮಾನವ ವರ್ಗೀಕರಣವನ್ನು ಸರಿಯಾಗಿ ಸಂತಾನೋತ್ಪತ್ತಿ ಮಾಡುವ ಒಂದು ಯಂತ್ರ ಕಲಿಕೆಯ ಮಾದರಿಯನ್ನು ನಿರ್ಮಿಸುವುದು ಸ್ವತಃ ಒಂದು ಕಷ್ಟಕರ ಸಮಸ್ಯೆಯಾಗಿದೆ, ಆದರೆ ಅದೃಷ್ಟವಶಾತ್ ಈ ವಿಷಯಕ್ಕೆ (Hastie, Tibshirani, and Friedman 2009; Murphy 2012; James et al. 2013) .

ಗ್ಯಾಲಕ್ಸಿ ಮೃಗಾಲಯವು ಎಷ್ಟು ಮಾನವ ಗಣನಾ ಯೋಜನೆಗಳನ್ನು ವಿಕಸನಗೊಳಿಸುತ್ತದೆ ಎಂಬುದರ ಉತ್ತಮ ವಿವರಣೆಯಾಗಿದೆ. ಮೊದಲನೆಯದಾಗಿ, ಸಂಶೋಧಕರು ಈ ಯೋಜನೆಯನ್ನು ತಾನೇ ಸ್ವತಃ ಅಥವಾ ಸಂಶೋಧನಾ ಸಹಾಯಕರ ಸಣ್ಣ ತಂಡದೊಂದಿಗೆ (ಉದಾ., ಸ್ವಿವಿನ್ಸ್ಕಿಯ ಆರಂಭಿಕ ವರ್ಗೀಕರಣ ಪ್ರಯತ್ನ) ಪ್ರಯತ್ನಿಸುತ್ತಾರೆ. ಈ ವಿಧಾನವು ಚೆನ್ನಾಗಿ ಪರಿಣಮಿಸದಿದ್ದಲ್ಲಿ, ಸಂಶೋಧಕರು ಅನೇಕ ಪಾಲ್ಗೊಳ್ಳುವವರೊಂದಿಗೆ ಮಾನವ ಗಣನಾ ಯೋಜನೆಗೆ ಚಲಿಸಬಹುದು. ಆದರೆ, ಒಂದು ನಿರ್ದಿಷ್ಟ ಪ್ರಮಾಣದ ದತ್ತಾಂಶಕ್ಕಾಗಿ, ಶುದ್ಧವಾದ ಮಾನವ ಪ್ರಯತ್ನವು ಸಾಕಾಗುವುದಿಲ್ಲ. ಆ ಸಮಯದಲ್ಲಿ, ಗಣಕ-ನೆರವಿನ ಮಾನವ ಗಣನಾ ವ್ಯವಸ್ಥೆಯನ್ನು ಸಂಶೋಧಕರು ರಚಿಸಬೇಕಾಗಿದೆ, ಇದರಲ್ಲಿ ಯಂತ್ರ ವರ್ಗೀಕರಣ ಮಾದರಿಗೆ ಮಾನವ ವರ್ಗೀಕರಣವನ್ನು ಬಳಸಲಾಗುತ್ತದೆ, ಅದು ನಂತರದಲ್ಲಿ ಅನಿಯಮಿತ ಮೊತ್ತದ ಡೇಟಾಕ್ಕೆ ಅನ್ವಯಿಸಬಹುದು.