5.2.1 ਗਲੈਕਸੀ ਚਿੜੀਆ

ਗਲੈਕਸੀ ਚਿੜੀਆਘਰ ਨੇ ਲੱਖਾਂ ਗਲੈਕਸੀਆਂ ਨੂੰ ਸ਼੍ਰੇਣੀਬੱਧ ਕਰਨ ਲਈ ਬਹੁਤ ਸਾਰੇ ਗੈਰ-ਮਾਹਰ ਵਲੰਟੀਅਰਾਂ ਦੇ ਯਤਨਾਂ ਨੂੰ ਮਿਲਾਇਆ.

ਗਲੈਕਸੀ ਚਿੜੀਆਘਰ 2007 ਵਿੱਚ ਔਕਸਫੋਰਡ ਯੂਨੀਵਰਸਿਟੀ ਦੇ ਖਗੋਲ ਵਿਗਿਆਨ ਦੇ ਗ੍ਰੈਜੂਏਟ ਵਿਦਿਆਰਥੀ ਕੇਵਿਨ ਸਕੈਵਨਿਸ਼ਕੀ ਦੀ ਸਮੱਸਿਆ ਦਾ ਸਾਹਮਣਾ ਕਰ ਚੁੱਕਾ ਹੈ. ਸਵਾਵਨਕੀ ਨੂੰ ਗਲੈਕਸੀਆਂ ਵਿੱਚ ਦਿਲਚਸਪੀ ਸੀ ਅਤੇ ਗਲੈਕਸੀਆਂ ਨੂੰ ਉਹਨਾਂ ਦੀ ਰੂਪ ਵਿਗਿਆਨ-ਅੰਡਾਕਾਰ ਜਾਂ ਸਰੂਪ ਨਾਲ ਵੰਡਿਆ ਜਾ ਸਕਦਾ ਹੈ-ਅਤੇ ਆਪਣੇ ਰੰਗ ਨਾਲ ਨੀਲੇ ਜਾਂ ਲਾਲ ਉਸ ਸਮੇਂ, ਖਗੋਲ-ਵਿਗਿਆਨੀਆਂ ਵਿਚ ਰਵਾਇਤੀ ਬੁੱਧ ਇਹ ਸੀ ਕਿ ਸਾਡੀ ਆਕਾਸ਼ਗੰਗਾ ਵਾਂਗ ਚਮਕੀਲਾ ਤਾਰਿਆਂ ਰੰਗ (ਨੀਲੇ ਰੰਗ ਦਾ ਨੌਜਵਾਨ) ਅਤੇ ਅੰਡਾਕਾਰ ਗਲੈਕਸੀਆਂ ਲਾਲ ਸਨ (ਬੁਢਾਪੇ ਦਾ ਸੰਕੇਤ ਹੈ). ਸਕਵੇਨਸਕੀ ਨੇ ਇਸ ਰਵਾਇਤੀ ਬੁੱਧ ਤੇ ਸ਼ੱਕ ਕੀਤਾ. ਉਸ ਨੇ ਸ਼ੱਕ ਕੀਤਾ ਕਿ ਹਾਲਾਂਕਿ ਇਹ ਪੈਟਰਨ ਆਮ ਕਰਕੇ ਸੱਚ ਹੋ ਸਕਦਾ ਹੈ, ਸ਼ਾਇਦ ਬਹੁਤ ਸਾਰੇ ਅਪਵਾਦ ਸਨ ਅਤੇ ਇਹ ਬਹੁਤ ਸਾਰੀਆਂ ਅਸਧਾਰਨ ਗਲੈਕਸੀਆਂ ਦੀ ਪੜ੍ਹਾਈ ਕਰ ਰਹੇ ਸਨ- ਜਿਨ੍ਹਾਂ ਦੀ ਉਮੀਦ ਕੀਤੀ ਪੈਟਰਨ ਨੂੰ ਫਿੱਟ ਨਹੀਂ ਸੀ-ਉਹ ਪ੍ਰਕਿਰਿਆ ਬਾਰੇ ਕੁਝ ਸਿੱਖ ਸਕਦਾ ਸੀ. ਗਲੈਕਸੀਆਂ ਦਾ ਗਠਨ

ਇਸ ਲਈ, ਰਵਾਇਤੀ ਗਿਆਨ ਨੂੰ ਉਲਟਾਉਣ ਲਈ ਸਕਵੇਨਜ਼ਕੀ ਨੂੰ ਕਿਸ ਚੀਜ਼ ਦੀ ਲੋੜ ਸੀ, ਜੋ ਰੂਪ ਵਿਗਿਆਨ ਨਾਲ ਸਬੰਧਤ ਗਲੈਕਸੀਆਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਸਮੂਹ ਸੀ; ਇਹ ਹੈ, ਗਲੈਕਸੀਆਂ ਜਿਨ੍ਹਾਂ ਨੂੰ ਜਾਂ ਤਾਂ ਸਰੂਪ ਜਾਂ ਅੰਡਾਕਾਰ ਦੇ ਤੌਰ ਤੇ ਵਰਗੀਕ੍ਰਿਤ ਕੀਤਾ ਗਿਆ ਹੈ ਸਮੱਸਿਆ ਇਹ ਹੈ ਕਿ ਵਿਗਿਆਨਕ ਖੋਜ ਲਈ ਵਰਤੀ ਗਈ ਅਲਗੋਰਿਦਮਿਕ ਤਰੀਕੇ ਅਜੇ ਵੀ ਚੰਗੀ ਨਹੀਂ ਸਨ; ਦੂਜੇ ਸ਼ਬਦਾਂ ਵਿਚ, ਕਲਾਸੀਫਾਈਡਿੰਗ ਗਲੈਕਸੀਆਂ ਉਸ ਸਮੇਂ ਸਨ, ਉਸ ਸਮੇਂ, ਕੰਪਿਊਟਰ ਲਈ ਸਖ਼ਤ ਮੁਸ਼ਕਿਲ ਸੀ. ਇਸ ਲਈ, ਬਹੁਤ ਸਾਰੇ ਮਨੁੱਖ- ਸ਼੍ਰੇਣੀਬੱਧ ਗਲੈਕਸੀਆਂ ਦੀ ਲੋੜ ਸੀ. ਸਕੈਵਨਿਸ਼ਕੀ ਨੇ ਗ੍ਰੈਜੂਏਟ ਵਿਦਿਆਰਥੀ ਦੇ ਉਤਸ਼ਾਹ ਨਾਲ ਇਸ ਵਰਗੀਕਰਣ ਦੀ ਸਮੱਸਿਆ ਦਾ ਹੱਲ ਕੀਤਾ. ਸੱਤ -12 ਘੰਟੇ ਦੇ ਮੈਰਾਥਨ ਸੈਸ਼ਨ ਦੇ ਦੌਰਾਨ, ਉਹ 50,000 ਗਲੈਕਸੀਆਂ ਨੂੰ ਸ਼੍ਰੇਣੀਬੱਧ ਕਰਨ ਦੇ ਯੋਗ ਸੀ. ਹਾਲਾਂਕਿ 50,000 ਗਲੈਕਸੀਆਂ ਬਹੁਤ ਵੱਜੀਆਂ ਲੱਗ ਸਕਦੀਆਂ ਹਨ, ਅਸਲ ਵਿੱਚ ਇਹ ਸਿਰਫ ਲਗਭਗ ਇੱਕ ਮਿਲੀਅਨ ਗਲੈਕਸੀਆਂ ਵਿੱਚੋਂ 5% ਹੈ ਜੋ ਸਲੋਅਨ ਡਿਜੀਟਲ ਸਕਾਈ ਸਰਵੇ ਵਿੱਚ ਫੋਟੋ ਖਿੱਚੀਆਂ ਗਈਆਂ ਸਨ. ਸਕੌਵਿਨਸਕੀ ਨੂੰ ਅਹਿਸਾਸ ਹੋਇਆ ਕਿ ਉਸਨੂੰ ਇੱਕ ਹੋਰ ਸਕੇਲੇਬਲ ਪਹੁੰਚ ਦੀ ਲੋੜ ਸੀ.

ਖੁਸ਼ਕਿਸਮਤੀ ਨਾਲ, ਇਸ ਨੂੰ ਬਾਹਰ ਕਾਮੁਕ, ਜੋ ਕਿ ਸ਼੍ਰੇਣੀ ਮੰਡਲ ਦੇ ਕੰਮ ਖਗੋਲ ਵਿਚ ਤਕਨੀਕੀ ਸਿਖਲਾਈ ਦੀ ਲੋੜ ਨਹੀ ਹੈ; ਤੁਹਾਨੂੰ ਕਿਸੇ ਨੂੰ ਇਸ ਨੂੰ ਪਰੈਟੀ ਤੇਜ਼ੀ ਨਾਲ ਕੀ ਕਰਨ ਦਾ ਉਪਦੇਸ਼ ਕਰ ਸਕਦਾ ਹੈ. ਹੋਰ ਸ਼ਬਦ, ਪਰ ਫਿਰ ਵੀ ਮੰਡਲ ਸ਼੍ਰੇਣੀ ਦਾ ਇੱਕ ਕੰਮ ਹੈ, ਜੋ ਕਿ ਕੰਪਿਊਟਰ ਦੇ ਲਈ ਔਖਾ ਸੀ ਹੈ, ਇਸ ਨੂੰ ਇਨਸਾਨ ਲਈ ਪਰੈਟੀ ਆਸਾਨ ਸੀ. ਇਸ ਲਈ, ਜਦਕਿ, ਆਕਸਫੋਰਡ, Schawinski ਅਤੇ ਸਾਥੀ ਖਗੋਲ ਕ੍ਰਿਸ Lintott ਵਿੱਚ ਇੱਕ ਪੱਬ ਵਿਚ ਬੈਠੇ ਇੱਕ ਵੈਬਸਾਈਟ ਹੈ ਜਿੱਥੇ ਸਵੈ ਮੰਡਲ ਦੇ ਚਿੱਤਰ, ਵਰਗੀਕਰਨ ਜਾਵੇਗਾ ਸੁਫਨਾ. ਕੁਝ ਮਹੀਨੇ ਬਾਅਦ, ਗਲੈਕਸੀ ਚਿੜੀਆ ਦਾ ਜਨਮ ਹੋਇਆ ਸੀ.

ਗਲੈਕਸੀ ਚਿੜੀਆਘਰ ਦੀ ਵੈਬਸਾਈਟ 'ਤੇ, ਵਲੰਟੀਅਰਾਂ ਨੂੰ ਕੁਝ ਕੁ ਮਿੰਟਾਂ ਦੀ ਸਿਖਲਾਈ ਦਿੱਤੀ ਜਾਵੇਗੀ; ਉਦਾਹਰਨ ਲਈ, ਸਪਿਰਲ ਅਤੇ ਅੰਡਾਕਾਰ ਗਲੈਕਸੀ (ਚਿੱਤਰ 5.2) ਵਿੱਚ ਫਰਕ ਸਿੱਖਣਾ. ਇਸ ਸਿਖਲਾਈ ਤੋਂ ਬਾਅਦ, ਹਰੇਕ ਵਾਲੰਟੀਅਰ ਨੂੰ ਇੱਕ ਆਸਾਨ ਕਵਿਜ਼ - ਸਹੀ 15 ਕਲਾਸ ਦੀ 11 ਤਾਰਿਆਂ ਦੀ ਸ਼੍ਰੇਣੀਵਾਰ ਕਲਾਸੀਫਾਈਡ ਕਰਨਾ ਸੀ - ਅਤੇ ਫਿਰ ਇੱਕ ਸਧਾਰਨ ਵੈਬ-ਅਧਾਰਿਤ ਇੰਟਰਫੇਸ (ਚਿੱਤਰ 5.3) ਰਾਹੀਂ ਅਣਪਛਾਤਾ ਗਲੈਕਸੀਆਂ ਦੀ ਅਸਲੀ ਸ਼੍ਰੇਣੀ ਨੂੰ ਸ਼ੁਰੂ ਕਰਨਾ ਸੀ. ਵਲੰਟੀਅਰ ਤੋਂ ਲੈ ਕੇ ਖਗੋਲ-ਵਿਗਿਆਨੀ ਤੱਕ ਦਾ ਸੰਚਾਲਨ 10 ਮਿੰਟ ਤੋਂ ਵੀ ਘੱਟ ਸਮੇਂ ਵਿਚ ਹੁੰਦਾ ਹੈ ਅਤੇ ਸਿਰਫ ਰੁਕਾਵਟਾਂ ਦੇ ਨਿਮਨਤਮ ਪਾਸ ਕਰਨ ਲਈ ਲੋੜੀਂਦਾ ਹੈ, ਇੱਕ ਸਧਾਰਨ ਕਵਿਜ਼.

ਚਿੱਤਰ 5.2: ਦੋ ਮੁੱਖ ਕਿਸਮ ਦੀਆਂ ਗਲੈਕਸੀਆਂ ਦੇ ਉਦਾਹਰਣ: ਚੱਕਰ ਅਤੇ ਅੰਡਾਕਾਰ. ਗਲੈਕਸੀ ਚਿੜੀਆਘਰ ਪ੍ਰੋਜੈਕਟ ਨੇ 900,000 ਤੋਂ ਵੱਧ ਤਸਵੀਰਾਂ ਨੂੰ ਸ਼੍ਰੇਣੀਬੱਧ ਕਰਨ ਲਈ 100,000 ਤੋਂ ਵੱਧ ਸਵੈਸੇਵਕ ਵਰਤੇ ਹਨ. Http://www.GalaxyZoo.org ਅਤੇ Sloan ਡਿਜੀਟਲ ਸਕਾਈ ਸਰਵੇ ਦੀ ਇਜਾਜ਼ਤ ਨਾਲ ਦੁਬਾਰਾ ਤਿਆਰ ਕੀਤਾ ਗਿਆ.

ਚਿੱਤਰ 5.2: ਦੋ ਮੁੱਖ ਕਿਸਮ ਦੀਆਂ ਗਲੈਕਸੀਆਂ ਦੇ ਉਦਾਹਰਣ: ਚੱਕਰ ਅਤੇ ਅੰਡਾਕਾਰ. ਗਲੈਕਸੀ ਚਿੜੀਆਘਰ ਪ੍ਰੋਜੈਕਟ ਨੇ 900,000 ਤੋਂ ਵੱਧ ਤਸਵੀਰਾਂ ਨੂੰ ਸ਼੍ਰੇਣੀਬੱਧ ਕਰਨ ਲਈ 100,000 ਤੋਂ ਵੱਧ ਸਵੈਸੇਵਕ ਵਰਤੇ. Http://www.GalaxyZoo.org ਅਤੇ Sloan ਡਿਜੀਟਲ ਸਕਾਈ ਸਰਵੇ ਦੀ ਇਜਾਜ਼ਤ ਨਾਲ ਦੁਬਾਰਾ ਤਿਆਰ ਕੀਤਾ ਗਿਆ.

ਚਿੱਤਰ 5.3: ਇੰਪੁੱਟ ਸਕਰੀਨ ਜਿੱਥੇ ਵਲੰਟੀਅਰਾਂ ਨੂੰ ਇੱਕ ਚਿੱਤਰ ਨੂੰ ਵਰਗੀਕਰਨ ਕਰਨ ਲਈ ਕਿਹਾ ਗਿਆ. ਸਲੌਨ ਡਿਜ਼ੀਟਲ ਸਕਾਈ ਸਰਵੇ ਤੋਂ ਇੱਕ ਚਿੱਤਰ ਦੇ ਆਧਾਰ ਤੇ ਕ੍ਰਿਸ ਲਿੰਟੋਟ ਦੀ ਅਨੁਮਤੀ ਦੁਆਰਾ ਮੁੜ ਤਿਆਰ ਕੀਤਾ ਗਿਆ.

ਚਿੱਤਰ 5.3: ਇੰਪੁੱਟ ਸਕਰੀਨ ਜਿੱਥੇ ਵਲੰਟੀਅਰਾਂ ਨੂੰ ਇੱਕ ਚਿੱਤਰ ਨੂੰ ਵਰਗੀਕਰਨ ਕਰਨ ਲਈ ਕਿਹਾ ਗਿਆ. ਸਲੌਨ ਡਿਜ਼ੀਟਲ ਸਕਾਈ ਸਰਵੇ ਤੋਂ ਇੱਕ ਚਿੱਤਰ ਦੇ ਆਧਾਰ ਤੇ ਕ੍ਰਿਸ ਲਿੰਟੋਟ ਦੀ ਅਨੁਮਤੀ ਦੁਆਰਾ ਮੁੜ ਤਿਆਰ ਕੀਤਾ ਗਿਆ.

ਇਸ ਪ੍ਰਾਜੈਕਟ ਨੂੰ ਇਕ ਨਵੇਂ ਲੇਖ ਵਿਚ ਪੇਸ਼ ਕੀਤਾ ਗਿਆ ਸੀ ਅਤੇ ਇਸ ਤੋਂ ਲਗਭਗ ਛੇ ਮਹੀਨਿਆਂ ਵਿਚ ਗਲੈਕਸੀ ਚਿੜੀਆਘਰ ਨੇ ਆਪਣੇ ਸ਼ੁਰੂਆਤੀ ਵਲੰਟੀਅਰਾਂ ਨੂੰ ਖਿੱਚਿਆ ਅਤੇ ਇਕ ਲੱਖ ਤੋਂ ਵੱਧ ਨਾਗਰਿਕ ਵਿਗਿਆਨੀਆਂ ਨੂੰ ਸ਼ਾਮਲ ਕਰਨ ਲਈ ਇਸ ਪ੍ਰਾਜੈਕਟ ਵਿਚ ਵਾਧਾ ਹੋਇਆ ਜਿਸ ਵਿਚ ਉਹ ਹਿੱਸਾ ਲੈ ਰਹੇ ਸਨ ਕਿਉਂਕਿ ਉਨ੍ਹਾਂ ਨੇ ਕੰਮ ਦਾ ਅਨੰਦ ਮਾਣਿਆ ਅਤੇ ਉਹ ਖਗੋਲ-ਵਿਗਿਆਨ ਨੂੰ ਅੱਗੇ ਵਧਾਉਣਾ ਚਾਹੁੰਦੇ ਸਨ. ਇਕੱਠਿਆਂ, ਇਹਨਾਂ 100,000 ਵਾਲੰਟੀਅਰਾਂ ਨੇ ਕੁੱਲ 40 ਮਿਲੀਅਨ ਕਲਾਸਾਂ ਦੀ ਵੰਡ ਕੀਤੀ, ਜਿਸ ਵਿੱਚ ਬਹੁਗਿਣਤੀ ਹਿੱਸਾ ਲੈਣ ਵਾਲੇ ਹਿੱਸੇਦਾਰਾਂ (Lintott et al. 2008) ਮੁਕਾਬਲਤਨ ਛੋਟੇ, ਮੁੱਖ ਸਮੂਹ ਤੋਂ ਆ ਰਹੇ ਸਨ.

ਖੋਜਕਰਤਾਵਾਂ ਜਿਨ੍ਹਾਂ ਕੋਲ ਅੰਡਰਗਰੈਜੁਏਟ ਖੋਜੀ ਸਹਾਇਕਾਂ ਨੂੰ ਭਰਤੀ ਕਰਨ ਦਾ ਤਜਰਬਾ ਹੈ, ਉਹ ਤੁਰੰਤ ਡਾਟਾ ਗੁਣਵੱਤਾ ਬਾਰੇ ਸ਼ੱਕੀ ਹੋ ਸਕਦੇ ਹਨ. ਹਾਲਾਂਕਿ ਇਹ ਸੰਦੇਹਵਾਦ ਜਾਇਜ਼ ਹੈ, ਪਰ ਗਲੈਕਸੀ ਚਿੜੀਆਮ ਇਹ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ ਜਦ ਵਾਲੰਟੀਅਰਾਂ ਦੇ ਯੋਗਦਾਨ ਸਹੀ ਤਰੀਕੇ ਨਾਲ ਸਾਫ ਹੋ ਜਾਂਦੇ ਹਨ, ਡਿਬਾਇਜ਼ਡ ਹੁੰਦੇ ਹਨ ਅਤੇ ਜੋੜਦੇ ਹਨ, ਤਾਂ ਉਹ ਉੱਚ ਗੁਣਵੱਤਾ ਦੇ ਨਤੀਜੇ (Lintott et al. 2008) ਤਿਆਰ ਕਰ ਸਕਦੇ ਹਨ. ਭੀੜ ਨੂੰ ਪੇਸ਼ੇਵਰਾਨਾ-ਕੁਆਲੀਫਾਇਲੀ ਡਾਟਾ ਬਣਾਉਣ ਲਈ ਇਕ ਮਹੱਤਵਪੂਰਨ ਚਾਲ, ਰਿਡੰਡਸੀ ਹੈ, ਜਿਸਦਾ ਮਤਲਬ ਹੁੰਦਾ ਹੈ ਕਿ ਬਹੁਤ ਸਾਰੇ ਵੱਖ-ਵੱਖ ਲੋਕਾਂ ਦੁਆਰਾ ਕੀਤਾ ਗਿਆ ਕੰਮ ਹੈ ਗਲੈਕਸੀ ਚਿੜੀਆਘਰ ਵਿਚ, ਹਰ ਗਲੈਕਸੀ ਪ੍ਰਤੀ ਤਕਰੀਬਨ 40 ਕਲਾਸਾਂ ਸਨ; ਅੰਡਰਗਰੈਜੂਏਟ ਰਿਸਰਚ ਸਹਾਇਕ ਦੀ ਵਰਤੋਂ ਕਰਨ ਵਾਲੇ ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਕਦੇ ਵੀ ਇਸ ਪੱਧਰ ਦੇ ਰਿਡੰਡਸੀ ਦੀ ਕਮੀ ਨਹੀਂ ਕੀਤੀ ਅਤੇ ਇਸ ਲਈ ਹਰੇਕ ਵਿਅਕਤੀਗਤ ਵਰਗੀਕਰਣ ਦੀ ਗੁਣਵੱਤਾ ਨਾਲ ਵਧੇਰੇ ਸਬੰਧਿਤ ਹੋਣ ਦੀ ਲੋੜ ਹੋਵੇਗੀ. ਵਲੰਟੀਅਰਾਂ ਦੀ ਟ੍ਰੇਨਿੰਗ ਦੀ ਘਾਟ ਸੀ, ਉਨ੍ਹਾਂ ਨੇ ਆਪਣੇ ਆਪ ਨੂੰ ਰਿਡੰਡਸੀ ਨਾਲ ਬਣਾਇਆ

ਇੱਥੋਂ ਤੱਕ ਕਿ ਹਰ ਗਲੈਕਸੀ ਵਿੱਚ ਕਈ ਵਰਗਿਆਂ ਦੇ ਨਾਲ, ਹਾਲਾਂਕਿ, ਸਰਬਸੰਮਤੀ ਵਰਗੀਕਰਣ ਨੂੰ ਤਿਆਰ ਕਰਨ ਲਈ ਸਵੈ-ਇੱਛੁਕ ਵਰਗ ਦੇ ਜੋੜਾਂ ਨੂੰ ਜੋੜਨਾ ਮੁਸ਼ਕਿਲ ਸੀ. ਕਿਉਂਕਿ ਜ਼ਿਆਦਾਤਰ ਮਨੁੱਖੀ ਗਣਨਾ ਪ੍ਰੋਜੈਕਟਾਂ ਵਿੱਚ ਬਹੁਤ ਸਾਰੀਆਂ ਚੁਣੌਤੀਆਂ ਪੈਦਾ ਹੁੰਦੀਆਂ ਹਨ, ਇਸ ਲਈ ਤਿੰਨ ਕਦਮ ਦੀ ਥੋੜ੍ਹੀ ਜਿਹੀ ਸਮੀਖਿਆ ਕਰਨ ਵਿੱਚ ਮਦਦਗਾਰ ਹੁੰਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਗਲੈਕਸੀ ਚਿੜੀਆ ਖੋਜ ਕਰਨ ਵਾਲੇ ਆਪਣੇ ਸਹਿਮਤੀ ਵਰਗੀਕਰਨ ਤਿਆਰ ਕਰਨ ਲਈ ਵਰਤੇ ਗਏ ਸਨ. ਸਭ ਤੋਂ ਪਹਿਲਾਂ, ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਜਾਅਲੀ ਸ਼੍ਰੇਣੀਆਂ ਨੂੰ ਹਟਾ ਕੇ ਡਾਟਾ ਸਾਫ ਕੀਤਾ. ਉਦਾਹਰਣ ਵਜੋਂ, ਉਹ ਲੋਕ ਜਿਹਨਾਂ ਨੇ ਵਾਰ-ਵਾਰ ਇੱਕੋ ਗਲੈਕਸੀ ਨੂੰ ਵੰਡਿਆ-ਅਜਿਹਾ ਕੁਝ ਜਿਹੜਾ ਕੀ ਹੋਵੇਗਾ ਜੇ ਉਹ ਨਤੀਜਿਆਂ ਨੂੰ ਛੇੜਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਰਹੇ ਹੋਣ - ਉਨ੍ਹਾਂ ਦੇ ਸਾਰੇ ਵਰਗੀਕਰਨ ਰੱਦ ਕੀਤੇ ਗਏ ਸਨ ਇਹ ਅਤੇ ਹੋਰ ਸਮਾਨ ਸਫਾਈ ਨਾਲ ਸਾਰੇ ਵਰਗੀਕਰਣਾਂ ਵਿੱਚੋਂ ਲਗਪਗ 4% ਹਟਾਇਆ ਗਿਆ.

ਦੂਜਾ, ਸਫਾਈ ਕਰਨ ਤੋਂ ਬਾਅਦ, ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਸ਼੍ਰੇਣੀਕਰਣ ਵਿਚ ਵਿਵਸਥਤ ਪ੍ਰਭਾਵਾਂ ਨੂੰ ਹਟਾਉਣ ਦੀ ਲੋੜ ਸੀ. ਅਸਲੀ ਪ੍ਰੋਜੈਕਟ ਦੇ ਅੰਦਰ-ਅੰਦਰ ਮੌਜੂਦ ਕੁਝ ਪੱਖਪਾਤ ਦੀ ਖੋਜ ਦੇ ਅਧਿਐਨਾਂ ਦੁਆਰਾ - ਉਦਾਹਰਣ ਵਜੋਂ, ਕੁਝ ਸਵੈਸੇਵਕਾਂ ਨੂੰ ਰੰਗਾਂ ਦੀ ਬਜਾਏ ਮੋਨੋਚੋਮਿਕ ਵਿੱਚ ਗਲੈਕਸੀ ਦਿਖਾਉਂਦੇ ਹੋਏ- ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਕਈ ਵਿਵਸਥਿਤ ਪੱਖਪਾਆਂ ਦੀ ਖੋਜ ਕੀਤੀ, ਜਿਵੇਂ ਕਿ ਅੰਡਾਕਾਰ ਗਲੈਕਸੀਆਂ (Bamford et al. 2009) ਇਹਨਾਂ ਵਿਵਸਾਇਕ ਪ੍ਰਪੱਕਤਾਵਾਂ ਲਈ ਅਡਜੱਸਟ ਕਰਨਾ ਬਹੁਤ ਮਹੱਤਵਪੂਰਨ ਹੈ ਕਿਉਂਕਿ ਰਿਡੰਡਸੀ ਆਪਣੇ ਆਪ ਨੂੰ ਵਿਵਸਥਿਤ ਪੱਖਪਾਤੀ ਨਹੀਂ ਹਟਾਉਂਦੀ; ਇਹ ਸਿਰਫ ਬੇਤਰਤੀਬ ਗਲਤੀ ਨੂੰ ਹਟਾਉਣ ਵਿੱਚ ਸਹਾਇਤਾ ਕਰਦਾ ਹੈ

ਅੰਤ ਵਿੱਚ, ਡੀਬੀਆਈਿੰਗ ਤੋਂ ਬਾਅਦ, ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਇੱਕਸਾਰ ਸਿਧਾਂਤ ਤਿਆਰ ਕਰਨ ਲਈ ਵਿਅਕਤੀਗਤ ਵਰਗੀਕਰਨ ਨੂੰ ਜੋੜਨ ਦੇ ਇੱਕ ਢੰਗ ਦੀ ਲੋੜ ਸੀ. ਹਰੇਕ ਗਲੈਕਸੀ ਲਈ ਵਰਗੀਕਰਨ ਨੂੰ ਜੋੜਨ ਦਾ ਸਭ ਤੋਂ ਆਸਾਨ ਤਰੀਕਾ ਸਭ ਤੋਂ ਆਮ ਵਰਗੀਕਰਨ ਨੂੰ ਚੁਣਨਾ ਸੀ. ਹਾਲਾਂਕਿ, ਇਸ ਪਹੁੰਚ ਨੇ ਹਰੇਕ ਵਾਲੰਟੀਅਰ ਨੂੰ ਬਰਾਬਰ ਦੇ ਵਜ਼ਨ ਦੇਣਾ ਸੀ, ਅਤੇ ਖੋਜਕਾਰਾਂ ਨੂੰ ਸ਼ੱਕ ਸੀ ਕਿ ਕੁੱਝ ਸਵੈਸੇਵਾ ਦੂਜਿਆਂ ਨਾਲੋਂ ਵਰਗੀਕਰਨ ਵਿਚ ਬਿਹਤਰ ਸਨ. ਇਸ ਲਈ, ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਇੱਕ ਹੋਰ ਗੁੰਝਲਦਾਰ ਰਿਸਪਾਈਵਿੰਗ ਵੇਟਿੰਗ ਵਿਧੀ ਵਿਕਸਤ ਕੀਤੀ ਜੋ ਕਿ ਵਧੀਆ ਕਲਾਸੀਫਾਈਰਾਂ ਨੂੰ ਖੋਜਣ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਹੋਰ ਭਾਰ ਦੇਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕੀਤੀ.

ਇਸ ਤਰ੍ਹਾਂ, ਤਿੰਨ ਕਦਮ ਦੀ ਪ੍ਰਕਿਰਿਆ ਤੋਂ ਬਾਅਦ- ਸਫਾਈ, ਡੈਬਿਏਸਿੰਗ, ਅਤੇ ਵਜ਼ਨ- ਗਲੈਕਸੀ ਚਿੜੀਆਘਰ ਖੋਜ ਟੀਮ ਨੇ 40 ਮਿਲੀਅਨ ਸਵੈਸੇਵਕ ਸ਼੍ਰੇਣੀਆਂ ਨੂੰ ਸਹਿਮਤੀ ਸਰੂਪ ਵਿਗਿਆਨਿਕ ਸ਼੍ਰੇਣੀ ਦੇ ਸਮੂਹ ਵਿੱਚ ਬਦਲ ਦਿੱਤਾ. ਜਦੋਂ ਇਹ ਗਲੈਕਸੀ ਚਿੜੀਘਰ ਦੇ ਕਲਾਸਾਂ ਦੀ ਤੁਲਨਾ ਪੇਸ਼ੇਵਰ ਖਗੋਲ ਵਿਗਿਆਨੀਆਂ ਦੁਆਰਾ ਕੀਤੇ ਗਏ ਪਹਿਲੇ ਤਿੰਨ ਛੋਟੇ-ਪੱਧਰ ਦੇ ਯਤਨਾਂ ਨਾਲ ਕੀਤੀ ਗਈ ਸੀ, ਜਿਸ ਵਿੱਚ ਸਕੈਵਨਿਸ਼ਕੀ ਦੁਆਰਾ ਵਰਗੀਕਰਨ ਵੀ ਸ਼ਾਮਲ ਸੀ, ਜਿਸ ਨੇ ਗਲੈਕਸੀ ਚਿੜੀਘਰ ਨੂੰ ਪ੍ਰੇਰਿਤ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕੀਤੀ ਸੀ, ਇੱਥੇ ਇਕ ਮਜ਼ਬੂਤ ​​ਸਮਝੌਤਾ ਸੀ. ਇਸ ਤਰ੍ਹਾਂ, ਸਵੈਸੇਵੀਆਂ, ਕੁੱਲ ਮਿਲਾਕੇ, ਉੱਚ ਗੁਣਵੱਤਾ ਦੇ ਵਰਗੀਕਰਨ ਪ੍ਰਦਾਨ ਕਰਨ ਦੇ ਯੋਗ ਸਨ ਅਤੇ ਇੱਕ ਅਜਿਹੇ ਪੱਧਰ ਤੇ ਜੋ ਖੋਜਕਰਤਾ ਮੇਲ ਨਹੀਂ ਕਰ ਸਕਦੇ (Lintott et al. 2008) . ਦਰਅਸਲ, ਅਜਿਹੀਆਂ ਵੱਡੀ ਗਿਣਤੀ ਵਿਚ ਗਲੈਕਸੀਆਂ ਲਈ ਮਨੁੱਖੀ ਸ਼੍ਰੇਣੀਆਂ ਹੋਣ ਕਰਕੇ, ਸ਼ੌਵਿਨਸਕੀ, ਲਿੰਟੋਟ ਅਤੇ ਹੋਰ ਇਹ ਦਿਖਾਉਂਦੇ ਸਨ ਕਿ ਸਿਰਫ 80% ਗਲੈਕਸੀਆਂ ਹੀ ਉਮੀਦ ਅਨੁਸਾਰ ਪੈਟਰਨ-ਨੀਲਾ ਸਪਿਰਰਾਂ ਅਤੇ ਲਾਲ ਅੰਡਾਕਾਰ - ਅਤੇ ਕਈ ਕਾਗਜ਼ਾਂ ਬਾਰੇ ਲਿਖੀਆਂ ਗਈਆਂ ਹਨ ਇਹ ਖੋਜ (Fortson et al. 2011)

ਇਸ ਬੈਕਗ੍ਰਾਉਂਡ ਨੂੰ ਦੇਖਦੇ ਹੋਏ, ਤੁਸੀਂ ਹੁਣ ਵੇਖ ਸਕਦੇ ਹੋ ਕਿ ਗਲੈਕਸੀ ਚਿੜੀਆ ਦਾ ਭੰਡਾਰ-ਪ੍ਰਭਾਵੀ-ਜੋੜ ਵਿਅੰਜਨ ਦੀ ਪਾਲਣਾ ਕਿਵੇਂ ਕੀਤੀ ਜਾ ਸਕਦੀ ਹੈ, ਜੋ ਕਿ ਬਹੁਤ ਸਾਰੇ ਮਨੁੱਖੀ ਗਣਨਾ ਪ੍ਰਾਜੈਕਟਾਂ ਲਈ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ. ਪਹਿਲੀ, ਇੱਕ ਵੱਡੀ ਸਮੱਸਿਆਵਾਂ ਵਿਭਾਜਨ ਵਿੱਚ ਵੰਡੀਆਂ ਹੁੰਦੀਆਂ ਹਨ. ਇਸ ਮਾਮਲੇ ਵਿਚ, ਇਕ ਗਲੈਕਸੀਆਂ ਨੂੰ ਸ਼੍ਰੇਣੀਬੱਧ ਕਰਨ ਦੀ ਸਮੱਸਿਆ ਨੂੰ ਇਕ ਗਲੈਕਸੀ ਸ਼੍ਰੇਣੀਬੱਧ ਕਰਨ ਦੀ ਇਕ ਮਿਲੀਅਨ ਸਮੱਸਿਆਵਾਂ ਵਿਚ ਵੰਡਿਆ ਗਿਆ ਹੈ. ਅਗਲਾ, ਹਰੇਕ ਚੱਕਰ ਤੇ ਸੁਤੰਤਰ ਰੂਪ ਵਿੱਚ ਇੱਕ ਅਪਰੇਸ਼ਨ ਲਾਗੂ ਕੀਤਾ ਜਾਂਦਾ ਹੈ ਇਸ ਮਾਮਲੇ ਵਿੱਚ, ਵਾਲੰਟੀਅਰਾਂ ਨੇ ਹਰ ਇੱਕ ਗਲੈਕਸੀ ਨੂੰ ਸਰੂਪ ਜਾਂ ਅੰਡਾਕਾਰ ਦੇ ਤੌਰ ਤੇ ਵੰਡਿਆ. ਅੰਤ ਵਿੱਚ, ਨਤੀਜਾ ਇੱਕ ਸਹਿਮਤੀ ਨਤੀਜਾ ਪੈਦਾ ਕਰਨ ਲਈ ਜੋੜਿਆ ਜਾਂਦਾ ਹੈ. ਇਸ ਮਾਮਲੇ ਵਿੱਚ, ਗਠਜੋੜ ਦੇ ਕਦਮ ਵਿੱਚ ਹਰ ਇੱਕ ਗਲੈਕਸੀ ਲਈ ਸਹਿਮਤੀ ਵਰਗੀਕਰਨ ਬਣਾਉਣ ਲਈ ਸਫਾਈ, ਡੈਬਿਏਸਿੰਗ ਅਤੇ ਭਾਰ ਸ਼ਾਮਲ ਸਨ. ਹਾਲਾਂਕਿ ਜ਼ਿਆਦਾਤਰ ਪ੍ਰੋਜੈਕਟਾਂ ਇਹ ਆਮ ਵਿਅੰਜਨ ਵਰਤਦੀਆਂ ਹਨ, ਪਰ ਹਰ ਕਦਮ ਨੂੰ ਵਿਸ਼ੇਸ਼ ਸਮੱਸਿਆ ਦੇ ਅਨੁਸਾਰ ਤਬਦੀਲ ਕੀਤਾ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ. ਉਦਾਹਰਨ ਲਈ, ਹੇਠਾਂ ਦਿੱਤੇ ਮਨੁੱਖੀ ਸੰਕਲਪ ਪ੍ਰੋਜੈਕਟ ਵਿੱਚ, ਉਹੀ ਵਿਅੰਜਨ ਦੀ ਪਾਲਣਾ ਕੀਤੀ ਜਾਵੇਗੀ, ਲੇਕਿਨ ਅਰਜ਼ੀ ਦੇਣੀ ਅਤੇ ਜੋੜ ਨੂੰ ਕਾਫ਼ੀ ਵੱਖਰਾ ਹੋਵੇਗਾ

ਗਲੈਕਸੀ ਚਿੜੀਆਘਰ ਦੀ ਟੀਮ ਲਈ, ਇਹ ਪਹਿਲਾ ਪ੍ਰੋਜੈਕਟ ਸਿਰਫ ਸ਼ੁਰੂਆਤ ਸੀ. ਬਹੁਤ ਤੇਜ਼ੀ ਨਾਲ ਉਨ੍ਹਾਂ ਨੇ ਮਹਿਸੂਸ ਕੀਤਾ ਕਿ ਭਾਵੇਂ ਉਹ ਦਸ ਲੱਖ ਗਲੈਕਸੀਆਂ ਦੇ ਵਰਗੀਕਰਨ ਦੇ ਯੋਗ ਸਨ, ਫਿਰ ਵੀ ਇਹ ਪੈਮਾਨਾ ਨਵੇਂ ਡਿਜੀਟਲ ਅਸਮਾਨ ਸਰਵੇਖਣਾਂ ਨਾਲ ਕੰਮ ਕਰਨ ਲਈ ਕਾਫੀ ਨਹੀਂ ਹੈ, ਜੋ ਲਗਭਗ 10 ਅਰਬ ਗਲੈਕਸੀਆਂ ਦੀਆਂ ਤਸਵੀਰਾਂ ਬਣਾ ਸਕਦਾ ਹੈ (Kuminski et al. 2014) . 10 ਲੱਖ ਤੋਂ 10 ਮਿਲੀਅਨ ਤੱਕ ਦਾ ਵਾਧਾ ਕਰਨ ਲਈ-ਗਲੈਕਸੀ ਚਿੜੀਆਘਰ ਦੇ ਲਗਭਗ 10,000 ਗੁਣਾ ਜ਼ਿਆਦਾ ਹਿੱਸਾ ਲੈਣ ਦੀ ਲੋੜ ਹੋਵੇਗੀ ਹਾਲਾਂਕਿ ਇੰਟਰਨੈਟ ਤੇ ਵਾਲੰਟੀਅਰਾਂ ਦੀ ਗਿਣਤੀ ਬਹੁਤ ਹੈ, ਇਹ ਅਨੰਤ ਨਹੀਂ ਹੈ. ਇਸ ਲਈ, ਖੋਜਕਰਤਾ ਨੂੰ ਇਹ ਅਹਿਸਾਸ ਹੋਇਆ ਕਿ ਜੇ ਉਹ ਲਗਾਤਾਰ ਵਧ ਰਹੀ ਮਾਤਰਾ ਵਿੱਚ ਡੇਟਾ ਨੂੰ ਸੰਭਾਲਣ ਜਾ ਰਹੇ ਸਨ ਤਾਂ ਇੱਕ ਨਵੇਂ, ਹੋਰ ਵੀ ਸਕੇਲੇਬਲ ਪਹੁੰਚ ਦੀ ਜ਼ਰੂਰਤ ਸੀ.

ਇਸ ਲਈ, ਮੰਡੇ ਬੈਨਰਜੀ-ਸਕਵੇਨਸਕੀ, ਲਿੰਟੋਟ ਅਤੇ ਗਲੈਕਸੀ ਜ਼ੂ ਟੀਮ (2010) ਦੇ ਦੂਜੇ ਮੈਂਬਰਾਂ ਨਾਲ ਕੰਮ ਕਰਦੇ ਹੋਏ - ਗਲੈਕਸੀਆਂ ਨੂੰ ਕਲਾਸੀਫਾਈਡ ਕਰਨ ਲਈ ਕੰਪਿਊਟਰਾਂ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣੀ ਸ਼ੁਰੂ ਕੀਤੀ. ਵਧੇਰੇ ਖਾਸ ਤੌਰ ਤੇ, ਗਲੈਕਸੀ ਚਿੜੀਆਘਰ ਦੁਆਰਾ ਬਣਾਈ ਗਈ ਮਨੁੱਖੀ ਵਰਗੀਕਰਣਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ, ਬੈਨਰਜੀ ਨੇ ਇੱਕ ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਮਾਡਲ ਬਣਾਇਆ ਜੋ ਚਿੱਤਰ ਦੀ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦੇ ਆਧਾਰ ਤੇ ਇੱਕ ਗੈਂਲੈਕਟਿਕ ਦੇ ਮਨੁੱਖੀ ਵਰਗ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰ ਸਕਦਾ ਹੈ. ਜੇ ਇਹ ਮਾਡਲ ਉੱਚ ਪੱਧਰਾਂ ਨਾਲ ਮਾਨਵ ਸ਼੍ਰੇਣੀਆਂ ਨੂੰ ਪੁਨਰ ਪੈਦਾ ਕਰ ਸਕਦਾ ਹੈ, ਤਾਂ ਇਹ ਗਲੈਕਸੀ ਚਿੜੀਆ ਖੋਜਾਰਥੀਆਂ ਦੁਆਰਾ ਲਾਜ਼ਮੀ ਗਲੈਕਸੀਆਂ ਦੀ ਅਨੰਤ ਅੰਦਾਜ਼ਨ ਗਿਣਤੀ ਕਰਨ ਲਈ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ.

ਬੈਨਰਜੀ ਅਤੇ ਸਹਿਕਰਮੀਆਂ ਦੀ ਪਹੁੰਚ ਦਾ ਮੁੱਖ ਮੁੱਦਾ ਅਸਲ ਵਿੱਚ ਸਮਾਜਿਕ ਖੋਜ ਲਈ ਵਰਤਿਆ ਜਾਣ ਵਾਲੀਆਂ ਤਕਨੀਕਾਂ ਨਾਲ ਮਿਲਦਾ-ਜੁਲਦਾ ਹੈ, ਹਾਲਾਂਕਿ ਇਹ ਸਮਾਨਤਾ ਪਹਿਲੀ ਨਜ਼ਰ 'ਤੇ ਸਪੱਸ਼ਟ ਨਹੀਂ ਹੋ ਸਕਦੀ. ਸਭ ਤੋਂ ਪਹਿਲਾਂ, ਬੈਨਰਜੀ ਅਤੇ ਸਹਿਕਰਮੀਆਂ ਨੇ ਹਰੇਕ ਚਿੱਤਰ ਨੂੰ ਅੰਕੀ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦੇ ਸਮੂਹ ਵਿਚ ਤਬਦੀਲ ਕਰ ਦਿੱਤਾ ਜਿਸ ਨਾਲ ਇਸਦੀ ਸੰਪੱਤੀ ਦਾ ਸੰਖੇਪ ਕੀਤਾ ਗਿਆ. ਉਦਾਹਰਨ ਲਈ, ਗਲੈਕਸੀਆਂ ਦੀਆਂ ਤਸਵੀਰਾਂ ਲਈ, ਤਿੰਨ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਹੋ ਸਕਦੀਆਂ ਹਨ: ਚਿੱਤਰ ਵਿੱਚ ਨੀਲੇ ਦੀ ਮਾਤਰਾ, ਪਿਕਸਲ ਦੀ ਚਮਕ ਵਿੱਚ ਵਿਭਿੰਨਤਾ ਅਤੇ ਨਾਨ-ਵਾਈਟ ਪਿਕਸਲ ਦਾ ਅਨੁਪਾਤ. ਸਹੀ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦੀ ਚੋਣ ਸਮੱਸਿਆ ਦਾ ਇੱਕ ਮਹੱਤਵਪੂਰਣ ਹਿੱਸਾ ਹੈ, ਅਤੇ ਇਸ ਨੂੰ ਆਮ ਤੌਰ ਤੇ ਵਿਸ਼ੇ-ਖੇਤਰ ਦੇ ਮਹਾਰਤ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ ਇਹ ਪਹਿਲਾ ਕਦਮ, ਆਮ ਤੌਰ ਤੇ ਫੀਚਰ ਇੰਜਨੀਅਰਿੰਗ ਕਹਾਉਂਦਾ ਹੈ, ਇੱਕ ਚਿੱਤਰ ਪ੍ਰਤੀ ਇਕ ਰਾਜ਼ ਦੇ ਨਾਲ ਇੱਕ ਡਾਟਾ ਮੈਟ੍ਰਿਕਸ ਵਿੱਚ ਨਤੀਜਾ ਹੁੰਦਾ ਹੈ ਅਤੇ ਫਿਰ ਉਸ ਚਿੱਤਰ ਦਾ ਵਰਣਨ ਕਰਨ ਲਈ ਤਿੰਨ ਕਾਲਮ. ਡੇਟਾ ਮੈਟ੍ਰਿਕਸ ਅਤੇ ਇੱਛਤ ਆਉਟਪੁੱਟ (ਉਦਾਹਰਣ ਵਜੋਂ, ਚਿੱਤਰ ਨੂੰ ਅੰਡਾਕਾਰ ਗਲੈਕਸੀ ਦੇ ਰੂਪ ਵਿੱਚ ਇੱਕ ਮਨੁੱਖ ਦੁਆਰਾ ਸ਼੍ਰੇਣੀਬੱਧ ਕੀਤਾ ਗਿਆ ਹੈ) ਦੇ ਮੱਦੇਨਜ਼ਰ, ਖੋਜਕਰਤਾ ਇੱਕ ਅੰਕੜਾ ਜਾਂ ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਮਾਡਲ ਤਿਆਰ ਕਰਦਾ ਹੈ - ਉਦਾਹਰਨ ਲਈ, ਤਰਕਸੰਗੀ ਰਿਗਰੈਸ਼ਨ-ਜੋ ਕਿ ਮਨੁੱਖੀ ਵਰਗੀਕਰਨ ਦੀ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦੇ ਅਧਾਰ ਤੇ ਅਨੁਮਾਨਿਤ ਹੈ ਚਿੱਤਰ ਦੇ ਅਖੀਰ ਵਿੱਚ, ਖੋਜਕਾਰ ਇਸ ਅੰਕੜਾ ਮਾਡਲ ਵਿੱਚ ਮਾਪਦੰਡਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ ਤਾਂ ਜੋ ਨਵੀਂ ਗਲੈਕਸੀਆਂ (ਚਿੱਤਰ 5.4) ਦੀ ਅੰਦਾਜ਼ਨ ਵਰਗ ਦਾ ਅਨੁਮਾਨ ਲਗਾਇਆ ਜਾ ਸਕੇ. ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਵਿਚ ਲੇਬਲ ਵਾਲੀਆਂ ਉਦਾਹਰਣਾਂ ਦਾ ਇਸਤੇਮਾਲ ਕਰਦੇ ਹੋਏ ਇਕ ਅਜਿਹਾ ਮਾਡਲ ਤਿਆਰ ਕਰਨਾ ਹੈ ਜੋ ਫਿਰ ਨਵੇਂ ਡੈਟਾ ਨੂੰ ਲੇਬਲ ਦੇ ਸਕਦਾ ਹੈ- ਨਿਗਰਾਨੀ ਨਿਗਰਾਨ ਨੂੰ ਕਿਹਾ ਜਾਂਦਾ ਹੈ.

ਚਿੱਤਰ 5.4: ਬੈਨਰਜੀ ਐਟ ਅਲ ਦਾ ਸਧਾਰਨ ਵੇਰਵਾ (2010) ਗਲੈਕਸੀ ਚਿੜੀਆ ਮਿਸਤਰੀ ਕਲਾਸੀਫਿਕੇਸ਼ਨ ਕਰਨ ਲਈ ਇੱਕ ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਮਾਡਲ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਵਰਤੀਆਂ ਗਈਆਂ ਕਲਾਸਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਸੀ. ਗਲੈਕਸੀਆਂ ਦੀਆਂ ਤਸਵੀਰਾਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦੇ ਮੈਟਰਿਕ ਵਿੱਚ ਬਦਲੀਆਂ ਗਈਆਂ ਸਨ ਇਸ ਸਧਾਰਨ ਉਦਾਹਰਨ ਵਿੱਚ, ਤਿੰਨ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਹਨ (ਚਿੱਤਰ ਵਿੱਚ ਨੀਲੇ ਦੀ ਮਾਤਰਾ, ਪਿਕਸਲ ਦੀ ਚਮਕ ਵਿੱਚ ਫਰਕ ਅਤੇ nonwhite ਪਿਕਸਲ ਦਾ ਅਨੁਪਾਤ). ਫਿਰ, ਤਸਵੀਰਾਂ ਦੇ ਸਬਸੈੱਟ ਲਈ, ਇਕ ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਮਾਡਲ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਗਲੈਕਸੀ ਚਿੜੀਆਘਰ ਲੇਬਲ ਵਰਤੇ ਜਾਂਦੇ ਹਨ. ਅੰਤ ਵਿੱਚ, ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਦੀ ਵਰਤੋਂ ਬਾਕੀ ਗਲੈਕਸੀਆਂ ਲਈ ਵਰਗਿਆਂ ਦਾ ਅਨੁਮਾਨ ਲਗਾਉਣ ਲਈ ਕੀਤੀ ਜਾਂਦੀ ਹੈ. ਮੈਂ ਇਸ ਨੂੰ ਕੰਪਿਊਟਰ ਦੀ ਸਹਾਇਤਾ ਨਾਲ ਮਨੁੱਖੀ ਗਣਨਾ ਪ੍ਰਾਜੈਕਟ ਆਖਦਾ ਹਾਂ ਕਿਉਂਕਿ, ਇਨਸਾਨਾਂ ਨੂੰ ਸਮੱਸਿਆ ਦਾ ਹੱਲ ਕਰਨ ਦੀ ਬਜਾਏ, ਇਸ ਵਿਚ ਇਨਸਾਨਾਂ ਦਾ ਡਾਟਾਸੈਟ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ ਜੋ ਕਿ ਸਮੱਸਿਆ ਨੂੰ ਹੱਲ ਕਰਨ ਲਈ ਕਿਸੇ ਕੰਪਿਊਟਰ ਨੂੰ ਸਿਖਲਾਈ ਲਈ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ. ਇਸ ਕੰਪਿਊਟਰ-ਆਧਾਰਿਤ ਮਨੁੱਖੀ ਗਣਨਾ ਪ੍ਰਣਾਲੀ ਦਾ ਫਾਇਦਾ ਇਹ ਹੈ ਕਿ ਇਹ ਮਨੁੱਖੀ ਜਤਨਾਂ ਦੀ ਸਿਰਫ ਇੱਕ ਸੀਮਿਤ ਰਾਸ਼ੀ ਦਾ ਇਸਤੇਮਾਲ ਕਰਕੇ ਬੇਅੰਤ ਅੰਦਾਜ਼ਿਆਂ ਨੂੰ ਸੰਭਾਲਣ ਦੇ ਯੋਗ ਬਣਾਉਂਦਾ ਹੈ. ਸ੍ਲੋਨ ਡਿਜੀਟਲ ਸਕਾਈ ਸਰਵੇ ਦੀ ਇਜਾਜ਼ਤ ਨਾਲ ਮੁੜ ਛਾਪੇ ਗਏ ਗਲੈਕਸੀਆਂ ਦੀਆਂ ਤਸਵੀਰਾਂ.

ਚਿੱਤਰ 5.4: Banerji et al. (2010) ਸਧਾਰਨ ਵੇਰਵਾ Banerji et al. (2010) ਗਲੈਕਸੀ ਚਿੜੀਆ ਮਿਸਤਰੀ ਕਲਾਸੀਫਿਕੇਸ਼ਨ ਕਰਨ ਲਈ ਇੱਕ ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਮਾਡਲ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਵਰਤੀਆਂ ਗਈਆਂ ਕਲਾਸਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਸੀ. ਗਲੈਕਸੀਆਂ ਦੀਆਂ ਤਸਵੀਰਾਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦੇ ਮੈਟਰਿਕ ਵਿੱਚ ਬਦਲੀਆਂ ਗਈਆਂ ਸਨ ਇਸ ਸਧਾਰਨ ਉਦਾਹਰਨ ਵਿੱਚ, ਤਿੰਨ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਹਨ (ਚਿੱਤਰ ਵਿੱਚ ਨੀਲੇ ਦੀ ਮਾਤਰਾ, ਪਿਕਸਲ ਦੀ ਚਮਕ ਵਿੱਚ ਫਰਕ ਅਤੇ nonwhite ਪਿਕਸਲ ਦਾ ਅਨੁਪਾਤ). ਫਿਰ, ਤਸਵੀਰਾਂ ਦੇ ਸਬਸੈੱਟ ਲਈ, ਇਕ ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਮਾਡਲ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਗਲੈਕਸੀ ਚਿੜੀਆਘਰ ਲੇਬਲ ਵਰਤੇ ਜਾਂਦੇ ਹਨ. ਅੰਤ ਵਿੱਚ, ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਦੀ ਵਰਤੋਂ ਬਾਕੀ ਗਲੈਕਸੀਆਂ ਲਈ ਵਰਗਿਆਂ ਦਾ ਅਨੁਮਾਨ ਲਗਾਉਣ ਲਈ ਕੀਤੀ ਜਾਂਦੀ ਹੈ. ਮੈਂ ਇਸ ਨੂੰ ਕੰਪਿਊਟਰ ਦੀ ਸਹਾਇਤਾ ਨਾਲ ਮਨੁੱਖੀ ਗਣਨਾ ਪ੍ਰਾਜੈਕਟ ਆਖਦਾ ਹਾਂ ਕਿਉਂਕਿ, ਇਨਸਾਨਾਂ ਨੂੰ ਸਮੱਸਿਆ ਦਾ ਹੱਲ ਕਰਨ ਦੀ ਬਜਾਏ, ਇਸ ਵਿਚ ਇਨਸਾਨਾਂ ਦਾ ਡਾਟਾਸੈਟ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ ਜੋ ਕਿ ਸਮੱਸਿਆ ਨੂੰ ਹੱਲ ਕਰਨ ਲਈ ਕਿਸੇ ਕੰਪਿਊਟਰ ਨੂੰ ਸਿਖਲਾਈ ਲਈ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ. ਇਸ ਕੰਪਿਊਟਰ-ਆਧਾਰਿਤ ਮਨੁੱਖੀ ਗਣਨਾ ਪ੍ਰਣਾਲੀ ਦਾ ਫਾਇਦਾ ਇਹ ਹੈ ਕਿ ਇਹ ਮਨੁੱਖੀ ਜਤਨਾਂ ਦੀ ਸਿਰਫ ਇੱਕ ਸੀਮਿਤ ਰਾਸ਼ੀ ਦਾ ਇਸਤੇਮਾਲ ਕਰਕੇ ਬੇਅੰਤ ਅੰਦਾਜ਼ਿਆਂ ਨੂੰ ਸੰਭਾਲਣ ਦੇ ਯੋਗ ਬਣਾਉਂਦਾ ਹੈ. ਸ੍ਲੋਨ ਡਿਜੀਟਲ ਸਕਾਈ ਸਰਵੇ ਦੀ ਇਜਾਜ਼ਤ ਨਾਲ ਮੁੜ ਛਾਪੇ ਗਏ ਗਲੈਕਸੀਆਂ ਦੀਆਂ ਤਸਵੀਰਾਂ.

ਬੈਨਰਜੀ ਅਤੇ ਸਹਿਕਰਮੀਆਂ ਦੀ ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਮਾਡਲ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਮੇਰੇ ਖਿਡੌਣੇ ਦੀ ਉਦਾਹਰਨ ਦੇ ਮੁਕਾਬਲੇ ਵਧੇਰੇ ਗੁੰਝਲਦਾਰ ਸਨ-ਮਿਸਾਲ ਵਜੋਂ, ਉਸਨੇ "ਡੀ ਵੁਕੋਲੂਰਸ ਫਿਟ ਅੋਇਅਲ ਰੇਸ਼ੋ" ਵਰਗੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦੀ ਵਰਤੋਂ ਕੀਤੀ- ਅਤੇ ਉਸਦਾ ਮਾਡਲ ਲੌਜਿਕ ਰਿਗਰੈਸ਼ਨ ਨਹੀਂ ਸੀ, ਇਹ ਇੱਕ ਨਕਲੀ ਨੁਰੁਅਲ ਨੈਟਵਰਕ ਸੀ. ਉਸ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ, ਉਸ ਦੇ ਮਾਡਲ ਅਤੇ ਸਮਸਤਰ ਗੈਲੇਸੀ ਜ਼ੂ ਕਲਾਸਾਂ ਦੀ ਵਰਤੋਂ ਕਰਨ ਨਾਲ, ਉਹ ਹਰ ਵਿਸ਼ੇਸ਼ਤਾ ਤੇ ਵਜ਼ਨ ਬਣਾਉਣ ਵਿਚ ਸਮਰੱਥ ਸੀ, ਅਤੇ ਫਿਰ ਇਹਨਾਂ ਵਸਤੂਆਂ ਦੀ ਵਰਤੋਂ ਗਲੈਕਸੀਆਂ ਦੇ ਵਰਗੀਕਰਨ ਬਾਰੇ ਭਵਿੱਖਬਾਣੀਆਂ ਕਰਨ ਲਈ ਕਰਦੀ ਸੀ. ਉਦਾਹਰਨ ਲਈ, ਉਸ ਦੇ ਵਿਸ਼ਲੇਸ਼ਣ ਵਿੱਚ ਇਹ ਪਾਇਆ ਗਿਆ ਕਿ ਘੱਟ "ਡੀ ਵੁਕੋਲੂਰਸ ਅਕਸ਼ੈ ਪੈਰੀਟ ਵਿੱਚ ਫਿੱਟ" ਵਾਲੇ ਚਿੱਤਰਾਂ ਨੂੰ ਸਪਰਾਲਡ ਗਲੈਕਸੀਆਂ ਹੋਣ ਦੀ ਸੰਭਾਵਨਾ ਸੀ. ਇਹਨਾਂ ਵਜ਼ਨਾਂ ਦੇ ਮੱਦੇਨਜ਼ਰ, ਉਹ ਅਨੁਮਾਨ ਲਗਾਉਣ ਦੇ ਯੋਗ ਸੀ ਕਿ ਗੈਲੀਕੌਨ ਦੇ ਮਨੁੱਖੀ ਵਰਗ ਨੂੰ ਵਾਜਬ ਸ਼ੁੱਧਤਾ ਨਾਲ.

ਬੈਨਰਜੀ ਅਤੇ ਸਹਿਕਰਮੀਆਂ ਦੇ ਕੰਮ ਨੇ ਗਲੈਕਸੀ ਚਿੜੀਆਘਰ ਨੂੰ ਇੱਕ ਕੰਪਿਊਟਰ ਦੀ ਸਹਾਇਤਾ ਨਾਲ ਮਨੁੱਖੀ ਗਣਨਾ ਪ੍ਰਣਾਲੀ ਨੂੰ ਬੁਲਾਉਂਦੇ ਹੋਏ ਕੀਤਾ. ਇਹਨਾਂ ਹਾਈਬ੍ਰਿਡ ਪ੍ਰਣਾਲੀਆਂ ਬਾਰੇ ਸੋਚਣ ਦਾ ਸਭ ਤੋਂ ਵਧੀਆ ਤਰੀਕਾ ਇਹ ਹੈ ਕਿ ਇਨਸਾਨਾਂ ਨੂੰ ਸਮੱਸਿਆ ਦਾ ਹੱਲ ਕਰਨ ਦੀ ਬਜਾਏ, ਉਨ੍ਹਾਂ ਕੋਲ ਇੱਕ ਡਾਟਾਸੈਟ ਤਿਆਰ ਕਰਨ ਵਾਲਾ ਇਨਸਾਨ ਹੈ ਜੋ ਕੰਪਿਊਟਰ ਨੂੰ ਇਸ ਸਮੱਸਿਆ ਦੇ ਹੱਲ ਲਈ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ. ਕਦੇ-ਕਦੇ, ਕੰਪਿਊਟਰ ਨੂੰ ਇਸ ਸਮੱਸਿਆ ਨੂੰ ਹੱਲ ਕਰਨ ਲਈ ਸਿਖਲਾਈ ਦੇ ਬਹੁਤ ਸਾਰੇ ਉਦਾਹਰਣਾਂ ਦੀ ਜ਼ਰੂਰਤ ਹੋ ਸਕਦੀ ਹੈ, ਅਤੇ ਕਾਫ਼ੀ ਗਿਣਤੀ ਦੇ ਉਤਪਾਦਾਂ ਨੂੰ ਪੈਦਾ ਕਰਨ ਦਾ ਇਕੋ ਇਕ ਤਰੀਕਾ ਜਨ ਸਹਿਯੋਗ ਹੈ. ਇਸ ਕੰਪਿਊਟਰ ਦੀ ਮਦਦ ਪ੍ਰਾਪਤ ਪਹੁੰਚ ਦਾ ਫਾਇਦਾ ਇਹ ਹੈ ਕਿ ਇਹ ਮਨੁੱਖੀ ਕੋਸ਼ਿਸ਼ਾਂ ਦੀ ਇੱਕ ਸੀਮਿਤ ਰਾਸ਼ੀ ਦਾ ਇਸਤੇਮਾਲ ਕਰਦੇ ਹੋਏ ਜ਼ਰੂਰੀ ਤੌਰ ਤੇ ਅਨੰਤ ਮਾਤਰਾ ਵਿੱਚ ਡੇਟਾ ਨੂੰ ਸੰਭਾਲਣ ਦੇ ਯੋਗ ਬਣਾਉਂਦਾ ਹੈ. ਮਿਸਾਲ ਦੇ ਤੌਰ ਤੇ, ਇਕ ਲੱਖ ਇਨਸਾਨਾਂ ਦੀਆਂ ਕਲਾਸੀਫਾਈਡ ਗਲੈਕਸੀਆਂ ਵਾਲਾ ਇਕ ਖੋਜਕਾਰ ਇਕ ਪ੍ਰਭਾਵੀ ਮਾਡਲ ਤਿਆਰ ਕਰ ਸਕਦਾ ਹੈ ਜੋ ਇਕ ਅਰਬ ਜਾਂ ਇਕ ਟ੍ਰੈਲਸਿਨ ਗਲੈਕਸੀਆਂ ਨੂੰ ਸ਼੍ਰੇਣੀਬੱਧ ਕਰਨ ਲਈ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ. ਜੇ ਬਹੁਤ ਸਾਰੀਆਂ ਗਲੈਕਸੀਆਂ ਹਨ, ਤਾਂ ਇਸ ਤਰ੍ਹਾਂ ਦੇ ਮਨੁੱਖੀ ਕੰਪਿਊਟਰ ਦੀ ਹਾਈਬ੍ਰਿਡ ਅਸਲ ਵਿਚ ਇਕੋ ਇਕ ਸੰਭਵ ਹੱਲ ਹੈ. ਇਹ ਅਨੰਤ ਸਕੇਲੇਬਿਲਟੀ ਮੁਫ਼ਤ ਨਹੀਂ ਹੈ, ਪਰ ਇੱਕ ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਮਾਡਲ ਬਣਾਉਣਾ ਜੋ ਮਨੁੱਖੀ ਸ਼੍ਰੇਣੀਆਂ ਨੂੰ ਸਹੀ ਢੰਗ ਨਾਲ ਪੇਸ਼ ਕਰ ਸਕਦਾ ਹੈ ਉਹ ਖੁਦ ਇੱਕ ਸਖ਼ਤ ਸਮੱਸਿਆ ਹੈ, ਪਰ ਕਿਸਮਤ ਵਾਲੀ ਗੱਲ ਹੈ ਕਿ ਇਸ ਵਿਸ਼ੇ ਲਈ ਸਮਰਪਿਤ ਕੀਤੀਆਂ ਗਈਆਂ ਸ਼ਾਨਦਾਰ ਪੁਸਤਕਾਂ (Hastie, Tibshirani, and Friedman 2009; Murphy 2012; James et al. 2013) .

ਗਲੈਕਸੀ ਚਿੜੀਆਘਰ ਕਿੰਨੀ ਮਨੁੱਖੀ ਗਣਨਾ ਪ੍ਰੋਜੈਕਟਾਂ ਦਾ ਵਿਸਤ੍ਰਿਤ ਹੈ ਸਭ ਤੋਂ ਪਹਿਲਾਂ, ਖੋਜਕਾਰ ਇਸ ਪ੍ਰੋਜੈਕਟ ਦੁਆਰਾ ਖੋਜ ਸਹਾਇਤਾ ਦੀ ਛੋਟੀ ਟੀਮ (ਉਦਾਹਰਨ ਲਈ, ਸ਼ੌਵਿਨਸਕੀ ਦਾ ਅਰੰਭਕ ਵਰਗ ਵਰਗੀ ਕੋਸ਼ਿਸ਼) ਦੁਆਰਾ ਖੁਦ ਨੂੰ ਕੋਸ਼ਿਸ਼ ਕਰਦਾ ਹੈ. ਜੇ ਇਹ ਤਰੀਕਾ ਚੰਗੀ ਤਰ੍ਹਾਂ ਸਕੇਲ ਨਹੀਂ ਕਰਦਾ, ਤਾਂ ਖੋਜਕਾਰ ਮਨੁੱਖੀ ਗਣਨਾ ਪ੍ਰੋਜੈਕਟ ਨੂੰ ਪ੍ਰੇਰਿਤ ਕਰ ਸਕਦਾ ਹੈ ਜਿਸ ਵਿਚ ਕਈ ਭਾਗੀਦਾਰ ਸ਼ਾਮਲ ਹੋਣਗੇ. ਪਰ, ਕੁਝ ਖਾਸ ਅੰਕੜਿਆਂ ਲਈ, ਸ਼ੁੱਧ ਮਨੁੱਖੀ ਕੋਸ਼ਿਸ਼ ਕਾਫ਼ੀ ਨਹੀਂ ਹੋਵੇਗੀ. ਉਸ ਸਮੇਂ, ਖੋਜਕਾਰਾਂ ਨੂੰ ਕੰਪਿਊਟਰ ਦੀ ਸਹਾਇਤਾ ਨਾਲ ਮਨੁੱਖੀ ਗਣਨਾ ਪ੍ਰਣਾਲੀ ਬਣਾਉਣ ਦੀ ਜ਼ਰੂਰਤ ਹੁੰਦੀ ਹੈ ਜਿਸ ਵਿਚ ਮਨੁੱਖੀ ਸ਼੍ਰੇਣੀਆਂ ਦਾ ਇਕ ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਮਾਡਲ ਨੂੰ ਸਿਖਲਾਈ ਲਈ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ ਜਿਸ ਨੂੰ ਬਾਅਦ ਵਿਚ ਅਸਲ ਵਿਚ ਬੇਅੰਤ ਮਾਤਰਾ ਵਿਚ ਲਾਗੂ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ.