5.2.1 ਗਲੈਕਸੀ ਚਿੜੀਆ

ਇਹ ਅਨੁਵਾਦ ਇੱਕ ਕੰਪਿਊਟਰ ਦੁਆਰਾ ਬਣਾਇਆ ਗਿਆ ਸੀ. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

5.2.1 ਗਲੈਕਸੀ ਚਿੜੀਆ

ਗਲੈਕਸੀ ਚਿੜੀਆ ਇੱਕ ਲੱਖ ਮੰਡਲ ਦਾ ਵਰਗੀਕਰਨ ਕਰਨ ਲਈ ਕਈ ਗੈਰ-ਮਾਹਰ ਵਲੰਟੀਅਰ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਦਾ ਹੈ.

ਗਲੈਕਸੀ ਚਿੜੀਆ 2007 ਕਾਫ਼ੀ ਇੱਕ ਬਿੱਟ ਆਸਾਨ, Schawinski ਮੰਡਲ ਵਿੱਚ ਦਿਲਚਸਪੀ ਸੀ ਕੇਵਿਨ Schawinski, ਆਕਸਫੋਰਡ ਯੂਨੀਵਰਸਿਟੀ ਦੇ ਖਗੋਲ ਵਿੱਚ ਇੱਕ ਗ੍ਰੈਜੂਏਟ ਵਿਦਿਆਰਥੀ ਨੂੰ ਦਰਪੇਸ਼ ਇੱਕ ਸਮੱਸਿਆ ਦੇ ਬਾਹਰ ਵੱਡਾ ਹੋਇਆ ਅਤੇ ਮੰਡਲ ਨੇ ਵੰਿਡਆ ਜਾ ਸਕਦਾ ਹੈ ਆਪਣੇ ਵਿਗਿਆਨ-ਅੰਡਾਕਾਰ ਜ ਚੂੜੀਦਾਰ-ਅਤੇ ਆਪਣੇ ਰੰਗ-ਨੀਲਾ ਜ ਲਾਲ ਨੇ. ਵਾਰ ਤੇ, ਖਗੋਲ ਆਪਸ ਵਿੱਚ ਰਵਾਇਤੀ ਸਿਆਣਪ ਹੈ, ਜੋ ਕਿ ਚੂੜੀਦਾਰ ਮੰਡਲ, ਸਾਡੀ ਆਕਾਸ਼ ਵਰਗਾ, ਰੰਗ (ਦਾ ਸੰਕੇਤ ਨੌਜਵਾਨ) ਵਿਚ ਨੀਲੇ ਸਨ ਅਤੇ ਇਹ ਹੈ ਜੋ ਅੰਡਾਕਾਰ ਮੰਡਲ ਰੰਗ ਵਿੱਚ ਲਾਲ ਸਨ (ਪੁਰਾਣੇ ਦੀ ਉਮਰ ਦਾ ਸੰਕੇਤ). Schawinski ਇਸ ਰਵਾਇਤੀ ਗਿਆਨ ਨੂੰ ਸ਼ੱਕ ਸੀ. ਉਸ ਨੇ ਸ਼ੱਕ ਹੈ ਕਿ ਇਸ ਪੈਟਰਨ ਆਮ ਵਿੱਚ ਇਹ ਸੱਚ ਹੈ, ਹੋ ਸਕਦਾ ਹੈ, ਸੰਭਵ ਤੌਰ ਅਪਵਾਦ ਦੇ ਇੱਕ ਵੱਡੀ ਗਿਣਤੀ ਨੂੰ ਸਨ, ਅਤੇ ਇਹ ਹੈ ਜੋ ਇਹ ਅਸਾਧਾਰਨ ਮੰਡਲ-ਲੋਕ, ਜੋ ਕਿ ਫਿੱਟ ਨਾ ਸੀ, ਦੀ ਲਾਟ ਦੀ ਸਟੱਡੀ ਕਰ ਕੇ ਉਮੀਦ ਹੈ ਪੈਟਰਨ ਉਹ ਦੀ ਪ੍ਰਕਿਰਿਆ ਬਾਰੇ ਕੁਝ ਸਿੱਖ ਸਕਦੇ, ਜਿਸ ਦੁਆਰਾ ਮੰਡਲ ਦਾ ਗਠਨ ਕੀਤਾ.

ਇਸ ਲਈ, ਕੀ ਹੈ Schawinski ਕ੍ਰਮ ਰਵਾਇਤੀ ਗਿਆਨ ਨੂੰ ਉਖੇੜ ਨੂੰ ਲੋੜ morphologically ਕਲਾਸੀਫਾਈਡ ਮੰਡਲ ਦੀ ਇੱਕ ਵੱਡੀ ਸੈੱਟ ਸੀ; ਹੈ, ਜੋ ਕਿ, ਮੰਡਲ ਹੈ, ਜੋ ਕਿ ਕਿਸੇ ਵੀ ਚੂੜੀਦਾਰ ਜ ਅੰਡਾਕਾਰ ਰੂਪ ਵਿੱਚ ਵਰਗੀਕ੍ਰਿਤ ਕੀਤਾ ਗਿਆ ਸੀ ਹੈ. ਸਮੱਸਿਆ ਦਾ, ਪਰ, ਸੀ, ਜੋ ਕਿ ਵਰਗੀਕਰਨ ਲਈ ਮੌਜੂਦਾ ਏਲਗੋਰਿਦਮਿਕ ਢੰਗ ਅਜੇ ਵੀ ਕਾਫ਼ੀ ਚੰਗਾ ਵਿਗਿਆਨਕ ਖੋਜ ਲਈ ਵਰਤਿਆ ਜਾ ਕਰਨ ਲਈ ਨਹੀ ਸਨ; ਹੋਰ ਸ਼ਬਦ ਵਿੱਚ, ਸ਼੍ਰੇਣੀ ਮੰਡਲ ਹੈ, ਜੋ ਕਿ ਵਾਰ 'ਤੇ ਸੀ,, ਇੱਕ ਸਮੱਸਿਆ ਹੈ, ਜੋ ਕਿ ਕੰਪਿਊਟਰ ਦੇ ਲਈ ਔਖਾ ਸੀ. ਇਸ ਲਈ, ਕੀ ਹੈ ਦੀ ਲੋੜ ਸੀ ਮਨੁੱਖੀ ਵਰਗੀਕ੍ਰਿਤ ਮੰਡਲ ਦੀ ਇੱਕ ਵੱਡੀ ਗਿਣਤੀ ਸੀ. Schawinski ਗ੍ਰੈਜੂਏਟ ਵਿਦਿਆਰਥੀ ਦੀ ਜੋਸ਼ ਨਾਲ ਇਸ ਵਰਗੀਕਰਨ ਸਮੱਸਿਆ ਨੂੰ ਕੀਤਾ. ਸੱਤ, 12-ਘੰਟੇ ਦਿਨ ਦੇ ਇੱਕ ਮੈਰਾਥਨ ਸ਼ੈਸ਼ਨ ਨੂੰ ਵਿੱਚ, ਉਸ ਨੇ 50,000 ਮੰਡਲ ਦਾ ਵਰਗੀਕਰਨ ਕਰਨ ਦੇ ਯੋਗ ਸੀ. 50,000 ਮੰਡਲ ਦਾ ਇੱਕ ਬਹੁਤ ਸਾਰਾ ਵਰਗਾ ਆਵਾਜ਼ ਹੋ ਸਕਦਾ ਹੈ, ਜਦਕਿ, ਇਸ ਨੂੰ ਅਸਲ ਵਿੱਚ ਲਗਭਗ ਇੱਕ ਲੱਖ ਮੰਡਲ ਹੈ, ਜੋ ਕਿ ਸਲੋਅਨ ਡਿਜੀਟਲ ਸਕਾਈ ਸਰਵੇ ਵਿਚ photographed ਕੀਤਾ ਗਿਆ ਸੀ, ਦੇ ਸਿਰਫ 5% ਹੈ. Schawinski ਨੂੰ ਅਹਿਸਾਸ ਹੋਇਆ ਕਿ ਉਸ ਨੇ ਇੱਕ ਹੋਰ ਮਾਪਯੋਗ ਪਹੁੰਚ ਦੀ ਲੋੜ ਸੀ.

ਖੁਸ਼ਕਿਸਮਤੀ ਨਾਲ, ਇਸ ਨੂੰ ਬਾਹਰ ਕਾਮੁਕ, ਜੋ ਕਿ ਸ਼੍ਰੇਣੀ ਮੰਡਲ ਦੇ ਕੰਮ ਖਗੋਲ ਵਿਚ ਤਕਨੀਕੀ ਸਿਖਲਾਈ ਦੀ ਲੋੜ ਨਹੀ ਹੈ; ਤੁਹਾਨੂੰ ਕਿਸੇ ਨੂੰ ਇਸ ਨੂੰ ਪਰੈਟੀ ਤੇਜ਼ੀ ਨਾਲ ਕੀ ਕਰਨ ਦਾ ਉਪਦੇਸ਼ ਕਰ ਸਕਦਾ ਹੈ. ਹੋਰ ਸ਼ਬਦ, ਪਰ ਫਿਰ ਵੀ ਮੰਡਲ ਸ਼੍ਰੇਣੀ ਦਾ ਇੱਕ ਕੰਮ ਹੈ, ਜੋ ਕਿ ਕੰਪਿਊਟਰ ਦੇ ਲਈ ਔਖਾ ਸੀ ਹੈ, ਇਸ ਨੂੰ ਇਨਸਾਨ ਲਈ ਪਰੈਟੀ ਆਸਾਨ ਸੀ. ਇਸ ਲਈ, ਜਦਕਿ, ਆਕਸਫੋਰਡ, Schawinski ਅਤੇ ਸਾਥੀ ਖਗੋਲ ਕ੍ਰਿਸ Lintott ਵਿੱਚ ਇੱਕ ਪੱਬ ਵਿਚ ਬੈਠੇ ਇੱਕ ਵੈਬਸਾਈਟ ਹੈ ਜਿੱਥੇ ਸਵੈ ਮੰਡਲ ਦੇ ਚਿੱਤਰ, ਵਰਗੀਕਰਨ ਜਾਵੇਗਾ ਸੁਫਨਾ. ਕੁਝ ਮਹੀਨੇ ਬਾਅਦ, ਗਲੈਕਸੀ ਚਿੜੀਆ ਦਾ ਜਨਮ ਹੋਇਆ ਸੀ.

ਗਲੈਕਸੀ ਚਿੜੀਆ ਦੀ ਵੈੱਬਸਾਈਟ 'ਤੇ, ਸਵੈ-ਸਿਖਲਾਈ ਦੇ ਕੁਝ ਮਿੰਟ ਹੋਵੇਗਾ; ਉਦਾਹਰਨ ਲਈ, ਇੱਕ ਚੂੜੀਦਾਰ ਅਤੇ ਅੰਡਾਕਾਰ ਗਲੈਕਸੀ (ਚਿੱਤਰ 5.2) ਦੇ ਵਿੱਚ ਅੰਤਰ ਸਿੱਖਣ. ਇਸ ਸਿਖਲਾਈ ਦੇ ਬਾਅਦ, ਵਾਲੰਟੀਅਰ ਜਾਣਿਆ ਨਾਲ ਇੱਕ ਮੁਕਾਬਲਤਨ ਆਸਾਨ ਕੁਇਜ਼-ਠੀਕ ਸ਼੍ਰੇਣੀ 15 ਦਾ 11 ਮੰਡਲ ਨੂੰ ਪਾਸ ਕਰਨ ਦੀ ਸੀ, ਵਰਗੀਕਰਣ-ਅਤੇ ਫਿਰ ਵਲੰਟੀਅਰ ਇੱਕ ਸਧਾਰਨ ਵੈੱਬ-ਅਧਾਰਿਤ ਇੰਟਰਫੇਸ (ਚਿੱਤਰ 5.3) ਦੁਆਰਾ ਅਣਜਾਣ ਹੈ ਮੰਡਲ ਦੇ ਅਸਲੀ ਵਰਗੀਕਰਣ ਸ਼ੁਰੂ ਹੋ ਜਾਵੇਗਾ. ਖਗੋਲ ਕਰਨ ਲਈ ਵਲੰਟੀਅਰ ਤੱਕ ਤਬਦੀਲੀ ਘੱਟ ਵੱਧ 10 ਮਿੰਟ ਵਿਚ ਜਗ੍ਹਾ ਲੈ ਜਾਵੇਗਾ ਅਤੇ ਸਿਰਫ ਅੜਿੱਕੇ, ਇੱਕ ਸਧਾਰਨ ਕਵਿਜ਼ ਦੇ ਸਭ ਪਾਸ ਦੀ ਲੋੜ ਹੈ.

ਚਿੱਤਰ 5.2: ਚੂੜੀਦਾਰ ਅਤੇ ਅੰਡਾਕਾਰ: ਦੇ ਮੰਡਲ ਦੇ ਦੋ ਮੁੱਖ ਕਿਸਮ ਦੀ ਉਦਾਹਰਨ. ਗਲੈਕਸੀ ਚਿੜੀਆ ਪ੍ਰਾਜੈਕਟ ਨੂੰ 900,000 ਚਿੱਤਰ ਵੱਧ ਹੋਰ ਵਰਗ ਨੂੰ ਵੱਧ 100,000 ਵਲੰਟੀਅਰ ਵਰਤਿਆ. ਸਰੋਤ: www.galaxyzoo.org .

ਚਿੱਤਰ 5.3: ਇੰਪੁੱਟ ਸਕਰੀਨ, ਜਿੱਥੇ ਵੋਟਰ ਨੂੰ ਇੱਕ ਸਿੰਗਲ ਈਮੇਜ਼ ਨੂੰ ਵਰਗੀਕਰਨ ਕਰਨ ਲਈ ਕਿਹਾ ਗਿਆ ਸੀ. ਸਰੋਤ: www.galaxyzoo.org .

ਗਲੈਕਸੀ ਚਿੜੀਆ ਇਸ ਦੇ ਸ਼ੁਰੂਆਤੀ ਵਾਲੰਟੀਅਰ ਖਿੱਚੇ ਬਾਅਦ ਪ੍ਰਾਜੈਕਟ ਨੂੰ ਇੱਕ ਨਿਊਜ਼ ਲੇਖ ਵਿਚ ਗੁਣ ਗਿਆ ਸੀ, ਅਤੇ ਇਸ ਬਾਰੇ ਛੇ ਮਹੀਨੇ ਵਿੱਚ ਇਸ ਪ੍ਰਾਜੈਕਟ ਨੂੰ ਹੋਰ ਵੱਧ 100,000 ਨਾਗਰਿਕ ਵਿਗਿਆਨੀ, ਜੋ ਲੋਕ ਹਿੱਸਾ ਹੈ, ਕਿਉਕਿ ਉਹ ਕੰਮ ਦਾ ਆਨੰਦ ਮਾਣਿਆ ਹੈ ਅਤੇ ਉਹ ਪੇਸ਼ਗੀ ਖਗੋਲ ਦੀ ਮਦਦ ਕਰਨੀ ਚਾਹੁੰਦਾ ਸ਼ਾਮਲ ਕਰਨ ਲਈ ਗਈ. ਮਿਲ ਕੇ, ਇਹ 100,000 ਸਵੈ ਵਰਗੀਕਰਣ ਇੱਕ ਮੁਕਾਬਲਤਨ ਛੋਟੇ, ਹਿੱਸਾ ਲੈਣ ਦੇ ਕੋਰ ਗਰੁੱਪ ਤੱਕ ਆਉਣ ਦੀ ਬਹੁਗਿਣਤੀ ਦੇ ਨਾਲ, ਵੱਧ 40 ਲੱਖ ਵਰਗੀਕਰਣ ਦੇ ਕੁੱਲ ਯੋਗਦਾਨ ਪਾਇਆ (Lintott et al. 2008) .

ਖੋਜਕਾਰ ਜੋ ਅਨੁਭਵ ਨੂੰ ਭਰਤੀ ਅੰਡਰ ਖੋਜ ਸਹਾਇਕ ਹੈ ਨੂੰ ਤੁਰੰਤ ਡਾਟਾ ਦੀ ਗੁਣਵੱਤਾ ਬਾਰੇ ਸ਼ੱਕੀ ਹੋ ਸਕਦਾ ਹੈ. ਜਦਕਿ ਇਸ ਸੰਦੇਹ ਜਾਇਜ਼ ਹੈ, ਗਲੈਕਸੀ ਚਿੜੀਆ ਪਤਾ ਲੱਗਦਾ ਹੈ ਕਿ ਜਦ ਵਲੰਟੀਅਰ ਦੇ ਯੋਗਦਾਨ ਠੀਕ, ਸਾਫ਼ ਕਰ ਰਹੇ ਹਨ debiased, ਅਤੇ ਏਕੀਕ੍ਰਿਤ, ਉਹ ਉੱਚ-ਗੁਣਵੱਤਾ ਦੇ ਨਤੀਜੇ ਪੈਦਾ ਕਰ ਸਕਦਾ ਹੈ (Lintott et al. 2008) . ਪੇਸ਼ਾਵਰ ਗੁਣਵੱਤਾ ਡਾਟਾ ਬਣਾਉਣ ਲਈ ਭੀੜ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਹੈਟ੍ਰਿਕ ਸਮਰੂਪ ਹੈ; ਜੋ ਕਿ ਹੈ, ਉਸੇ ਹੀ ਕੰਮ ਬਹੁਤ ਸਾਰੇ ਵੱਖ-ਵੱਖ ਲੋਕ ਕੇ ਕੀਤੀ ਸੀ. ਗਲੈਕਸੀ ਚਿੜੀਆ ਵਿੱਚ, ਗਲੈਕਸੀ ਪ੍ਰਤੀ ਬਾਰੇ 40 ਵਰਗੀਕਰਣ ਸਨ; ਅੰਡਰ ਖੋਜ ਸਹਾਇਕ ਵਰਤ ਸਮਰੂਪ ਦੇ ਇਸ ਪੱਧਰ ਨੂੰ ਬਰਦਾਸ਼ਤ ਕਦੇ ਵੀ ਕਰ ਸਕਦਾ ਹੈ ਅਤੇ ਇਸ ਲਈ ਖੋਜਕਾਰ ਹਰ ਵਿਅਕਤੀ ਵਰਗੀਕਰਣ ਦੀ ਗੁਣਵੱਤਾ ਦੇ ਨਾਲ ਬਹੁਤ ਕੁਝ ਹੋਰ ਸਬੰਧਤ ਹੋਣ ਦੀ ਲੋੜ ਹੈ. ਕੀ ਵਾਲੰਟੀਅਰ ਸਿਖਲਾਈ ਵਿੱਚ ਕਮੀ, ਉਹ ਸਮਰੂਪ ਨਾਲ ਲਈ ਬਣਾਇਆ.

ਵੀ ਗਲੈਕਸੀ ਪ੍ਰਤੀ ਕਈ ਕਈ ਵਰਗੀਕਰਣ ਦੇ ਨਾਲ ਹੈ, ਪਰ, ਪੈਦਾ ਕਰਨ ਲਈ ਵਲੰਟੀਅਰ ਵਰਗੀਕਰਣ ਦੇ ਸਮੂਹ ਦਾ ਸੰਯੋਗ ਹੈ, ਇੱਕ ਸਹਿਮਤੀ ਵਰਗੀਕਰਨ ਛਲ ਹੈ. ਇਸ ਕਰਕੇ ਬਹੁਤ ਹੀ ਸਮਾਨ ਚੁਣੌਤੀ ਸਭ ਮਨੁੱਖੀ ਗਿਣਤੀ ਪ੍ਰਾਜੈਕਟ ਵਿੱਚ ਪੈਦਾ ਹੈ, ਇਸ ਨੂੰ ਸੰਖੇਪ ਤਿੰਨ ਕਦਮ ਹੈ, ਜੋ ਕਿ ਗਲੈਕਸੀ ਚਿੜੀਆ ਖੋਜਕਾਰ ਆਪਣੇ ਸਹਿਮਤੀ ਵਰਗੀਕਰਣ ਪੈਦਾ ਕਰਨ ਲਈ ਵਰਤਿਆ ਦੀ ਸਮੀਖਿਆ ਕਰਨ ਲਈ ਮਦਦਗਾਰ ਹੈ. ਪਹਿਲੀ, ਖੋਜਕਾਰ ਜਾਅਲੀ ਵਰਗੀਕਰਣ ਨੂੰ ਹਟਾ ਕੇ "ਸਾਫ਼" ਡਾਟਾ. ਮਿਸਾਲ ਲਈ, ਜੋ ਲੋਕ ਵਾਰ-ਵਾਰ ਇੱਕੋ ਹੀ ਗਲੈਕਸੀ-ਕੁਝ ਅਜਿਹਾ ਹੈ, ਜੋ ਕਿ ਕੀ ਹੋਵੇਗਾ ਜੇ ਉਹ ਸੋਧਣ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਰਹੇ ਸਨ ਵਰਗੀਕ੍ਰਿਤ ਆਪਣੇ ਸਾਰੇ ਵਰਗੀਕਰਣ ਨੂੰ ਰੱਦ ਨਤੀਜੇ-ਸੀ. ਇਹ ਅਤੇ ਹੋਰ ਸਮਾਨ ਸਫਾਈ ਸਾਰੇ ਵਰਗੀਕਰਣ ਦੇ ਬਾਰੇ 4% ਨੂੰ ਹਟਾ ਦਿੱਤਾ.

ਦੂਜਾ, ਸਫਾਈ ਦੇ ਬਾਅਦ, ਖੋਜਕਾਰ ਵਰਗੀਕਰਣ ਵਿਚ ਯੋਜਨਾਬੱਧ ੳੱੁਪਰ ਨੂੰ ਹਟਾਉਣ ਲਈ ਦੀ ਲੋੜ ਸੀ. ਅਸਲੀ ਪ੍ਰੋਜੈਕਟ ਨੂੰ-ਕਰਨ ਲਈ, ਉਦਾਹਰਨ ਦੇ ਅੰਦਰ ਸ਼ਾਮਿਲ ਪੱਖਪਾਤ ਖੋਜ ਅਧਿਐਨ, ਕੁਝ ਸਵੈ ਦਿਖਾ ਦੀ ਬਜਾਏ ਵਾਈਟ ਵਿੱਚ ਗਲੈਕਸੀ ਦੀ ਇੱਕ ਲੜੀ ਦੇ ਜ਼ਰੀਏ ਦਾ ਰੰਗ-ਖੋਜਕਾਰ ਅਜਿਹੇ ਅੰਡਾਕਾਰ ਮੰਡਲ ਦੇ ਤੌਰ ਤੇ ਦੂਰ ਦੂਰ ਚੂੜੀਦਾਰ ਮੰਡਲ ਦਾ ਵਰਗੀਕਰਨ ਕਰਨ ਲਈ ਇੱਕ ਯੋਜਨਾਬੱਧ ਪੱਖਪਾਤ ਦੇ ਤੌਰ ਤੇ ਕਈ ਯੋਜਨਾਬੱਧ ੳੱੁਪਰ, ਲੱਭੇ (Bamford et al. 2009) . ਇਹ ਤਰਤੀਬਵਾਰ ੳੱੁਪਰ ਲਈ ਠੀਕ ਵੀ ਬਹੁਤ ਜ਼ਰੂਰੀ ਹੈ, ਕਿਉਕਿ ਬਹੁਤ ਸਾਰੇ ਯੋਗਦਾਨ ਔਸਤ ਯੋਜਨਾਬੱਧ ਪੱਖਪਾਤ ਨੂੰ ਹਟਾ ਨਹੀ ਕਰਦਾ ਹੈ; ਇਸ ਨੂੰ ਸਿਰਫ ਲਗਾਤਾਰ ਗਲਤੀ ਨੂੰ ਹਟਾ.

ਅੰਤ ਵਿੱਚ, debiasing ਬਾਅਦ, ਖੋਜਕਾਰ ਵਿਅਕਤੀ ਨੂੰ ਵਰਗੀਕਰਣ ਜੋੜ ਕਰਨ ਲਈ ਇੱਕ ਸਹਿਮਤੀ ਵਰਗੀਕਰਨ ਪੈਦਾ ਕਰਨ ਲਈ ਇੱਕ ਢੰਗ ਦੀ ਲੋੜ ਸੀ. ਹਰ ਇੱਕ ਗਲੈਕਸੀ ਲਈ ਵਰਗੀਕਰਣ ਜੋੜ ਕਰਨ ਦਾ ਢੰਗ ਹੈ, ਸਭ ਆਮ ਵਰਗੀਕਰਣ ਦੀ ਚੋਣ ਕਰਨ ਲਈ ਹੋਵੇਗਾ. ਪਰ, ਇਸ ਪਹੁੰਚ ਨੂੰ ਹਰ ਵਲੰਟੀਅਰ ਦੇ ਬਰਾਬਰ ਭਾਰ ਦੇਣ ਸੀ, ਅਤੇ ਖੋਜਕਾਰ ਸ਼ੱਕੀ ਹੈ, ਜੋ ਕਿ ਕੁਝ ਵਲੰਟੀਅਰ ਹੋਰ ਵੱਧ ਵਰਗੀਕਰਨ 'ਤੇ ਬਿਹਤਰ ਸਨ. ਇਸ ਲਈ, ਖੋਜਕਾਰ ਨੂੰ ਇੱਕ ਹੋਰ ਗੁੰਝਲਦਾਰ ਦੁਹਰਾਈ ਮੱਧਮਾਨ ਵਿਧੀ ਹੈ, ਜੋ ਕਿ ਆਪਣੇ ਆਪ ਹੀ ਵਧੀਆ ਕ੍ਰਮਬੱਧ ਲਗਾਉਣ ਅਤੇ ਹੋਰ ਭਾਰ ਦੇਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਦਾ ਹੈ ਵਿਕਸਤ.

ਇਸ ਲਈ, ਇੱਕ ਤਿੰਨ ਕਦਮ ਹੈ ਕਾਰਵਾਈ ਨੂੰ-ਸਫਾਈ, debiasing, ਅਤੇ ਮੱਧਮਾਨ-ਗਲੈਕਸੀ ਚਿੜੀਆ ਖੋਜ ਟੀਮ ਦੇ ਬਾਅਦ ਸਹਿਮਤੀ ਰੂਪ ਵਿਗਿਆਨਿਕ ਵਰਗੀਕਰਣ ਦਾ ਇੱਕ ਸੈੱਟ ਵਿੱਚ 40 ਲੱਖ ਵਲੰਟੀਅਰ ਵਰਗੀਕਰਣ ਤਬਦੀਲ ਕੀਤਾ ਸੀ. ਇਹ ਗਲੈਕਸੀ ਚਿੜੀਆ ਵਰਗੀਕਰਣ ਪੇਸ਼ੇਵਰ ਖਗੋਲ ਕੇ ਤਿੰਨ ਪਿਛਲੇ ਛੋਟੇ ਪੈਮਾਨੇ ਦੀ ਕੋਸ਼ਿਸ਼, Schawinski ਕੇ ਵਰਗੀਕਰਨ ਹੈ ਕਿ ਗਲੈਕਸੀ ਚਿੜੀਆ ਪ੍ਰੇਰਨਾ ਕਰਨ ਵਿਚ ਮਦਦ ਕੀਤੀ ਵੀ ਸ਼ਾਮਲ ਹਨ ਦੇ ਮੁਕਾਬਲੇ ਗਏ ਸਨ, ਜਦ, ਉਥੇ ਮਜ਼ਬੂਤ ਸਮਝੌਤੇ 'ਸੀ. ਇਸ ਲਈ, ਵਾਲੰਟੀਅਰ, ਕੁੱਲ ਵਿੱਚ, ਉੱਚ ਗੁਣਵੱਤਾ ਵਰਗੀਕਰਣ ਮੁਹੱਈਆ ਕਰਨ ਦੇ ਯੋਗ ਹੈ ਅਤੇ ਸਨ ਪੈਮਾਨੇ ਹੈ, ਜੋ ਕਿ ਖੋਜਕਾਰ ਨਾਲ ਮੇਲ ਨਾ ਹੋ ਸਕਿਆ ਤੇ (Lintott et al. 2008) . ਅਸਲ ਵਿਚ, ਮੰਡਲ ਦੇ ਅਜਿਹੇ ਵੱਡੀ ਗਿਣਤੀ ਲਈ ਮਨੁੱਖੀ ਵਰਗੀਕਰਣ ਹੋਣ ਕਰ ਕੇ, Schawinski, Lintott, ਅਤੇ ਹੋਰ ਦਿਖਾਉਣ ਲਈ ਹੈ, ਜੋ ਕਿ ਮੰਡਲ ਦੇ ਸਿਰਫ 80% ਦੀ ਉਮੀਦ ਪੈਟਰਨ-ਨੀਲੇ ਚੱਕਰਦਾਰ ਅਤੇ ਲਾਲ ellipticals-ਅਤੇ ਕਈ ਕਾਗਜ਼ ਦੀ ਪਾਲਣਾ ਦੇ ਬਾਰੇ ਲਿਖਿਆ ਗਿਆ ਹੈ ਯੋਗ ਸਨ ਇਸ ਖੋਜ (Fortson et al. 2011) .

ਇਸ ਦੀ ਪਿੱਠਭੂਮੀ ਦੇ ਮੱਦੇਨਜ਼ਰ, ਸਾਨੂੰ ਹੁਣ ਵੇਖ ਸਕਦਾ ਹੈ ਨੂੰ ਗਲੈਕਸੀ ਚਿੜੀਆ ਹੇਠ ਵੰਡ-ਲਾਗੂ ਕਰ-ਜੋੜ ਸਕਦੀ ਹੈ, ਉਸੇ ਹੀ ਹੋ ਸਕਦੀ ਹੈ, ਜੋ ਕਿ ਸਭ ਮਨੁੱਖੀ ਗਣਨਾ ਪ੍ਰਾਜੈਕਟ ਲਈ ਵਰਤਿਆ ਗਿਆ ਹੈ. ਪਹਿਲੀ, ਇੱਕ ਵੱਡੀ ਸਮੱਸਿਆ ਹੋਣ ਵਿੱਚ ਵੰਡਿਆ ਗਿਆ ਹੈ. ਇਸ ਮਾਮਲੇ ਵਿੱਚ, ਇੱਕ ਲੱਖ ਮੰਡਲ ਸ਼੍ਰੇਣੀ ਦੀ ਸਮੱਸਿਆ ਦਾ ਇੱਕ ਗਲੈਕਸੀ ਸ਼੍ਰੇਣੀ ਦੇ ਇੱਕ ਲੱਖ ਸਮੱਸਿਆ ਵਿੱਚ ਵੰਡਿਆ ਗਿਆ ਹੈ. ਅੱਗੇ, ਇੱਕ ਕਾਰਵਾਈ ਸੁਤੰਤਰ ਹਰੇਕ ਚੱਕ ਨੂੰ ਲਾਗੂ ਕੀਤਾ ਗਿਆ ਹੈ. ਇਸ ਮਾਮਲੇ ਵਿੱਚ, ਇੱਕ ਵਲੰਟੀਅਰ ਕੋਈ ਚੂੜੀਦਾਰ ਜ ਅੰਡਾਕਾਰ ਰੂਪ ਵਿੱਚ ਹਰ ਇੱਕ ਗਲੈਕਸੀ ਵਰਗੀਕਰਨ ਜਾਵੇਗਾ. ਅੰਤ ਵਿੱਚ, ਨਤੀਜੇ ਇੱਕ ਸਹਿਮਤੀ ਦੇ ਨਤੀਜੇ ਪੈਦਾ ਕਰਨ ਲਈ ਮਿਲਾ ਰਹੇ ਹਨ. ਇਸ ਮਾਮਲੇ ਵਿੱਚ, ਜੋੜ ਕਦਮ ਹੈ ਸਫਾਈ, debiasing, ਅਤੇ ਮੱਧਮਾਨ ਹਰ ਇੱਕ ਗਲੈਕਸੀ ਲਈ ਇੱਕ ਸਹਿਮਤੀ ਵਰਗੀਕਰਣ ਪੈਦਾ ਕਰਨ ਲਈ ਸ਼ਾਮਿਲ ਕੀਤਾ. ਪਰ ਫਿਰ ਵੀ ਸਭ ਪ੍ਰਾਜੈਕਟ ਨੂੰ ਇਸ ਨੂੰ ਆਮ ਪਕਵਾਨ ਵਰਤ, ਕਦਮ ਦੇ ਹਰ ਖਾਸ ਸਮੱਸਿਆ ਨੂੰ ਹੱਲ ਕੀਤਾ ਜਾ ਰਿਹਾ ਹੈ ਨੂੰ ਪਸੰਦੀ ਦੀ ਲੋੜ ਹੈ. ਉਦਾਹਰਨ ਲਈ, ਹੇਠ ਦਿੱਤੇ ਮਨੁੱਖੀ ਗਣਨਾ ਇਸ ਪ੍ਰਾਜੈਕਟ ਵਿਚ, ਉਸੇ ਹੀ ਹੋ ਸਕਦੀ ਹੈ, ਬਾਅਦ ਵਿੱਚ ਕੀਤਾ ਜਾਵੇਗਾ, ਪਰ ਲਾਗੂ ਕਰਨ ਅਤੇ ਜੋੜ ਕਦਮ ਕਾਫ਼ੀ ਵੱਖ-ਵੱਖ ਹੋ ਜਾਵੇਗਾ.

ਗਲੈਕਸੀ ਚਿੜੀਆ ਦੀ ਟੀਮ ਦੇ ਲਈ, ਇਸ ਨੂੰ ਪਹਿਲੇ ਪ੍ਰਾਜੈਕਟ ਨੂੰ ਸਿਰਫ਼ ਸ਼ੁਰੂਆਤ ਸੀ. ਬਹੁਤ ਤੇਜ਼ੀ ਨਾਲ ਉਹ ਨੂੰ ਅਹਿਸਾਸ ਹੋਇਆ ਕਿ, ਪਰ ਫਿਰ ਵੀ ਉਹ ਇੱਕ ਲੱਖ ਮੰਡਲ ਦੇ ਨੇੜੇ ਵਰਗੀਕਰਨ ਕਰਨ ਦੇ ਯੋਗ ਸਨ, ਇਸ ਪੈਮਾਨੇ ਨਵ ਡਿਜ਼ੀਟਲ ਅਸਮਾਨ ਸਰਵੇਖਣ ਹੈ, ਜੋ ਕਿ ਇਸ ਬਾਰੇ 10 ਅਰਬ ਮੰਡਲ ਦੇ ਚਿੱਤਰ ਪੈਦਾ ਕਰ ਸਕਦਾ ਹੈ ਦੇ ਨਾਲ ਕੰਮ ਕਰਨ ਲਈ ਕਾਫ਼ੀ ਨਹੀ ਹੈ (Kuminski et al. 2014) . 1 ਲੱਖ 10 ਤੱਕ ਵਾਧਾ ਸੰਭਾਲਣ ਕਰਨ ਲਈ ਅਰਬ-ਇੱਕ 10,000-ਗਲੈਕਸੀ ਚਿੜੀਆ ਦੇ ਫੈਕਟਰ ਆਮ 10,000 ਗੁਣਾ ਵਧੇਰੇ ਹਿੱਸਾ ਲੈਣ ਦੀ ਭਰਤੀ ਕਰਨ ਦੀ ਲੋੜ ਸੀ. ਪਰ ਇੰਟਰਨੈੱਟ 'ਤੇ ਵਾਲੰਟੀਅਰ ਦੀ ਗਿਣਤੀ ਵੱਡਾ ਹੈ, ਇਸ ਨੂੰ ਅਨੰਤ ਹੈ. ਇਸ ਲਈ, ਖੋਜਕਾਰ ਨੂੰ ਅਹਿਸਾਸ ਹੋਇਆ ਕਿ ਉਹ ਡਾਟਾ ਹੈ, ਇੱਕ ਨਵ, ਹੋਰ ਵੀ ਮਾਪਯੋਗ, ਪਹੁੰਚ ਦੀ ਲੋੜ ਸੀ ਦੀ ਮਾਤਰਾ ਕਦੇ ਵਧ ਰਹੀ ਸੰਭਾਲਣ ਲਈ ਜਾ ਰਹੇ ਹਨ, ਜੇ.

ਇਸ ਲਈ, Manda Banerji-ਕੰਮ ਕਰ ਕੇਵਿਨ Schawinski, ਕ੍ਰਿਸ Lintott, ਅਤੇ ਗਲੈਕਸੀ ਚਿੜੀਆ ਟੀਮ ਨੂੰ-ਸ਼ੁਰੂ ਕਰਨ ਦੀ ਸਿੱਖਿਆ ਨੂੰ ਕੰਪਿਊਟਰ ਦੇ ਹੋਰ ਅੰਗ ਦੇ ਨਾਲ ਮੰਡਲ ਦਾ ਵਰਗੀਕਰਨ ਕਰਨ ਲਈ. ਖਾਸ ਤੌਰ ਤੇ, ਮਨੁੱਖੀ ਗਲੈਕਸੀ ਚਿੜੀਆ, ਦੁਆਰਾ ਬਣਾਇਆ ਵਰਗੀਕਰਣ ਵਰਤ Banerji et al. (2010) , ਇੱਕ ਮਸ਼ੀਨ ਸਿੱਖਣ ਮਾਡਲ ਹੈ, ਜੋ ਕਿ ਚਿੱਤਰ ਦੇ ਗੁਣ 'ਤੇ ਅਧਾਰਿਤ ਇੱਕ ਗਲੈਕਸੀ ਦੇ ਮਨੁੱਖੀ ਵਰਗੀਕਰਨ ਅੰਦਾਜ਼ਾ ਹੋ ਸਕਦਾ ਹੈ ਬਣਾਇਆ. ਇਸ ਮਸ਼ੀਨ ਸਿੱਖਣ ਮਾਡਲ ਹਾਈ ਸ਼ੁੱਧਤਾ ਦੇ ਨਾਲ ਮਨੁੱਖੀ ਵਰਗੀਕਰਣ ਪੈਦਾ ਕਰ ਸਕਦਾ ਹੈ, ਜੇ, ਫਿਰ ਇਸ ਨੂੰ ਮੰਡਲ ਦਾ ਇੱਕ ਜਰੂਰੀ ਅਨੰਤ ਗਿਣਤੀ ਨੂੰ ਵਰਗੀਕਰਨ ਕਰਨ ਗਲੈਕਸੀ ਚਿੜੀਆ ਖੋਜਕਾਰ ਦੁਆਰਾ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ.

Banerji ਅਤੇ ਸਾਥੀ 'ਪਹੁੰਚ ਦੀ ਕੋਰ ਅਸਲ ਵਿੱਚ ਪਰੈਟੀ ਤਕਨੀਕ ਆਮ ਸਮਾਜਿਕ ਖੋਜ ਵਿੱਚ ਵਰਤਿਆ ਕਰਨ ਦੇ ਸਮਾਨ ਹੈ, ਪਰ ਹੈ, ਜੋ ਕਿ ਸਮਾਨਤਾ ਪਹਿਲੀ ਨਜ਼ਰ' ਤੇ ਸਾਫ ਹੈ, ਨਾ ਹੋ ਸਕਦਾ ਹੈ. ਪਹਿਲੀ, Banerji ਅਤੇ ਸਾਥੀ ਅੰਕ, ਜੋ ਕਿ ਫੀਚਰ ਸਾਰ ਇਸ ਨੂੰ ਦਾ ਦਰਜਾ ਦੇ ਇੱਕ ਸੈੱਟ ਵਿੱਚ ਹਰ ਇੱਕ ਚਿੱਤਰ ਨੂੰ ਤਬਦੀਲ. ਚਿੱਤਰ ਵਿੱਚ ਨੀਲੇ ਦੀ ਮਾਤਰਾ, ਪਿਕਸਲ ਦੀ ਚਮਕ ਵਿੱਚ ਤਬਦੀਲੀ ਹੈ, ਅਤੇ ਗੈਰ-ਚਿੱਟੇ ਪਿਕਸਲ ਦਾ ਅਨੁਪਾਤ: ਮਿਸਾਲ ਲਈ, ਮੰਡਲ ਦੇ ਚਿੱਤਰ, ਲਈ ਤਿੰਨ ਫੀਚਰ ਹੋ ਸਕਦਾ ਹੈ. ਸਹੀ ਫੀਚਰ ਦੀ ਚੋਣ ਦੀ ਸਮੱਸਿਆ ਦਾ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਹਿੱਸਾ ਹੈ, ਅਤੇ ਇਸ ਨੂੰ ਆਮ ਤੌਰ 'ਤੇ ਇਸ ਵਿਸ਼ੇ-ਖੇਤਰ ਦੇ ਮਹਾਰਤ ਦੀ ਲੋੜ ਹੈ. ਇਹ ਪਹਿਲਾ ਕਦਮ ਹੈ, ਆਮ ਤੌਰ ਤੇ ਫੀਚਰ ਨੂੰ ਇੰਜੀਨੀਅਰਿੰਗ ਕਹਿੰਦੇ ਹਨ, ਚਿੱਤਰ ਨੂੰ ਪ੍ਰਤੀ ਇੱਕ ਕਤਾਰ ਹੈ ਅਤੇ ਫਿਰ ਤਿੰਨ, ਜੋ ਕਿ ਚਿੱਤਰ ਨੂੰ ਦਾ ਵਰਣਨ ਕਾਲਮ ਦੇ ਨਾਲ ਇੱਕ ਡਾਟਾ ਮੈਟਰਿਕਸ ਵਿੱਚ ਨਤੀਜੇ. ਡਾਟਾ ਮੈਟਰਿਕਸ ਅਤੇ ਲੋੜੀਦੇ ਆਉਟਪੁੱਟ (ਉਦਾਹਰਨ ਲਈ, ਕੀ ਚਿੱਤਰ ਨੂੰ ਇੱਕ ਅੰਡਾਕਾਰ ਗਲੈਕਸੀ ਦੇ ਰੂਪ ਵਿੱਚ ਇੱਕ ਮਨੁੱਖੀ ਨੇ ਵਰਗੀਕ੍ਰਿਤ ਕੀਤਾ ਗਿਆ ਸੀ), ਖੋਜਕਾਰ ਨੇ ਇਕ ਅੰਕੜਾ ਮਾਡਲ ਲਈ ਉਦਾਹਰਨ ਦੇ ਪੈਰਾਮੀਟਰ ਦਾ ਅਨੁਮਾਨ ਹੈ, ਇੱਕ ਸਾਮਾਨ ਰਿਗਰੈਸ਼ਨ-ਹੈ, ਜੋ ਕਿ ਮਨੁੱਖੀ ਆਧਾਰਿਤ ਵਰਗੀਕਰਨ ਭਵਿੱਖਬਾਣੀ ਵਰਗੇ ਕੁਝ ਦਿੱਤਾ ਚਿੱਤਰ ਨੂੰ ਦੇ ਫੀਚਰ 'ਤੇ. ਅੰਤ ਵਿੱਚ, ਖੋਜਕਾਰ ਇਸ ਅੰਕੜਾ ਮਾਡਲ ਵਿੱਚ ਪੈਰਾਮੀਟਰ ਵਰਤਦਾ ਹੈ (ਚਿੱਤਰ 5.4) ਨਵ ਮੰਡਲ ਦੀ ਅੰਦਾਜ਼ਨ ਵਰਗੀਕਰਣ ਨੂੰ ਪੈਦਾ ਕਰਨ ਲਈ. ਇੱਕ ਸਮਾਜਿਕ ਐਨਾਲਾਗ ਦੀ ਸੋਚਦੇ ਕਰਨ ਲਈ, ਕਲਪਨਾ ਕਰੋ ਕਿ ਤੁਹਾਡੇ ਕੋਲ ਇੱਕ ਲੱਖ ਵਿਦਿਆਰਥੀ ਬਾਰੇ ਜਨ ਜਾਣਕਾਰੀ ਸੀ, ਹੈ ਅਤੇ ਤੁਹਾਨੂੰ ਪਤਾ ਹੈ ਕਿ ਕੀ ਉਹ ਕਾਲਜ ਤੱਕ ਜ ਨਾ ਕੀਤੀ. ਤੁਹਾਨੂੰ ਇਸ ਡਾਟਾ ਨੂੰ ਕਰਨ ਲਈ ਇੱਕ ਸਾਮਾਨ ਰੈਗਰੈਸ਼ਨ ਫਿੱਟ ਕਰ ਸਕਦਾ ਹੈ, ਅਤੇ ਫਿਰ ਤੁਹਾਨੂੰ ਨਤੀਜੇ ਮਾਡਲ ਪੈਰਾਮੀਟਰ ਵਰਤ ਸਕਦਾ ਹੈ ਅੰਦਾਜ਼ਾ ਲਗਾਉਣਾ ਕਿ ਕੀ ਨਵ ਵਿਦਿਆਰਥੀ ਨੂੰ ਕਾਲਜ ਤੱਕ ਗ੍ਰੈਜੂਏਟ ਕਰਨ ਜਾ ਰਹੇ ਹਨ. ਮਸ਼ੀਨ ਨੂੰ ਸਿੱਖਣ ਵਿੱਚ, ਇਹ ਪਹੁੰਚ-ਵਰਤ ਦਾ ਲੇਬਲ ਮਿਸਾਲ ਲਈ ਇੱਕ ਅੰਕੜਾ ਮਾਡਲ ਹੈ, ਜੋ ਕਿ ਫਿਰ ਨਵ ਲੇਬਲ ਕਰ ਸਕਦਾ ਹੈ ਬਣਾਉਣ ਲਈ ਡਾਟਾ-ਤੇ ਹੈ ਸਿੱਖਣ ਦੀ ਨਿਗਰਾਨੀ (Hastie, Tibshirani, and Friedman 2009) .

ਚਿੱਤਰ 5.4: ਨੂੰ Banerji et al ਦੇ ਸਧਾਰਨ ਵੇਰਵਾ ਹੈ. (2010) ਗਲੈਕਸੀ ਚਿੜੀਆ ਵਰਗੀਕਰਣ ਵਰਤਿਆ ਇੱਕ ਮਸ਼ੀਨ ਸਿੱਖਣ ਮਾਡਲ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਗਲੈਕਸੀ ਵਰਗੀਕਰਣ ਨੂੰ ਕੀ ਕਰਨ ਦੀ. ਮੰਡਲ ਦੇ ਚਿੱਤਰ ਫੀਚਰ ਦੀ ਇੱਕ ਮੈਟਰਿਕਸ ਵਿੱਚ ਤਬਦੀਲ ਕੀਤਾ ਗਿਆ ਸੀ. ਇਸ ਸਰਲ ਉਦਾਹਰਨ ਵਿੱਚ ਤਿੰਨ ਫੀਚਰ (ਚਿੱਤਰ ਵਿੱਚ ਨੀਲੇ ਦੀ ਮਾਤਰਾ, ਪਿਕਸਲ ਦੀ ਚਮਕ ਵਿੱਚ ਤਬਦੀਲੀ ਹੈ, ਅਤੇ ਗੈਰ-ਚਿੱਟੇ ਪਿਕਸਲ ਦਾ ਅਨੁਪਾਤ) ਹਨ. ਤਦ, ਚਿੱਤਰ ਦੇ ਇੱਕ ਸਮੂਹ ਦੇ ਲਈ, ਗਲੈਕਸੀ ਚਿੜੀਆ ਲੇਬਲ ਇੱਕ ਮਸ਼ੀਨ ਸਿੱਖਣ ਮਾਡਲ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਵਰਤਿਆ ਜਾਦਾ ਹੈ. ਅੰਤ ਵਿੱਚ, ਮਸ਼ੀਨ ਨੂੰ ਸਿੱਖਣ ਬਾਕੀ ਮੰਡਲ ਲਈ ਵਰਗੀਕਰਣ ਦਾ ਅੰਦਾਜ਼ਾ ਕਰਨ ਲਈ ਵਰਤਿਆ ਗਿਆ ਹੈ. ਮੈਨੂੰ ਇਸ ਪ੍ਰਾਜੈਕਟ ਦੇ ਇਸ ਕਿਸਮ ਦੀ 'ਤੇ ਕਾਲ ਕਰੋ ਇੱਕ ਦੂਜੀ-ਪੀੜ੍ਹੀ ਮਨੁੱਖੀ ਕੰਪਿਊਟੇਸ਼ਨਲ ਪ੍ਰਾਜੈਕਟ ਨੂੰ ਹੈ, ਕਿਉਕਿ, ਨਾ ਕਿ ਹੋਣ ਇਨਸਾਨ ਇੱਕ ਸਮੱਸਿਆ ਨੂੰ ਹੱਲ ਹੈ, ਉਹ ਇਨਸਾਨ ਨੂੰ ਇੱਕ dataset ਹੈ, ਜੋ ਕਿ ਸਮੱਸਿਆ ਦਾ ਹੱਲ ਕਰਨ ਲਈ ਇੱਕ ਕੰਪਿਊਟਰ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ ਨੂੰ ਬਣਾਉਣ ਦੀ ਹੈ. ਇਸ ਕੰਪਿਊਟਰ ਸਹਾਇਤਾ ਪਹੁੰਚ ਦਾ ਫਾਇਦਾ ਹੈ ਕਿ ਇਹ ਤੁਹਾਨੂੰ ਸਿਰਫ ਮਨੁੱਖੀ ਜਤਨ ਦੀ ਇੱਕ ਸੀਮਿਤ ਮਾਤਰਾ ਨੂੰ ਵਰਤ ਡਾਟਾ ਦੀ ਅਵੱਸ਼ਕ ਅਨੰਤ ਮਾਤਰਾ ਨੂੰ ਕੰਟਰੋਲ ਕਰਨ ਲਈ ਯੋਗ ਕਰਦਾ ਹੈ.

ਚਿੱਤਰ 5.4: ਨੂੰ ਦੇ ਸਧਾਰਨ ਵੇਰਵਾ Banerji et al. (2010) ਗਲੈਕਸੀ ਚਿੜੀਆ ਵਰਗੀਕਰਣ ਵਰਤਿਆ ਇੱਕ ਮਸ਼ੀਨ ਸਿੱਖਣ ਮਾਡਲ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਗਲੈਕਸੀ ਵਰਗੀਕਰਣ ਨੂੰ ਕੀ ਕਰਨ ਦੀ. ਮੰਡਲ ਦੇ ਚਿੱਤਰ ਫੀਚਰ ਦੀ ਇੱਕ ਮੈਟਰਿਕਸ ਵਿੱਚ ਤਬਦੀਲ ਕੀਤਾ ਗਿਆ ਸੀ. ਇਸ ਸਰਲ ਉਦਾਹਰਨ ਵਿੱਚ ਤਿੰਨ ਫੀਚਰ (ਚਿੱਤਰ ਵਿੱਚ ਨੀਲੇ ਦੀ ਮਾਤਰਾ, ਪਿਕਸਲ ਦੀ ਚਮਕ ਵਿੱਚ ਤਬਦੀਲੀ ਹੈ, ਅਤੇ ਗੈਰ-ਚਿੱਟੇ ਪਿਕਸਲ ਦਾ ਅਨੁਪਾਤ) ਹਨ. ਤਦ, ਚਿੱਤਰ ਦੇ ਇੱਕ ਸਮੂਹ ਦੇ ਲਈ, ਗਲੈਕਸੀ ਚਿੜੀਆ ਲੇਬਲ ਇੱਕ ਮਸ਼ੀਨ ਸਿੱਖਣ ਮਾਡਲ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਵਰਤਿਆ ਜਾਦਾ ਹੈ. ਅੰਤ ਵਿੱਚ, ਮਸ਼ੀਨ ਨੂੰ ਸਿੱਖਣ ਬਾਕੀ ਮੰਡਲ ਲਈ ਵਰਗੀਕਰਣ ਦਾ ਅੰਦਾਜ਼ਾ ਕਰਨ ਲਈ ਵਰਤਿਆ ਗਿਆ ਹੈ. ਮੈਨੂੰ ਇਸ ਪ੍ਰਾਜੈਕਟ ਦੇ ਇਸ ਕਿਸਮ ਦੀ 'ਤੇ ਕਾਲ ਕਰੋ ਇੱਕ ਦੂਜੀ-ਪੀੜ੍ਹੀ ਮਨੁੱਖੀ ਕੰਪਿਊਟੇਸ਼ਨਲ ਪ੍ਰਾਜੈਕਟ ਨੂੰ ਹੈ, ਕਿਉਕਿ, ਨਾ ਕਿ ਹੋਣ ਇਨਸਾਨ ਇੱਕ ਸਮੱਸਿਆ ਨੂੰ ਹੱਲ ਹੈ, ਉਹ ਇਨਸਾਨ ਨੂੰ ਇੱਕ dataset ਹੈ, ਜੋ ਕਿ ਸਮੱਸਿਆ ਦਾ ਹੱਲ ਕਰਨ ਲਈ ਇੱਕ ਕੰਪਿਊਟਰ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ ਨੂੰ ਬਣਾਉਣ ਦੀ ਹੈ. ਇਸ ਕੰਪਿਊਟਰ ਸਹਾਇਤਾ ਪਹੁੰਚ ਦਾ ਫਾਇਦਾ ਹੈ ਕਿ ਇਹ ਤੁਹਾਨੂੰ ਸਿਰਫ ਮਨੁੱਖੀ ਜਤਨ ਦੀ ਇੱਕ ਸੀਮਿਤ ਮਾਤਰਾ ਨੂੰ ਵਰਤ ਡਾਟਾ ਦੀ ਅਵੱਸ਼ਕ ਅਨੰਤ ਮਾਤਰਾ ਨੂੰ ਕੰਟਰੋਲ ਕਰਨ ਲਈ ਯੋਗ ਕਰਦਾ ਹੈ.

ਵਿਚ ਫੀਚਰ Banerji et al. (2010) ਮਸ਼ੀਨ ਸਿੱਖਣ ਮਾਡਲ ਮੇਰੇ ਖਿਡੌਣਾ ਵਿਚ ਜਿਹੜੇ ਉਦਾਹਰਨ ਲਈ, ਉਦਾਹਰਨ ਹੈ, ਉਹ ਵੀ ਫੀਚਰ ਵਰਗੇ ਵਰਤਿਆ ਵੱਧ ਹੋਰ ਗੁੰਝਲਦਾਰ ਸਨ "ਦੇ Vaucouleurs ਧੁਰੇ ਦੇ ਅਨੁਪਾਤ ਫਿੱਟ" ਕਿਹਾ ਉਸ ਦੇ ਮਾਡਲ ਲਾਜੀਸਟਿਕ ਰੈਗਰੈਸ਼ਨ ਨਾ ਸੀ, ਇਸ ਨੂੰ ਇੱਕ ਨਕਲੀ ਨਿਊਰਲ ਨੈੱਟਵਰਕ ਸੀ. ਉਸ ਦੇ ਫੀਚਰ, ਉਸ ਮਾਡਲ, ਅਤੇ ਸਹਿਮਤੀ ਗਲੈਕਸੀ ਚਿੜੀਆ ਵਰਗੀਕਰਣ ਦਾ ਇਸਤੇਮਾਲ ਕਰਕੇ, ਉਸ ਨੇ ਹਰ ਇੱਕ ਫੀਚਰ ਨੂੰ ਤੇ ਵਜ਼ਨ ਬਣਾਉਣ, ਅਤੇ ਫਿਰ ਮੰਡਲ ਦੇ ਵਰਗੀਕਰਨ ਦੇ ਬਾਰੇ ਸ਼ਬਦ ਨੂੰ ਬਣਾਉਣ ਲਈ ਇਹ ਵਜ਼ਨ ਨੂੰ ਵਰਤਣ ਦੇ ਯੋਗ ਸੀ. ਮਿਸਾਲ ਲਈ, ਉਸ ਦੇ ਵਿਸ਼ਲੇਸ਼ਣ ਪਤਾ ਲੱਗਿਆ ਹੈ ਕਿ ਘੱਟ ਨਾਲ "de Vaucouleurs ਧੁਰੇ ਦੇ ਅਨੁਪਾਤ ਫਿੱਟ" ਚਿੱਤਰ ਨੂੰ ਹੋਰ ਚੂੜੀਦਾਰ ਮੰਡਲ ਹੋਣ ਦੀ ਸੰਭਾਵਨਾ ਸੀ. ਇਹ ਵਜ਼ਨ ਦਿੱਤਾ ਹੈ, ਉਹ ਜਾਇਜ਼ ਸ਼ੁੱਧਤਾ ਦੇ ਨਾਲ ਇੱਕ ਗਲੈਕਸੀ ਦੇ ਮਨੁੱਖੀ ਵਰਗੀਕਰਣ ਦਾ ਅਨੁਮਾਨ ਕਰਨ ਦੇ ਯੋਗ ਸੀ.

ਦੇ ਕੰਮ Banerji et al. (2010) ਮੈਨੂੰ ਕੀ ਇੱਕ ਦੂਜੀ-ਪੀੜ੍ਹੀ ਮਨੁੱਖੀ ਗਣਨਾ ਸਿਸਟਮ ਕਾਲ ਕਰਨਗੇ ਵਿੱਚ ਗਲੈਕਸੀ ਚਿੜੀਆ ਬਦਲ ਦਿੱਤਾ. ਵਧੀਆ ਤਰੀਕਾ ਇਹ ਦੂਜੀ ਪੀੜ੍ਹੀ ਸਿਸਟਮ ਬਾਰੇ ਸੋਚਣ ਲਈ ਹੈ, ਜੋ ਕਿ ਨਾ ਕਿ ਹੋਣ ਇਨਸਾਨ ਇੱਕ ਸਮੱਸਿਆ ਨੂੰ ਹੱਲ ਹੈ, ਉਹ ਇਨਸਾਨ ਨੂੰ ਇੱਕ dataset ਹੈ, ਜੋ ਕਿ ਸਮੱਸਿਆ ਦਾ ਹੱਲ ਕਰਨ ਲਈ ਇੱਕ ਕੰਪਿਊਟਰ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ ਨੂੰ ਬਣਾਉਣ ਦੀ ਹੈ ਹੈ. ਕੰਪਿਊਟਰ ਸਿਖਲਾਈ ਦੀ ਲੋੜ ਹੈ ਦਾ ਡਾਟਾ ਦੀ ਮਾਤਰਾ ਨੂੰ, ਇਸ ਲਈ ਵੱਡਾ ਹੈ ਕਿ ਇਸ ਨੂੰ ਬਣਾਉਣ ਲਈ ਇੱਕ ਮਨੁੱਖੀ ਪੁੰਜ ਦੇ ਸਹਿਯੋਗ ਦੀ ਲੋੜ ਹੈ ਹੋ ਸਕਦਾ ਹੈ. ਗਲੈਕਸੀ ਚਿੜੀਆ, ਦੁਆਰਾ ਵਰਤੀ ਨਿਊਰਲ ਨੈੱਟਵਰਕ ਦੇ ਮਾਮਲੇ ਵਿਚ Banerji et al. (2010) ਇੱਕ ਮਾਡਲ ਹੈ, ਜੋ ਕਿ ਭਰੋਸੇਯੋਗ ਮਨੁੱਖੀ ਵਰਗੀਕਰਣ ਪੈਦਾ ਕਰਨ ਦੇ ਯੋਗ ਸੀ ਨੂੰ ਬਣਾਉਣ ਲਈ ਵਿੱਚ ਮਨੁੱਖੀ-ਲੇਬਲ ਮਿਸਾਲ ਦੇ ਇੱਕ ਬਹੁਤ ਹੀ ਵੱਡੀ ਗਿਣਤੀ ਦੀ ਲੋੜ ਹੈ.

ਇਸ ਕੰਪਿਊਟਰ ਸਹਾਇਤਾ ਪਹੁੰਚ ਦਾ ਫਾਇਦਾ ਹੈ ਕਿ ਇਹ ਤੁਹਾਨੂੰ ਸਿਰਫ ਮਨੁੱਖੀ ਜਤਨ ਦੀ ਇੱਕ ਸੀਮਿਤ ਮਾਤਰਾ ਨੂੰ ਵਰਤ ਡਾਟਾ ਦੀ ਅਵੱਸ਼ਕ ਅਨੰਤ ਮਾਤਰਾ ਨੂੰ ਕੰਟਰੋਲ ਕਰਨ ਲਈ ਯੋਗ ਕਰਦਾ ਹੈ. ਉਦਾਹਰਨ ਲਈ, ਇੱਕ ਲੱਖ ਮਨੁੱਖੀ ਵੰਿਡਆ ਮੰਡਲ ਦੇ ਨਾਲ ਇੱਕ ਖੋਜਕਾਰ ਇੱਕ ਅਨੁਮਾਨਯੋਗ ਮਾਡਲ ਹੈ, ਜੋ ਕਿ ਫਿਰ ਇੱਕ ਅਰਬ ਜ ਵੀ ਇੱਕ ਖਰਬ ਮੰਡਲ ਦਾ ਵਰਗੀਕਰਨ ਕਰਨ ਲਈ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ, ਨੂੰ ਬਣਾਉਣ ਸਕਦਾ ਹੈ. ਮੰਡਲ ਦੇ ਭਾਰੀ ਗਿਣਤੀ 'ਹਨ, ਜੇ, ਫਿਰ ਮਨੁੱਖੀ ਕੰਪਿਊਟਰ ਹਾਈਬ੍ਰਿਡ ਦੇ ਇਸ ਕਿਸਮ ਦੀ ਅਸਲ ਹੀ ਸੰਭਵ ਹੱਲ ਹੈ. ਇਹ ਅਨੰਤ ਮਾਪਯੋਗਤਾ ਪਰ ਮੁਫ਼ਤ ਨਹੀ ਹੈ,. ਮਸ਼ੀਨ ਸਿੱਖਣ ਮਾਡਲ ਹੈ, ਜੋ ਕਿ ਠੀਕ ਮਨੁੱਖੀ ਵਰਗੀਕਰਣ ਪੈਦਾ ਕਰ ਸਕਦਾ ਹੈ ਆਪਣੇ ਆਪ ਨੂੰ ਇੱਕ ਹਾਰਡ ਸਮੱਸਿਆ ਹੈ ਨੂੰ ਬਣਾਉਣ, ਪਰ ਖੁਸ਼ਕਿਸਮਤੀ ਨਾਲ ਉਥੇ ਹੀ ਸ਼ਾਨਦਾਰ ਇਸ ਵਿਸ਼ੇ ਨੂੰ ਸਮਰਪਿਤ ਿਕਤਾਬ ਹਨ (Hastie, Tibshirani, and Friedman 2009; Murphy 2012; James et al. 2013) .

ਗਲੈਕਸੀ ਚਿੜੀਆ ਬਹੁਤ ਸਾਰੇ ਮਨੁੱਖੀ ਗਿਣਤੀ ਪ੍ਰਾਜੈਕਟ ਦੇ ਵਿਕਾਸ ਵੇਖਾਉਦਾ ਹੈ. ਪਹਿਲੀ, ਇੱਕ ਖੋਜਕਾਰ ਆਪਣੇ ਆਪ ਨੂੰ ਦੇ ਕੇ ਜ ਖੋਜ ਸਹਾਇਕ ਦੇ ਇੱਕ ਛੋਟੇ ਟੀਮ (ਉਦਾਹਰਨ ਲਈ, Schawinski ਦੇ ਸ਼ੁਰੂਆਤੀ ਵਰਗੀਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼) ਦੇ ਨਾਲ ਇਸ ਪ੍ਰਾਜੈਕਟ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਦਾ ਹੈ. ਇਸ ਪਹੁੰਚ ਨਾਲ ਨਾਲ ਸਕੇਲ ਨਾ ਕਰਦਾ, ਜੇ, ਖੋਜਕਾਰ ਇਕ ਇਨਸਾਨ ਗਿਣਤੀ ਪ੍ਰਾਜੈਕਟ ਨੂੰ, ਜਿੱਥੇ ਬਹੁਤ ਸਾਰੇ ਲੋਕ ਵਰਗੀਕਰਣ ਵਿੱਚ ਯੋਗਦਾਨ ਪਾਉਣ ਲਈ ਪ੍ਰੇਰਿਤ ਕਰ ਸਕਦਾ ਹੈ. ਪਰ, ਡਾਟਾ ਦੀ ਇੱਕ ਨੂੰ ਕੁਝ ਵਾਲੀਅਮ ਲਈ, ਸ਼ੁੱਧ ਮਨੁੱਖੀ ਜਤਨ ਕਾਫ਼ੀ ਹੋ ਨਾ ਹੋਵੇਗਾ. ਹੈ, ਜੋ ਕਿ ਮੌਕੇ 'ਤੇ, ਖੋਜਕਾਰ ਦੂਜੀ ਪੀੜ੍ਹੀ ਸਿਸਟਮ, ਜਿੱਥੇ ਮਨੁੱਖੀ ਵਰਗੀਕਰਣ ਇੱਕ ਮਸ਼ੀਨ ਸਿੱਖਣ ਮਾਡਲ ਹੈ, ਜੋ ਕਿ ਫਿਰ ਡਾਟਾ ਦੀ ਲੱਗਭਗ ਬੇਅੰਤ ਮਾਤਰਾ ਨੂੰ ਲਾਗੂ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਵਰਤਿਆ ਜਾਦਾ ਹੈ ਬਣਾਉਣ ਦੀ ਲੋੜ ਹੈ.