प्रस्तावना

हे पुस्तक कोलंबिया विद्यापीठात तळघर मध्ये 2005 मध्ये सुरू झाले. त्या वेळी, मी पदवीधर विद्यार्थी होतो, आणि मी एक ऑनलाइन प्रयोग चालवत होतो जो अखेरीस माझा निबंध असेल. अध्यायात 4 मध्ये मी त्या प्रयोगाच्या वैज्ञानिक भागांबद्दल तुम्हाला सर्व काही सांगू शकेन, पण आता मी तुम्हाला माझ्या निबंधाने किंवा माझ्या कोणत्याही कागदात नसलेल्या एखाद्या गोष्टीबद्दल सांगणार आहे. आणि असे काहीतरी आहे जे संशोधनाबद्दल माझे विचार कसे बदलते. एक सकाळी मी जेव्हा माझ्या तळमजल्याच्या कार्यालयात गेलो तेव्हा मला कळले की ब्राझिलमधील सुमारे 100 लोक माझ्या प्रयोगात सहभागी झाले होते. या सोप्या अनुभवाचा माझ्यावर मोठा प्रभाव पडला. त्या वेळी, मला मित्र होते जे प्रयोगशील प्रयोग प्रयोग करत होते आणि मला हे माहीत होते की या प्रयोगांमध्ये सहभागी होण्यासाठी लोकांची नेमणूक, पर्यवेक्षण आणि वेतन देण्यासाठी त्यांना किती कठीण काम करावे लागले; जर एकाच दिवसात ते 10 जण धावू शकतील, तर ही चांगली प्रगती होती. तथापि, माझ्या ऑनलाइन प्रयोगाने मी झोपी गेलो असताना 100 लोकांनी सहभाग घेतला. आपण झोपत असताना आपल्या संशोधन करण्यामुळे सत्य असल्याचे खूप चांगले वाटू शकते, परंतु तसे नाही. तंत्रज्ञानातील बदल - एनालॉग एजपासून ते डिजिटल युगेपर्यंतचे संक्रमण - याचा अर्थ आम्ही आता नवीन प्रकारे सामाजिक डेटा एकत्र आणि विश्लेषण करू शकतो. हे पुस्तक या नवीन मार्गांनी सामाजिक संशोधन करण्याबद्दल आहे.

हे पुस्तक सामाजिक शास्त्रज्ञांसाठी आहे जे अधिक माहिती विज्ञान, माहिती शास्त्रज्ञ जे अधिक सामाजिक विज्ञान करू इच्छितात आणि या दोन क्षेत्रांच्या संक्रामक रूपात इच्छुक आहेत. हे पुस्तक कोणासाठी आहे, ते केवळ विद्यार्थ्यांना आणि प्राध्यापकांसाठी नाही असे म्हणत न जाता. जरी मी सध्या एक विद्यापीठ (प्रिन्स्टन) येथे काम करतो, तरीही मी (अमेरिकन जनगणना ब्युरोमध्ये) आणि टेक उद्योगात (मायक्रोसॉफ्ट रिसर्चमध्ये) काम केले आहे म्हणून मला माहित आहे की बाहेर खूप रोमांचक संशोधन होत आहे. विद्यापीठे आपण सामाजिक संशोधन म्हणून काय करत आहात याचा विचार करता, तर हे पुस्तक आपल्यासाठी आहे, आपण कोठे काम करता ते महत्त्वाचे असो किंवा सध्या कोणत्या प्रकारचे तंत्र आपण वापरत आहात

आपण कदाचित आधीपासून लक्षात घेतले असेल, की या पुस्तकाचे टोन इतर अनेक शैक्षणिक पुस्तकेंपेक्षा थोडा वेगळे आहे. हे हेतुपुरस्सर आहे हे पुस्तक 2007 पासून समाजशास्त्र विभागाच्या प्रिन्सटन येथे मी संगणनविषयक सामाजिक विज्ञानावर पदवीधर सेमिनारमधून उदयास आले आहे आणि मला ते त्या सेमिनारमधून काही ऊर्जा आणि उत्साह मिळवणे आवडेल. विशेषतः, मी या पुस्तकात तीन गुणधर्म असण्याची इच्छा आहे: मला हे उपयुक्त, भविष्यातील-देणारं आणि आशावादी असावे अशी माझी इच्छा आहे.

उपयुक्त : माझे उद्दिष्ट आपल्यासाठी उपयोगी असलेले पुस्तक लिहायचे आहे. म्हणून, मी एक खुले, अनौपचारिक आणि उदाहरण-चालित शैलीमध्ये लिहिणार आहे. मी सांगू इच्छित असलेल्या सर्वात महत्त्वाच्या गोष्टी म्हणजे सामाजिक संशोधनाबद्दल विचार करण्याचा एक विशिष्ट मार्ग आहे. आणि माझा अनुभव सुचवितो की या पद्धतीचे विचार व्यक्त करण्याचा सर्वोत्तम मार्ग म्हणजे अनौपचारिक आणि बर्याच उदाहरणे. तसेच, प्रत्येक अध्यायाच्या शेवटी माझ्याकडे "काय पुढे वाचायचे" असे एक विभाग आहे जे मला परिचयित करणाऱ्या अनेक विषयांवर अधिक तपशीलवार आणि तांत्रिक वाचन करण्यास मदत करेल. अखेरीस, मला आशा आहे की या पुस्तकामुळे आपल्याला संशोधन आणि इतरांचे संशोधन मूल्यांकन दोन्ही करू शकतील.

भविष्यातील-देणारं : हा ग्रंथ आज अस्तित्वात असलेल्या डिजिटल सिस्टम्स वापरून आणि भविष्यात तयार करण्यात येणार्या कंपन्यांचा वापर करून सामाजिक संशोधन करण्यास आपल्याला मदत करेल. मी 2004 मध्ये अशा प्रकारचे संशोधन करण्यास सुरुवात केली, आणि तेव्हापासून मी बरेच बदल पाहिले आहेत, आणि मला खात्री आहे की तुमच्या कारकिर्दीत तुम्हाला अनेक बदल दिसेल. बदलण्याच्या चेहर्याशी संबंधित राहण्याच्या युक्तीचा अट्टहास आहे . उदाहरणार्थ, हे एक पुस्तक असणार नाही जे आज आपल्याला अस्तित्वात आहे हे ट्विटर एपीआय कसे वापरावे याबद्दल शिकवते; त्याऐवजी, हे आपल्याला शिकवणार आहे मोठ्या डेटा स्त्रोतांपासून कसे शिकावे (अध्याय 2). हे अमेझॅन यांत्रिकी तुर्कवर प्रयोग चालू ठेवण्यासाठी आपल्याला चरण-दर-चरण सूचना देणारी एक पुस्तक असणार नाही; त्याऐवजी, डिजिटल युज इन्फ्रास्ट्रक्चर (अध्याय 4) वर अवलंबून असलेल्या प्रयोगांची रचना कशी व कशी करता येईल हे तुम्हाला शिकवणार आहे. अॅब्स्ट्रॅक्शनचा उपयोग करून, मला आशा आहे की हा एक समयोचित विषय असेल.

आशावादी : हे पुस्तक जे सामाजिक-वैज्ञानिक आणि डेटा शास्त्रज्ञांकडे गुंतलेले आहेत अशा दोन समुदायांमध्ये भिन्न भिन्न पार्श्वभूमी आणि स्वारस्ये आहेत. या विज्ञान-संबंधित मतभेदांव्यतिरिक्त, ज्या पुस्तकात मी याबद्दल बोलतो, मी हे देखील लक्षात घेतले आहे की या दोन समुदायांमध्ये भिन्न शैली आहेत. डेटा शास्त्रज्ञ सामान्यतः उत्साहित असतात; ते अर्धे भरलेले म्हणून काच पाहतात दुसरीकडे, सामाजिक शास्त्रज्ञ सामान्यतः अधिक गंभीर असतात; ते काच अर्धे रिकामे दिसत आहेत. या पुस्तकात, मी डेटा वैज्ञानिकच्या आशावादी टोन अवलंब करणार आहे. तर जेव्हा मी उदाहरण देतो, तेव्हा मी तुम्हाला हे उदाहरण सांगू इच्छितो. आणि, जेव्हा मी उदाहरणांसह समस्यांकडे लक्ष देतो- आणि मी हे करेन कारण कोणतेही संशोधन परिपूर्ण नाही- मी या समस्येस सकारात्मक आणि आशावादी अशा प्रकारे दर्शविण्याचा प्रयत्न करणार आहे. मी गंभीरतेच्या फायद्यासाठी गंभीर होणार नाही- मी गंभीररीत्या असणार आहे जेणेकरून मी तुम्हाला चांगले संशोधन करण्यास मदत करू शकेल.

आम्ही अजूनही डिजिटल युगात सामाजिक संशोधनाच्या सुरुवातीच्या दिवसांमध्ये आहोत, परंतु मी काही गैरसमजांमुळे पाहिली आहेत जेणेकरून मी त्यांना येथे निवेदनास बोलू शकते. डेटा शास्त्रज्ञांकडून, मी दोन सामान्य गैरसमजांना पाहिले आहेत प्रथम विचार करीत आहे की अधिक डेटा स्वयंचलितपणे समस्यांचे निराकरण करेल. तथापि, सामाजिक संशोधनासाठी, हा माझा अनुभव नाही. खरं तर, सामाजिक संशोधनासाठी, अधिक डेटाच्या विपरीत-अधिक चांगले डेटा-अधिक उपयुक्त वाटतात. मी डेटा विज्ञापकांकडून पाहिलेले दुसरे गैरसमज हेच विचार करते की सामाजिक विज्ञान हे सर्वसामान्य ज्ञानाभोवती गुंडाळलेल्या फॅन्सी टॉकचे एक गुच्छा आहे. अर्थात, एक सामाजिक शास्त्रज्ञ म्हणून-विशेषत: समाजशास्त्रज्ञ म्हणून-मी सहमत नाही. स्मार्ट लोक बर्याच काळापासून मानवी वागणुकीचे समजून घेण्यासाठी कठोर परिश्रम घेत आहेत आणि या प्रयत्नांमधून जमा झालेल्या ज्ञानाकडे दुर्लक्ष करणे मूर्खपणा वाटत नाही. माझी अशी आशा आहे की ही पुस्तके आपल्याला त्यातील काही शहाणपण देईल जे समजून घेणे सोपे आहे

सामाजिक शास्त्रज्ञांकडून, मी दोन सामान्य गैरसमजही पाहिले आहेत. प्रथम, मी पाहिले आहे की काही लोक काही वाईट पेपरमुळे डिजिटल युजरच्या साधनांचा वापर करून सामाजिक संशोधन संपूर्ण कल्पना लिहून काढतात. जर आपण हे पुस्तक वाचत असाल, तर कदाचित आपण आधीपासून काही कागदपत्रे वाचली असतील जे सोशल मिडिया डेटा वापरता येतील जे साधारण किंवा चुकीचे आहेत (किंवा दोन्ही) मी सुद्धा आहे तथापि, या उदाहरणांमधून निष्कर्ष काढणे ही एक गंभीर चूक असेल जी सर्व डिजिटल-वय सामाजिक संशोधन वाईट आहे. खरं तर, आपण कदाचित काही कागदपत्रे वाचली असतील ज्यात असे सर्वेक्षण डेटाचा वापर साधारणपणे किंवा चुकीच्या पद्धतीने केला जातो, परंतु सर्वेक्षणाचा वापर करून आपण सर्व संशोधन बंद करू नये. कारण आपल्याला माहिती आहे की सर्वेक्षण डेटासह उत्कृष्ट संशोधन केले आहे आणि या पुस्तकात मी आपल्याला दर्शविणार आहे की डिजिटल युगातील साधनेसह उत्कृष्ट संशोधन केले आहे.

मी सामाजिक शास्त्रज्ञांद्वारे पाहिलेले दुसरे सामान्य गैरसमज हे भविष्यासह सध्याला भ्रमित करायचे आहे. जेव्हा आम्ही डिजिटल युग मध्ये सामाजिक संशोधनाचे मूल्यांकन करतो- ज्याचे मी वर्णन करणार आहे- हे महत्वाचे आहे की आम्ही दोन वेगळे प्रश्न विचारू: "संशोधन कसे करता यावे?" आणि "ही शैली किती चांगले असेल भविष्यात संशोधन कार्य? "संशोधकांना पहिल्या प्रश्नाचे उत्तर देण्यासाठी प्रशिक्षण देण्यात आले आहे, परंतु या पुस्तकासाठी मला वाटते दुसरा प्रश्न अधिक महत्त्वाचा आहे. डिजिटल युग मध्ये सामाजिक संशोधन अद्याप भव्य, नमुना बदलणार्या बौद्धिक योगदान निर्माण झाले नाही तरी, डिजिटल वय संशोधन सुधारणा दर अविश्वसनीयपणे जलद आहे सध्याची पातळीपेक्षा हा बदलचा दर अधिक आहे-ज्यामुळे डिजिटल-वय शोध मला इतका रोमांचक बनतो

जरी शेवटचे परिच्छेद आपल्याला भविष्यात काही निर्दिष्ट न केलेल्या वेळेत आपल्याला संभाव्य संपत्ती देण्यास कदाचित दिसत असले तरीही माझा विशिष्ट उद्देश कोणत्याही विशिष्ट प्रकारचा संशोधन आपल्याला विकणे नाही. मी ट्विटर, फेसबुक, गुगल, मायक्रोसॉफ्ट, ऍपल, किंवा इतर कोणत्याही तांत्रिक कंपनीमध्ये व्यक्तिगतपणे स्वत: च्या शेअर्सना नाही (जरी, संपूर्ण उघड करण्याच्या हेतूसाठी, मी माझा मायक्रोसॉफ्ट, Google, आणि Facebook). म्हणूनच संपूर्ण पुस्तक माझ्या विश्वासार्ह कथा सांगणाराच राहणे हेच माझे उद्दिष्ट आहे, ज्यामुळे तुम्हाला शक्य असलेल्या सर्व रोमांचक नवीन गोष्टींबद्दल सांगता येईल. मी ज्या काही सापळे पाहिल्या त्या इतरांपासून दूर राहताना (आणि काहीवेळा मी स्वत: .

सामाजिक विज्ञान आणि माहिती विज्ञानाचा छेदन करताना कधी कधी कम्प्यूटेशनल सोशल सायन्स म्हटले जाते. काहींना हे तांत्रिक क्षेत्र असल्याचे वाटते, परंतु हे पारंपरिक पुस्तकात एक तांत्रिक पुस्तक असणार नाही. उदाहरणार्थ, मुख्य टेक्स्टमध्ये कोणतेही समीकरण नाहीत. मी हे पुस्तक लिहिण्याचा निर्णय घेतला कारण मी डिजिटल युगात सामाजिक संशोधनाचे एक सर्वसमावेशक दृष्टिकोन पुरविले होते, ज्यात मोठे डेटा स्रोत, सर्वेक्षण, प्रयोग, जन सहयोग आणि नैतिकता यांचा समावेश आहे. हे सर्व विषय कव्हर करणे अशक्य आहे आणि प्रत्येक व्यक्तीबद्दल तांत्रिक तपशील प्रदान करणे शक्य झाले आहे. त्याऐवजी, प्रत्येक अध्यायाच्या शेवटी "काय पुढे वाचायचे" विभागात अधिक तांत्रिक सामग्रीचे पॉइंटर दिले जातात. दुसऱ्या शब्दात सांगायचे तर, हे पुस्तक आपल्याला विशिष्ट गणना कसे करावे हे शिकवण्यासाठी डिझाइन केलेले नाही; त्याऐवजी, हे आपल्याला सामाजिक संशोधनाबद्दल विचार करण्याच्या पद्धतीत बदल करण्यासाठी डिझाइन केले आहे.

हे पुस्तक एका कोर्समध्ये कसे वापरावे

मी आधी म्हटल्याप्रमाणे, हे ग्रंथ संगणनविषयक सामाजिक विज्ञानावर पदवीधारक सेमिनारमधून आले ज्याचे मी 2007 पासून प्रिन्स्टन येथे शिकवत आहे. आपण या पुस्तिकेचा अभ्यास करण्यासाठी अभ्यास करण्याबद्दल कदाचित विचार करत असाल, तर मला वाटले की ते माझ्या अभ्यासक्रमातून कसे विकसित झाले आणि इतर अभ्यासक्रमांमध्ये कसे वापरले जात आहे याची मला कल्पना करता येईल.

कित्येक वर्षांपर्यंत मी पुस्तक न शिकता शिकलो; मी फक्त लेखांचा संग्रह नियुक्त केला होता. विद्यार्थी या लेखांमधून शिकू शकले, तरी लेख केवळ संकल्पनात्मक बदलांशी जुळत नाहीत जे मी तयार करण्याची आशा करीत होतो. म्हणून मी मोठ्या चित्रात विद्यार्थ्यांना पाहण्यात मदत करण्यासाठी दृष्टीकोन, संदर्भ आणि सल्ला प्रदान करणार्या बर्याच वेळा घालवितो. हे पुस्तक माझ्या सर्व दृष्टीकोनातून, संदर्भावरून आणि सल्ल्याप्रमाणे ज्याच्याकडे कोणतीही पूर्वतयारी नाही अशा सामाजिक शास्त्र किंवा डेटा विज्ञानाच्या संदर्भात लिहिण्याचा माझा प्रयत्न आहे.

एका सेस्टर-लांबीच्या कोर्समध्ये, मी हे पुस्तक इतर अतिरिक्त रीडिंगसह जोडण्याची शिफारस करतो. उदाहरणार्थ, हा कोर्स प्रयोगांवर दोन आठवडे खर्च करू शकेल आणि आपण प्रयोगांचे विश्लेषण आणि विश्लेषणात पूर्व-उपचार माहितीची भूमिका यासारख्या विषयांवरील रीडिंगसह अध्याय 4 जोडू शकता; कंपन्यांमध्ये मोठ्या प्रमाणात ए / बी चाचण्यांनी उठावलेल्या संख्याशास्त्रीय व संगणकीय मुद्दे; तंत्रज्ञानावर विशेषतः लक्ष केंद्रित केलेल्या प्रयोगांची रचना; आणि अॅमेझॉन यांत्रिक तुर्क सारख्या ऑनलाइन लॅब मार्केटमधील सहभागी वापरण्याशी संबंधित व्यावहारिक, वैज्ञानिक आणि नैतिक समस्या. प्रोग्रामिंगसह वाचन आणि क्रियाकलापांसह हे जोडले जाऊ शकते. या बर्याच शक्य जोडींमध्ये योग्य निवड आपल्या अभ्यासक्रमातील विद्यार्थ्यांवर अवलंबून आहे (उदा. पदवीपूर्व, मास्टर्स किंवा पीएचडी), त्यांची पार्श्वभूमी आणि त्यांचे उद्दिष्ट.

एक सत्र-लांबीचा अभ्यासक्रम देखील साप्ताहिक समस्या संच समाविष्ट करू शकतो. प्रत्येक अध्यायामध्ये विविध क्रियाकलाप असतात ज्यास कठिण पदवी म्हणतात: सोपे ( सोपे ), मध्यम ( मध्यम ), हार्ड ( कठीण ), आणि खूप कठीण ( खुप कठिण ). तसेच, मी प्रत्येक समस्येस आवश्यक असलेल्या कौशल्यांचे लेबल केले आहे: गणित ( गणित आवश्यक आहे ), कोडींग ( कोडींग आवश्यक ), आणि डेटा संकलन ( माहिती मिळवणे ). अखेरीस, मी माझ्या वैयक्तिक आवडीच्या काही क्रियाकलापांना लेबल केले आहे ( माझे आवडते ). मला आशा आहे की ह्या विविध उपक्रमांमधून आपल्याला आपल्या विद्यार्थ्यांना योग्य वाटेल अशा काही सापडतील.

अभ्यासक्रमात या पुस्तिकेचा वापर करणार्या लोकांना मदत करण्यासाठी, मी प्रत्येक अध्यायासाठी सिलेबस, स्लाइड्स, शिफारस केलेली जोड्या आणि काही क्रियाकलापांच्या उपाययोजना सारख्या शिक्षण सामग्रीचा संग्रह प्रारंभ केला आहे. आपण हे साहित्य शोधू शकता-आणि त्यात त्यांना योगदान देऊ शकता - http://www.bitbybitbook.com