भूमिकामा

यो पुस्तक 1 ​​99 5 मा कोलम्बिया विश्वविद्यालयको तहखानेमा सुरु भयो। समयमा, म एक स्नातक विद्यार्थी हुनुहुन्थ्यो, र म एक अनलाइन प्रयोग चलिरहेको थिएँ जुन अन्ततः मेरो शोधेशन हुनेछ। म तपाईंलाई सबै प्रयोग अध्याय 4 मा वैज्ञानिक भागहरु को बारेमा बताउनेछु, तर अब म तपाईलाई मेरो शोधपत्र वा मेरो कुनै पनि कागजातमा छैन भन्ने बारेमा बताउन चाहन्छु। र यो केहि छ कि आधारभूत रूपले परिवर्तन गरेको छ कि म अनुसन्धानको बारे सोच्दैछु। एक बिहान, म मेरो तहखाने कार्यालयमा आइपुग्दा, मैले पत्ता लगाएको थिएँ कि ब्राजिलका करिब 100 जना जनावरले मेरो प्रयोगमा भाग लिइन्। यो सरल अनुभव मसँग गहिरो प्रभाव थियो। त्यस समयमा मैले साथीहरूसँग परम्परागत प्रयोगशाला प्रयोगहरू चलाइरहेका थिए, र मलाई थाहा थियो कि ती प्रयोगहरूमा भर्ती गर्ने, निरीक्षण गर्ने, र व्यक्तिहरूलाई भाग लिन तिनीहरूले कडा कडा परिश्रम गर्थे; यदि तिनीहरू एक दिनमा 10 व्यक्तिहरू चलाउन सक्थे भने त्यो राम्रो प्रगति थियो। तथापि, मेरो अनलाइन प्रयोगको साथ, मैले सुतिरहेको बेला 100 जनाले भाग लिइन्। तपाईंको सोच्दै गर्दा तपाईंले सोच्दा सोच्न सजिलो राम्रो हुन सक्छ, तर यो होइन। टेक्नोलोजीमा परिवर्तन - विशेष गरी डिजिटल युगमा एनालॉग युगबाट संक्रमण - हामी अब अब नयाँ तरिकामा सामाजिक डेटा संकलन र विश्लेषण गर्न सक्छौं। यो पुस्तक यी नयाँ तरिकाहरूमा सामाजिक अनुसन्धान गर्ने बारेमा हो।

यो किताब सोशल वैज्ञानिकहरूका लागि हो जुन अधिक डेटा विज्ञान गर्न चाहन्छन्, डेटा वैज्ञानिकहरू जसले थप सामाजिक विज्ञान गर्न चाहन्छन्, र यी दुई क्षेत्रहरूको हाइब्रिडमा रुचि राख्ने व्यक्ति। यो किताब कसको लागि छ भनेर, यो केवल छात्र र प्रोफेसर लागि मात्र होइन भनेर भन्न सकिन्छ। यद्यपि, म वर्तमानमा एक विश्वविद्यालय (प्रिन्सटोन) मा काम गर्छु, मैले पनि सरकारी (अमेरिकी जनगणना ब्यूरोमा) र टेक्नोल्यान्डमा (माइक्रोसफ्ट शोधमा) मा काम गरेको छु त्यसैले मलाई थाहा छ कि बाहिरको बारेमा धेरै उत्साहजनक अनुसन्धान विश्वविद्यालयहरू। यदि तपाई सोशल रिसर्चको रूपमा के गर्दै हुनुहुन्छ भन्ने बारे सोच्नुहुन्छ भने, यो पुस्तक तपाईंको लागि होईन, जहाँ तपाईं काम गर्नुहुन्छ वा कुन प्रकारका प्रविधिहरू तपाइँ हाल प्रयोग गर्नुहुन्छ।

तपाईंले पहिले नै ध्यान दिनुभएको हुन सक्छ, यो पुस्तकको टोन धेरै अन्य शैक्षिक पुस्तकहरु बाट बिभिन्न फरक छ। त्यो चिन्तित हो। यो पुस्तक कम्प्यूटेशनल सोशल साइंस मा एक स्नातक संगोष्ठी देखि उभिएको छ जुन मैले 2007 देखि सोसायटीविज्ञान विभाग मा प्रिंसटन मा पढाएको छ, र म यसलाई केहि संगोष्ठी देखि ऊर्जा र उत्तेजना को कब्जा गर्न चाहन्छु। खास गरी, म यो पुस्तकलाई तीन विशेषताहरू चाहान्छु: म यो उपयोगी, भविष्य-आधारित, र आशावादी हुन चाहन्छु।

सहायक : मेरो लक्ष्य एक पुस्तक लेख्न को लागी उपयोगी छ। यसकारण, म खुल्ला, अनौपचारिक र उदाहरण-आधारित शैलीमा लेख्न जाँदैछु। यो किनभने किनभने म यो कुरा गर्न चाहने सबैभन्दा महत्त्वपूर्ण कुरा सामाजिक अनुसन्धानको बारेमा सोच्ने एक निश्चित तरिका हो। अनि, मेरो अनुभवले यो सोचको मार्गलाई अभिव्यक्ति गर्ने सबैभन्दा राम्रो तरिकाले जानकारी दिन्छ कि अनौपचारिक र धेरै उदाहरणहरूको साथ। साथै, प्रत्येक अध्यायको अन्त्यमा, मैले "सेकेन्ड पढ्न के हो" भन्ने एक खण्ड छ जुन तपाइँले परिचय दिनुभएका धेरै विषयहरूमा अधिक विस्तृत र टेक्निकल रीडिङहरूमा हस्तान्तरण गर्न मद्दत गर्दछ। अन्तमा, मलाई आशा छ कि यो पुस्तकले तपाईलाई अनुसन्धान गर्न र अरूको अनुसन्धानको मूल्यांकन गर्न मद्दत गर्नेछ।

भविष्यमा-उन्मुख: यो पुस्तक तपाईं आज अवस्थित कि डिजिटल प्रणाली भविष्यमा सिर्जना गरिने ती प्रयोग सामाजिक अनुसन्धान गर्न मदत गर्नेछ। मैले 2004 मा यस्तो किसिमको अनुसन्धान शुरू गरें, र त्यस पछि मैले धेरै परिवर्तनहरू देखेको छु, र म निश्चित छु कि तपाईको क्यारियरको पाठ्यक्रममा तपाईले धेरै परिवर्तनहरू पनि देख्नुहुनेछ। परिवर्तनको अनुहारमा प्रासंगिक रहन चाल अव्यवस्थित छ । उदाहरणका लागि, यो एउटा किताब बन्ने छैन जुन तपाइँलाई कसरी सही तरिकाले ट्विटर एपिआई प्रयोग गर्ने भनेर सिकाउनुहुन्छ किनकि यो आज अवस्थित छ; बरु, यो तपाईलाई कसरी सिकाउनुहुन्छ कि ठूलो डेटा स्रोतहरू कसरी सिक्न (अध्याय 2)। यो एक पुस्तक बन्ने छैन जुन तपाईले अमेजन मेक्सिको टर्कीमा चलिरहेको प्रयोगहरूको लागि चरण-दर-चरण निर्देश दिन्छ। सट्टा, यो तपाईंलाई सिधा जाँदैछ कि प्रयोग कसरी प्रयोग र व्याख्या गर्ने कि डिजिटल युगको आधारभूत ढाँचामा निर्भर गर्दछ (अध्याय 4)। अमूर्तको प्रयोगको माध्यमबाट, मलाई आशा छ कि यो एक समयमै विषयमा एक बेग्लै पुस्तक हुनेछ।

अनुकूलन : दुई समुदायहरू जुन यो किताब संलग्न हुन्छ - सामाजिक वैज्ञानिकहरू र डेटा वैज्ञानिकहरूले धेरै फरक पृष्ठभूमि र चासो राख्छन्। यी विज्ञान-सम्बन्धित मतभेदहरूको अतिरिक्त, जुन मैले पुस्तकमा कुरा गर्छु, मैले पनि देखेको छु कि यी दुई समुदायहरूले विभिन्न शैलीहरू छन्। डेटा वैज्ञानिकहरू सामान्यतया उत्साहित छन्; तिनीहरूले गिलास को रूप मा आधा भिक्षु को रूप मा देख रहे हो। अर्कोतर्फ सामाजिक वैज्ञानिक, सामान्यतया अधिक महत्वपूर्ण हुन्छन्; तिनीहरू गिलास आधा खाली रूपमा देख्छन्। यस पुस्तकमा, म डेटा वैज्ञानिकको आशावादी टोन अप्ठेरोमा जाँदैछु। त्यसोभए, जब म उदाहरणहरू प्रस्तुत गर्दछु, म तपाईंलाई बताउन चाहन्छु कि यी उदाहरणहरूको बारेमा म माया गर्छु। र, जब मैले उदाहरणहरूको साथ समस्याहरू बिर्सन्छु- र म यो गर्नेछु किनभने कुनै अनुसन्धान सिद्ध छैन- म यी समस्याहरू सकारात्मक र आशावादी तरिकामा बिचार गर्न प्रयास गर्न जाँदैछु। म आलोचनाको लागि महत्वपूर्ण रहन सक्दिनँ - म महत्वपूर्ण हुन जाँदैछु ताकि म तपाईंलाई राम्रो अनुसन्धान सिर्जना गर्न मद्दत गर्न सक्छु।

हामी डिजिटल उमेरमा सामाजिक अनुसन्धानको शुरुआती दिनमा अझै पनि छौँ, तर मैले केही गलत गल्तीहरू देखेको छु जुन यति धेरै सामान्य छ कि यो तिनीहरूलाई यहाँ ठेगाना गर्न, सम्बोधन गर्दछ। डेटा वैज्ञानिकहरूले, मैले दुई साधारण गलत ज्ञान देखेको छु। पहिलो सोच छ कि अधिक डेटा स्वचालित रूपमा समस्या समाधान गर्दछ। यद्यपि, सामाजिक अनुसन्धानको लागि, यो मेरो अनुभव भएको छैन। वास्तवमा, सोशल रिसर्चको लागि, अझ राम्रो डेटा - जस्तो धेरै डेटाको विरोध - अझ बढी सहयोगी जस्तो देखिन्छ। दोस्रो गलतफ्लु मैले डेटा वैज्ञानिकहरूलाई देखेको छ भनेर सोच्दै सो सोर्सिंग सोसायटी केवल सामान्य अर्थको वरिपरि फैंसी कुराको एक गुच्छा हो। निस्सन्देह, एक सामाजिक वैज्ञानिक - विशेष गरी समाजशास्त्रीको रूपमा - म त्यो सहमत छु। स्मार्ट व्यक्ति लामो समयसम्म मानव व्यवहार बुझ्न कडा मेहनत गरिरहेका छन्, र यो यो प्रयासबाट संचित ज्ञानलाई बेवास्ता गर्न अनायास देखिन्छ। मेरो आशा यो हो कि यस किताबले तपाईलाई केहि ज्ञान प्रदान गर्नेछ जुन बुझ्न सजिलो छ।

सामाजिक वैज्ञानिकहरूले, मैले पनि दुइटा गलत गलत ज्ञान देखेको छु। पहिलो, मैले केही मान्छे देखेको छु केहि बुजुर्ग कागजातहरूको कारण डिजिटल युगको उपकरणहरू प्रयोग गरी सामाजिक अनुसन्धानको सम्पूर्ण विचारलाई लेख्दछ। यदि तपाइँ यो किताब पढ्दै हुनुहुन्छ भने, तपाईंले सम्भवतः कागजातहरूको गुच्छा पढ्नु भएको छ जुन सोशल मिडिया डाटा प्रयोग गर्दछ जुन किरण वा गलत (वा दुवै) मा छन्। मसँग पनि छ। यद्यपि, यी उदाहरणहरूबाट निष्कर्ष निकाल्न गम्भीर गल्ती हुनेछ कि सबै डिजिटल-उमेर सामाजिक अनुसन्धान खराब छ। वास्तवमा, तपाइँले कागजातहरूको गुच्छा पनि पढ्नुभएको छ जुन सर्वेक्षण डेटा प्रयोग गर्दछ जुन किरण वा गलत छन्, तर तपाइँ सर्वेक्षणहरू प्रयोग गरेर सबै अनुसन्धानहरू लेख्नुहुन्न। यो कारणले गर्दा तपाईं सर्वेक्षण डेटासँग राम्रो अनुसन्धान भएको छ, र यस पुस्तकमा म तपाईंलाई देखाउन जाँदै हुनुहुन्छ कि डिजिटल युगको उपकरणको साथमा राम्रो अनुसन्धान पनि छ।

दोस्रो वैज्ञानिक गलत ज्ञान मैले सोशल वैज्ञानिकहरूबाट देखेको छु भविष्यको साथ वर्तमान भ्रमित गर्न को लागी। जब हामी डिजिटल युगमा सोशल रिसर्चको आकलन गर्दछौं - मैले अनुसन्धानको लागि जाँदै गरेको अनुसन्धान - यो हामी महत्त्वपूर्ण छ कि हामी दुइटा फरक प्रश्नहरू सोध्दछौं: "अहिले यो अनुसन्धानको काम कस्तो हुन्छ?" र "यो शैली कस्तो हुन्छ? भविष्यमा अनुसन्धान कार्य? "अनुसन्धानकर्ताहरूलाई पहिलो प्रश्नको उत्तर दिन प्रशिक्षित गरिन्छ, तर यस किताबको लागि मलाई लाग्छ कि दोस्रो प्रश्न अझ महत्त्वपूर्ण छ। यद्यपि, डिजिटल युगमा सामाजिक अनुसन्धानले अझैसम्म ठूलो, प्रतिमान-परिवर्तनकारी बौद्धिक योगदानहरू उत्पादन गरेको छैन, डिजिटल-उमेर अनुसन्धानको सुधारको दर अविश्वसनीय रूपले छिटो छ। यो परिवर्तनको यो दर-वर्तमान स्तर भन्दा बढि - जुन मलाई डिजिटल-उमेर अनुसन्धानले मलाई धेरै उत्साहित गर्दछ।

यद्यपि यो अन्तिम अनुच्छेदले भविष्यमा केहि निश्चित समयमा सम्भावित धनहरू प्रस्ताव गर्न सक्छ जस्तो लाग्छ, मेरो लक्ष्य तपाईंलाई कुनै पनि प्रकारको अनुसन्धानमा बेच्ने छैन। म व्यक्तिगत रूपमा चहचहाना, फेसबुक, गुगल, माइक्रोसफ्ट, एप्पल, वा कुनै अन्य प्रविधि कम्पनीमा शेयरको स्वामित्व छैन (यद्यपि, पूर्ण प्रकटीकरणको लागि, मैले उल्लेख गरेको छु कि मैले काम गरेको छु, वा माइक्रोसफ्टबाट अनुसन्धान अनुसन्धान प्राप्त गरेको छु, Google, र फेसबुक)। यसैले, मेरो लक्ष्य एक विश्वसनीय अभिव्यक्ति बन्न छ, तपाईलाई सबै उत्तिकै नयाँ चीजहरू सम्भव छ भनेर सम्भव छ, जब तपाईले देख्नुभएका केहि जालहरु बाट टाढाको निर्देशन (र कहिलेकाँही आफैंमा जान्छ) ।

सामाजिक विज्ञान र डेटा विज्ञान को चौकस कहिलेकाहीं कम्प्यूटेशनल सोशल विज्ञान भनिन्छ। कसैलाई यो प्राविधिक क्षेत्र बन्छ, तर यो पारंपरिक अर्थमा प्राविधिक पुस्तक हुनेछैन। उदाहरणका लागि, मुख्य पाठमा कुनै समीकरणहरू छैनन्। मैले यस पुस्तकलाई लेख्न रोजेका छन किनभने म ठूलो डाटा स्रोतहरू, सर्वेक्षणहरू, प्रयोगहरू, सामूहिक सहयोग र नैतिकता सहित डिजिटल उमेरमा सामाजिक अनुसन्धानको व्यापक दृश्य प्रदान गर्न चाहन्छु। यो सबै विषयहरू समाविष्ट गर्न र प्रत्येकको बारेमा प्राविधिक विवरणहरू असंभव हुन असक्षम भयो। बरु, प्रत्येक अध्यायको अन्तमा "अर्को पढ्न के लागी" को लागी अधिक प्राविधिक सामग्रीलाई संकेत गर्दछ। अन्य शब्दहरूमा, यो किताब डिजाइन गरिएको छैन कि तपाइँलाई कुनै पनि गणना गर्न कसरी सिकाउने; बरु, यो सामाजिक अनुसन्धानको बारेमा सोच्ने तरिका परिवर्तन गर्न डिजाइन गरिएको छ।

यो पुस्तक कसरी पाठ्यक्रममा प्रयोग गर्ने

मैले पहिले भनें, यो पुस्तक कम्प्युटेशनल सोसायटी मा एक स्नातक संगोष्ठी बाट भाग मा उभिएको छ जुन मैले 2007 पछि प्रिन्सटन मा पढाई गरिरहेको छु। एक पाठ्यक्रम सिकाउनको लागि तपाईं यो पुस्तक प्रयोग गर्न सोचिरहेको हुन सक्छ, मैले सोचे कि यो मेरो लागि उपयोगी हुन सक्छ कि यो मेरो पाठ्यक्रम कसरी भयो भनेर कसरी वर्णन गर्छु र कसरी यो कल्पना गर्दछ कि यो अन्य पाठ्यक्रमहरुमा प्रयोग भइरहेको छ।

धेरै वर्षसम्म मैले मेरो पाठ्यक्रमलाई पुस्तक बिना पढेँ; म लेखको संग्रह असाइन गर्न चाहन्छु। जब विद्यार्थी यी लेखहरूबाट सिक्न सक्षम थिए, एक्लै लेखहरू अवधारणात्मक परिवर्तनहरूमा जाने थिएनन् जुन मैले सिर्जना गर्न खोजेको थिएँ। यसैले विद्यार्थीहरूले ठूलो तस्विरलाई मद्दत गर्न मद्दतको लागि कक्षामा प्रायः समय बिताउने दृष्टिकोण, सन्दर्भ र सल्लाह प्रदान गर्दछन्। यो पुस्तक मेरो सम्पूर्ण दृष्टिकोण, सन्दर्भ, र सल्लाह लाई लेख्न को लागी मेरो प्रयास छ जुन कुनै आवश्यक-कुनै सामाजिक विज्ञान वा डेटा विज्ञानको शर्तमा छैन।

एक सेमेस्टर-लामो पाठ्यक्रममा, म यस पुस्तक जोडी गर्न को लागि विभिन्न अतिरिक्त पढाइहरु संग सिफारिस गर्नेछु। उदाहरणको लागि, यस्तो कोर्स अनुभवमा दुई हप्ता खर्च गर्न सक्दछ, र तपाइँ विषयहरूमा पढ्नका लागि पढाइ र प्रयोगका पूर्व-उपचार जानकारी जस्ता प्रयोगहरूमा पाठ 4 सँग जोड्न सक्नुहुनेछ; तथ्याङ्कमा ठूलो मात्रामा A / B परीक्षण गरिएका सांख्यिकीय र कम्प्युटिटिकल मुद्दाहरू; प्रयोगहरूको डिजाइन विशेष गरी तंत्रमा ध्यान दिइयो; र अमेजन मेकनिक टर्की जस्तै अनलाइन श्रम बजारहरूबाट सहभागीहरू प्रयोग गर्न सम्बन्धित व्यावहारिक, वैज्ञानिक र नैतिक विषयहरू। यो पनि प्रोग्रामिंग संग सम्बन्धित पढाई र गतिविधि संग जोडा जान सक्छ। यी धेरै सम्भावित जोडीहरू बीच उपयुक्त छनौट तपाईंको पाठ्यक्रमका विद्यार्थीहरू (जस्तै, स्नातक, मास्टर, वा पीएचडी), तिनीहरूको पृष्ठभूमि र तिनीहरूको लक्ष्यहरूमा निर्भर गर्दछ।

एक सेमेस्टर-लम्बाइको कोर्समा साप्ताहिक समस्या सेटहरू समावेश हुन सक्छ। प्रत्येक अध्यायमा विभिन्न प्रकारका गतिविधिहरू छन् जुन कठिनाइको डिग्री द्वारा लेबल गरिएको छ: सजिलो ( सजिलो ), मध्यम ( मध्यम ), कडा ( कठोर ), र धेरै कठिन ( धेरै कडा )। साथै, मैले प्रत्येक समस्याको आवश्यकतालाई प्रत्येक समस्यालाई लेबल गरेको छु: गणित (गणित) गणित चाहिन्छ ), कोडिंग ( कोडिङ चाहिन्छ ), र डेटा संग्रह ( तथ्यांक संकलन )। अन्तमा, मैले केही व्यक्तिगत क्रियाकलापहरू गरेको केही गतिविधिहरू लेबल गरेका छन् ( मेरो मन पर्ने )। मलाई आशा छ कि गतिविधिहरूको यस विविध संग्रह भित्र, तपाईंले केहि विद्यार्थीहरू खोज्नुहुनेछ जुन तपाईंको विद्यार्थीहरूको लागि उपयुक्त छ।

पाठ्यक्रमहरूमा यो किताब प्रयोग गर्ने व्यक्तिहरूलाई मद्दत गर्नको लागि, मैले सिलेबसहरू, स्लाइडहरू, प्रत्येक अध्यायका लागि अनुशंसित जोडाहरू, र केही गतिविधिहरूको समाधानहरूको रूपमा शिक्षण सामग्रीको संग्रह सुरु गरेको छु। तपाईंले यी सामग्री पाउन सक्नुहुन्छ-र http://www.bitbybitbook.com मा योगदान गर्नुहोस्।