مقدمه

این کتاب در سال 2005 در زیرزمین دانشگاه کلمبیا آغاز شد. در آن زمان من دانشجوی تحصیلات تکمیلی بودم و یک آزمایش آنلاین انجام دادم که در نهایت من پایان نامه من بود. من در مورد بخش های علمی این آزمایش در فصل 4 به شما می گویم، اما اکنون قصد دارم درباره چیزی که در رشته من و یا در یکی از مقالات من نیست، به شما بگویم. و این چیزی است که اساسا تغییر کرد چگونه من در مورد تحقیق فکر می کنم. صبح روزی که من به دفتر زیرزمینم آمدم، متوجه شدم که حدود 100 نفر از برزیل در آزمایش من شرکت کرده بودند. این تجربه ساده تأثیر عمیقی روی من گذاشت. در آن زمان، من دوستانی داشتم که آزمایشات آزمایشگاهی سنتی انجام می دادند و می دانستم که چقدر سخت کار می کنند تا کار کنند، نظارت کنند و مردم را برای شرکت در این آزمایش ها بپردازند؛ اگر آنها بتوانند در یک روز 10 نفر را اداره کنند، پیشرفت خوبی بود. با این حال، با آزمایش آنلاین من، 100 نفر در حالی که من خواب بود شرکت کردند. انجام تحقیقات خود را در حالی که خواب دارید ممکن است به نظر برسد خیلی خوب است که درست باشد اما این نیست. تغییرات در تکنولوژی - به ویژه انتقال از عصر آنالوگ به عصر دیجیتال - به این معنی است که ما اکنون می توانیم داده های اجتماعی را با روش های جدید جمع آوری و تجزیه و تحلیل کنیم. این کتاب در مورد انجام تحقیقات اجتماعی در این راههای جدید است.

این کتاب برای دانشمندان اجتماعی است که میخواهند علم داده بیشتر، دانشمندانی که میخواهند علم اجتماعی بیشتری داشته باشند، و هر کسی که علاقهمند به ترکیبی از این دو حوزه است، دانش را به کار ببرد. با توجه به اینکه این کتاب برای این است، باید بدون گفتن این امر صرفا برای دانش آموزان و استادان باشد. اگر چه من در حال حاضر در دانشگاه (پرینستون) کار می کنم، من نیز در دولت (در اداره آمار ایالات متحده) و در صنعت فناوری (در تحقیقات مایکروسافت) کار کرده ام، بنابراین من می دانم که بسیاری از تحقیقات هیجان انگیز رخ می دهد خارج از دانشگاه ها. اگر شما به تحقیقات اجتماعی فکر می کنید، این کتاب برای شما مهم نیست، جایی که کار می کنید یا چه تکنیک هایی را که در حال حاضر استفاده می کنید.

همانطور که پیش از این متوجه شدید، تن این کتاب کمی متفاوت از سایر کتاب های آکادمیک است. این عمدی است این کتاب از یک سمینار فارغ التحصیل در علوم اجتماعی محاسباتی است که من از سال 2007 در دانشگاه پرینستون در گروه جامعه شناسی تدریس کرده ام و از آن خوشم می آید که برخی از انرژی و هیجان را از این سمینار بگیرد. به ویژه، من می خواهم این کتاب دارای سه ویژگی باشد: من می خواهم آن را مفید، آینده گرا، و خوش بینانه باشد.

مفید : هدف من این است که یک کتاب را بنویسید که برای شما مفید باشد. بنابراین، من قصد دارم در سبک باز، غیر رسمی و به عنوان مثال هدایت می کنم. به همین دلیل است که مهمترین چیزی که می خواهم به آن انتقال دهم، راه خاصی برای فکر کردن درباره تحقیقات اجتماعی است. و تجربه من نشان می دهد که بهترین روش برای بیان این نوع تفکر غیر رسمی و با نمونه های زیادی است. همچنین، در انتهای هر فصل، من یک بخش به نام "چه چیزی را بخوانید بعد" که به شما کمک می کند به خواندن دقیق تر و فنی در بسیاری از موضوعاتی که من معرفی می کنم کمک کنم. در پایان، من امیدوارم که این کتاب به شما کمک خواهد کرد که هر دو تحقیق و ارزیابی تحقیقات دیگران را انجام دهید.

آینده گرا : این کتاب به شما کمک می کند تا تحقیقات اجتماعی را با استفاده از سیستم های دیجیتالی که در حال حاضر وجود دارد و همچنین آنهایی که در آینده ایجاد می شوند، انجام دهید. من شروع به انجام این نوع تحقیق در سال 2004 کردم و از آن زمان تغییرات بسیاری دیده ام و مطمئن هستم که طی دوره حرفه ای شما نیز تغییرات زیادی خواهید دید. ترفند برای ماندن در رابطه با تغییر، انتزاع است . به عنوان مثال، این یک کتاب نیست که دقیقا به شما نحوه استفاده از API توییتر به عنوان آن را امروز تعلیم می دهد؛ در عوض، آن را به شما یاد می دهد که چگونه از منابع داده بزرگ یاد بگیرند (فصل 2). این کتابی نیست که به شما دستورالعمل های گام به گام برای انجام آزمایشات در آمازون مکانیک ترک باشد؛ در عوض، آن را به شما آموزش می دهد که چگونه به طراحی و تفسیر آزمایش ها که بر زیرساخت های سنسور دیجیتال (فصل 4) تکیه می کنند. از طریق استفاده از انتزاع، امیدوارم این یک کتاب بی انتها در مورد موضوع به موقع باشد.

خوش بینانه : دو جوامع که این کتاب را درگیر می داند - دانشمندان علوم اجتماعی و دانشمندان - زمینه و منافع بسیار متفاوت دارند. علاوه بر این تفاوت های مرتبط با علم، که من در این کتاب به آن اشاره می کنم، همچنین متوجه شدم که این دو انجمن دارای سبک های متفاوت هستند. دانشمندان اطلاعات عموما هیجان زده هستند آنها تمایل دارند که شیشه را به عنوان نیمه کامل ببینند. از سوی دیگر، دانشمندان علوم اجتماعی عموما انتقادی هستند؛ آنها تمایل دارند شیشه را به عنوان نیمه خالی ببینند. در این کتاب، من میخواهم لحن خوش بینانه یک دانشمند داده را اتخاذ کنم. بنابراین، هنگامی که من نمونه هایی را ارائه می دهم، می خواهم به شما بگویم که من در مورد این مثال ها را دوست دارم. و هنگامی که من با مشکلات نمونه هایی را ذکر می کنم - و من این کار را انجام خواهم داد زیرا هیچ تحقیقی کامل نیست - من سعی می کنم این مشکلات را به شیوه ای مثبت و خوش بینانه ذکر کنم. من نمی خواهم به خاطر بحرانی بحرانی باشم. من مهم هستم تا بتوانم به شما در ایجاد پژوهش بهتر کمک کنم.

ما هنوز در روزهای اولیه تحقیقات اجتماعی در عصر دیجیتال هستیم، اما من برخی از سوء تفاهمات را دیده ام که بسیار رایج است، زیرا من در این مقدمه به آن اشاره می کنم. از دانشمندان داده، دو سوء تفاهم مشترک را دیده ام. اول فکر می کند که اطلاعات بیشتر به طور خودکار مشکلات را حل می کند. با این حال، برای تحقیقات اجتماعی، این تجربه من نیست. در حقیقت، برای تحقیقات اجتماعی، داده های بهتر، به عنوان مخالف با داده های بیشتر، بیشتر مفید هستند. سوءتفاهم دوم که از دانشمندان داده شده دیده ام فکر می کنم که علوم اجتماعی فقط یک دسته از گفتمان فانتزی پیچیده شده در اطراف عقل سلیم است. البته، به عنوان یک دانشمند اجتماعی - به طور خاص به عنوان یک جامعه شناس - من با آن موافق نیستم. مردم هوشمند برای مدت طولانی به درک رفتار انسانی مشغول هستند و به نظر می رسد ناعادلانه به نادیده گرفتن خرد است که از این تلاش ها انباشته شده است. امید من این است که این کتاب برخی از آن عقل را به طریقی که آسان است درک کند.

از دانشمندان علوم اجتماعی، من نیز دو سوء تفاهم رایج دیده ام. اولا، من بعضی از افراد را میبینم که کل تحقیقات اجتماعی را با استفاده از ابزارهای عصر دیجیتال، به دلیل چند مقاله بد، از بین میبرند. اگر بخواهید این کتاب را بخوانید، احتمالا قبلا تعدادی از مقالاتی را که از داده های رسانه های اجتماعی استفاده می کنند، به روش های مضر یا اشتباه (یا هر دو) بخوانید. من هم دارم با این وجود، این اشتباه جدی است که از این نمونه ها نتیجه گیری شود که همه تحقیقات اجتماعی دیجیتال بد است. در حقیقت، شما احتمالا همچنین مقداری از مقالاتی را که از داده های نظرسنجی در شیوه هایی استفاده می کنید که شایسته یا غلط هستند استفاده می کنید، اما همه تحقیقات را با استفاده از نظرسنجی ها انجام ندهید. به همین دلیل است که می دانید تحقیقات زیادی در مورد داده های نظرسنجی انجام شده است و در این کتاب من به شما نشان می دهم که تحقیقات خوبی در زمینه ابزارهای عصر دیجیتال انجام شده است.

دومین سوء تفاهم معمولی که من از دانشمندان علوم اجتماعی دیده ام این است که آینده را باهم اشتباه بگیرد. وقتی تحقیقات اجتماعی در عصر دیجیتال را ارزیابی میکنیم، تحقیقاتی که من آن را توصیف میکنم، مهم است که از دو سوال جداگانه بپرسیم: «این شیوه تحقیق در حال حاضر چقدر خوب است؟» و «چقدر این سبک تحقیقات در آینده؟ "محققان برای پاسخ به اولین سوال آموزش دیده اند، اما برای این کتاب، من فکر می کنم که سوال دوم مهم تر است. به این معناست که حتی تحقیقات اجتماعی در عصر دیجیتالی هنوز هم به شکل گسترده ای از مشارکت های فکری درمورد تغییر پارادایم تولید نمیکنند، اما میزان پیشرفت تحقیقات پیرامون سنسور فوق العاده سریع است. این میزان تغییرات بیشتر از سطح فعلی است که تحقیقات پیری را برای من بسیار هیجان انگیز می کند.

با وجود این که به نظر می رسد که پاراگراف آخر شما در آینده در مورد بعضی از زمان های نامشخص به شما ارائه می دهد، هدف من این نیست که شما را به نوع خاصی از تحقیقات برسانید. من شخصا سهام خود را در توییتر، فیس بوک، گوگل، مایکروسافت، اپل و یا هر شرکت فناوری دیگر خود ندارم (اگر چه به خاطر افشای کامل من باید ذکر کنم که من در مایکروسافت مشغول تحقیق بودم گوگل و فیس بوک) بنابراین، در تمام کتاب، هدف من این است که به عنوان راوی معتبر باقی بمانم، به شما در مورد همه چیزهای جدید هیجان انگیز که ممکن است، و هدایت شما را از چند تله که من دیده ام دیگران سقوط (و گاهی اوقات به خودم افتادن) .

تقاطع علوم اجتماعی و علوم داده گاهی اوقات علم اجتماعی محاسباتی نامیده می شود. بعضی از اینها به عنوان یک زمینه فنی شناخته می شوند، اما این یک کتاب فنی در معنای سنتی نخواهد بود. به عنوان مثال، در متن اصلی معادلات وجود ندارد. من تصمیم گرفتم کتاب را به این شکل بنویسم زیرا می خواستم دیدگاه جامع از تحقیقات اجتماعی در عصر دیجیتال، از جمله منابع داده های بزرگ، نظرسنجی ها، آزمایش ها، همکاری های تودهای و اخلاق ارائه کنم. معلوم شد غیرممکن است که تمام این موضوعات را پوشش دهد و جزئیات فنی در مورد هر یک را ارائه دهد. در عوض، اشاره به مطالب فنی بیشتر در قسمت "چه چیزی را بخوانید" در انتهای هر فصل داده شده است. به عبارت دیگر، این کتاب برای شما طراحی نشده است که چگونه به انجام محاسبات خاصی بپردازید. بلکه، این شیوه طراحی شده است تا شیوه ای را که شما در مورد تحقیقات اجتماعی فکر می کنید تغییر دهید.

چگونه از این کتاب در یک دوره استفاده کنید

همانطور که قبلا گفتم، این کتاب بخشی از یک سمینار فارغ التحصیل در علوم اجتماعی محاسباتی بود که من از سال 2007 در پرینستون آموزش دادم. از آنجا که شما ممکن است در مورد استفاده از این کتاب برای تدریس به یک دوره فکر فکر کنید، من فکر کردم که ممکن است برای من توضیح دهد که چگونه از دوره من رشد کرد و چگونه تصور می کردم که در دوره های دیگر استفاده شود.

چند سال است که من بدون یک کتاب درس خواندم من فقط مجموعه ای از مقالات را اختصاص دادم. در حالی که دانش آموزان توانستند از این مقالات یاد بگیرند، مقالات به تنهایی منجر به تغییرات مفهومی که من امیدوار بودم ایجاد کنم. بنابراین من اغلب وقت در کلاس را صرف ارائه چشم انداز، زمینه، و مشاوره برای کمک به دانش آموزان تصویر بزرگ را مشاهده کنید. این کتاب تلاش من برای نوشتن تمام این دیدگاه، زمینه و مشاوره به شیوه ای است که هیچ پیش شرطی در این زمینه ندارد - از لحاظ علوم اجتماعی یا علم اطلاعات.

در طول یک ترم طولانی، من توصیه می کنم این کتاب را با انواع مختلفی از خواندن همراه کنم. به عنوان مثال، چنین دوره ای ممکن است دو هفته در آزمایش انجام شود و شما می توانید فصل 4 را با قرائت هایی در مورد موضوعاتی مانند نقش اطلاعات قبل از درمان در طراحی و تجزیه و تحلیل آزمایشات مقایسه کنید. مسائل آماری و محاسباتی مطرح شده توسط آزمون های A / B در شرکت های بزرگ؛ طراحی آزمایشات به طور خاص بر مکانیزم ها متمرکز شده است. و مسائل عملی، علمی و اخلاقی مربوط به استفاده از شرکت کنندگان از بازار کار آنلاین، مانند آمازون مککرات ترک. همچنین می تواند با خواندن و فعالیت های مرتبط با برنامه نویسی مرتبط باشد. انتخاب مناسب بین این بسیاری از جفت های ممکن بستگی به دانش آموزان در دوره شما (به عنوان مثال، کارشناسی، کارشناسی ارشد، یا دکترا)، زمینه های آنها و اهداف آنها.

یک دوره ترم دوره نیز می تواند شامل مجموعه ای از مشکلات مربوط به هفتگی باشد. هر فصل فعالیت های گوناگونی دارد که با درجه سختی برچسب گذاری می شوند: آسان ( آسان )، متوسط ​​( متوسط )، سخت ( سخت ) و بسیار سخت ( خیلی سخت ) همچنین، با توجه به مهارت هایی که لازم است، هر کدام از مشکلات را برچسب گذاری می کنم: math ( نیاز به ریاضی دارد )، برنامه نویسی ( نیاز به برنامه نویسی دارد ) و جمع آوری اطلاعات ( جمع آوری داده ها ) در نهایت، من بعضی از فعالیتهایی را که مورد علاقه شخصی من هستند، برچسب گذاری کردم ( مورد علاقه من ) امیدوارم در این مجموعه گوناگون فعالیت هایی پیدا شود که برخی از آنها برای دانش آموزان مناسب است.

برای کمک به افرادی که از این کتاب استفاده می کنند در دوره ها، مجموعه ای از مواد آموزشی مانند برنامه های آموزشی، اسلایدها، جفت های توصیه شده برای هر فصل و راه حل هایی برای برخی فعالیت ها را آغاز کرده ام. شما می توانید این مواد را پیدا کنید و به آنها کمک کنید - در http://www.bitbybitbook.com.