הַקדָמָה

ספר זה החל בשנת 2005 במרתף באוניברסיטת קולומביה. באותו זמן, הייתי סטודנט לתואר שני, ואני ניהל ניסוי מקוון זה היה בסופו של דבר להיות מסה שלי. אני אספר לכם על החלקים המדעיים של הניסוי בפרק הרביעי, אבל עכשיו אני עומד לספר לכם על משהו שאינו בעבודת הדוקטורט שלי או בשום עיתון. וזה משהו ששינה ביסודו את האופן שבו אני חושב על מחקר. בוקר אחד, כשנכנסתי למשרדי במרתף, גיליתי שבן-לילה השתתפו בניסוי שלי כמאה איש מברזיל. לחוויה פשוטה זו היתה השפעה עמוקה עלי. באותו זמן היו לי חברים שמנהלים ניסויים מעבדתיים מסורתיים, וידעתי כמה קשה הם צריכים לעבוד כדי לגייס, לפקח ולשלם לאנשים כדי להשתתף בניסויים האלה; אם הם יכולים לרוץ 10 אנשים ביום אחד, זה היה התקדמות טובה. עם זאת, עם הניסוי המקוון שלי, 100 אנשים השתתפו בזמן שאני ישן . ביצוע המחקר שלך בזמן שאתה ישן אולי נשמע טוב מכדי להיות אמיתי, אבל זה לא. שינויים בטכנולוגיה - במיוחד המעבר מן הגיל האנלוגי לעידן הדיגיטלי - כלומר, אנו יכולים כעת לאסוף ולנתח נתונים חברתיים בדרכים חדשות. הספר הזה הוא על מחקר חברתי בדרכים חדשות אלה.

ספר זה מיועד למדעי החברה הרוצים לעשות יותר מדע נתונים, מדעני נתונים שרוצים לעשות יותר מדעי החברה, וכל מי שמעוניין בהכלאה של שני שדות אלה. בהתחשב מי הספר הזה, הוא צריך ללכת בלי לומר שזה לא רק עבור סטודנטים ופרופסורים. למרות שאני עובד כיום באוניברסיטה (פרינסטון), עבדתי גם בממשלה (במשרדי מפקד האוכלוסין של ארה"ב) ובענף הטכנולוגיה (ב- Microsoft Research), כך שאני יודע שיש הרבה מחקרים מרגשים שמתרחשים מחוץ ל אוניברסיטאות. אם אתה חושב על מה שאתה עושה כמחקר חברתי, אז הספר הזה הוא בשבילך, לא משנה איפה אתה עובד או איזה סוג של טכניקות אתה משתמש כרגע.

כפי שאולי אתה כבר שם לב, את הטון של הספר הזה הוא קצת שונה מזה של ספרים אקדמיים רבים אחרים. זה מכוון. ספר זה יצא מתוך סמינר בוגר על מדעי החברה חישובית כי לימדתי פרינסטון במחלקה לסוציולוגיה מאז 2007, ואני רוצה את זה כדי ללכוד חלק האנרגיה והתרגשות מאותו סמינר. בפרט, אני רוצה את הספר הזה יש שלושה מאפיינים: אני רוצה שזה יהיה מועיל, העתיד מוכווני, ואופטימי.

מועיל : המטרה שלי היא לכתוב ספר כי הוא מועיל לך. לכן, אני הולך לכתוב בסגנון פתוח, לא פורמלי, מונע על ידי דוגמה. זה כי הדבר החשוב ביותר שאני רוצה להעביר הוא דרך מסוימת לחשוב על מחקר חברתי. בנוסף, הניסיון שלי מעיד על כך שהדרך הטובה ביותר להעביר את צורת החשיבה הזו היא בלתי רשמית ועם הרבה דוגמאות. כמו כן, בסוף כל פרק, יש לי סעיף שנקרא "מה לקרוא הבא" שיעזור לך מעבר לקריאות מפורטות יותר טכני על רבים של נושאים שאני מציג. בסופו של דבר, אני מקווה שהספר הזה יעזור לכם לעשות מחקר ולהעריך את המחקר של אחרים.

אוריינטציה לעתיד: ספר זה יעזור לך לעשות מחקר חברתי באמצעות מערכות דיגיטליות שקיימים היום ואלה שייווצר בעתיד. התחלתי לעשות את זה סוג של מחקר בשנת 2004, ומאז ראיתי שינויים רבים, ואני בטוח כי במהלך הקריירה שלך תראה שינויים רבים מדי. הטריק להישאר רלוונטי מול השינוי הוא הפשטה . לדוגמה, זה לא הולך להיות ספר שמלמד אותך בדיוק איך להשתמש ב- API API כפי שהוא קיים היום; במקום זאת, הוא ילמד אותך כיצד ללמוד ממקורות נתונים גדולים (פרק 2). זה לא הולך להיות ספר זה נותן לך צעד אחר צעד הוראות להפעלת ניסויים על אמזון מכני טורק; במקום זאת, הוא ילמד אותך כיצד לעצב ולנסח ניסויים המסתמכים על תשתית גיל דיגיטלי (פרק 4). באמצעות שימוש בהפשטה, אני מקווה שזה יהיה ספר נצחי על הנושא בזמן.

אופטימיות : שתי הקהילות שעוסק בספר זה - מדעני החברה ומדעני הנתונים - בעלי רקע ואינטרסים שונים מאוד. בנוסף להבדלים אלה הקשורים למדע, עליהם אני מדבר בספר, שמתי לב שגם לשתי הקהילות הללו יש סגנונות שונים. מדעני נתונים נרגשים בדרך כלל; הם נוטים לראות את הכוס חצי מלאה. מדעני החברה, לעומת זאת, הם בדרך כלל קריטיים יותר; הם נוטים לראות את הכוס כחצי ריקה. בספר זה, אני הולך לאמץ את הטון האופטימי של מדען נתונים. לכן, כאשר אני מציג דוגמאות, אני הולך להגיד לך מה אני אוהב את הדוגמאות האלה. וכשאני מצביע על בעיות עם הדוגמאות - ואני אעשה את זה כי שום מחקר לא מושלם - אני אנסה להצביע על הבעיות האלה בצורה חיובית ואופטימית. אני לא הולך להיות קריטי למען קריטי - אני הולך להיות קריטי כדי שאוכל לעזור לך ליצור מחקר טוב יותר.

אנחנו עדיין בימים הראשונים של המחקר החברתי בעידן הדיגיטלי, אבל ראיתי כמה אי הבנות כי הם כל כך נפוץ כי זה הגיוני לי לכתוב אותם כאן, בהקדמה. מתוך מדענים נתונים, ראיתי שתי אי הבנות נפוצים. הראשון הוא חושב כי נתונים נוספים באופן אוטומטי פותר בעיות. עם זאת, עבור מחקר חברתי, זה לא היה הניסיון שלי. למעשה, עבור מחקר חברתי, נתונים טובים יותר - בניגוד לנתונים נוספים - נראים מועילים יותר. אי ההבנה השנייה שראיתי ממדעני נתונים חושבת כי מדעי החברה הם רק חבורה של דיבורים מפוארים העוטפים את השכל הישר. כמובן, בתור מדען חברתי - בייחוד כסוציולוג - אני לא מסכים עם זה. אנשים חכמים עבדו קשה כדי להבין את ההתנהגות האנושית במשך זמן רב, וזה נראה נבון להתעלם החוכמה שהצטבר מן המאמץ הזה. תקוותי היא שהספר הזה יציע לך חלק מהחוכמה הזאת בצורה שקל להבין.

מ מדענים חברתיים, ראיתי גם שתי אי הבנות נפוצים. ראשית, ראיתי כמה אנשים לכתוב את כל הרעיון של מחקר חברתי באמצעות הכלים של העידן הדיגיטלי בגלל כמה מסמכים רעים. אם אתה קורא את הספר הזה, אתה בטח כבר לקרוא חבורה של מסמכים המשתמשים בנתונים מדיה חברתית בדרכים בנאלי או לא נכון (או שניהם). אני חייב. עם זאת, זו תהיה טעות רצינית להסיק מן הדוגמאות כי כל מחקר חברתי גיל חברתי הוא רע. למעשה, אתה כנראה גם לקרוא חבורה של ניירות להשתמש בנתונים הסקר בדרכים כי הם בנאלי או לא נכון, אבל אתה לא כותב את כל המחקר באמצעות סקרים. זה בגלל שאתה יודע שיש מחקר גדול עם נתוני הסקר, ובספר זה אני הולך להראות לך שיש גם מחקר גדול לעשות עם הכלים של העידן הדיגיטלי.

אי ההבנה המשותפת השנייה שראיתי ממדעני החברה היא לבלבל את ההווה עם העתיד. כאשר אנו מעריכים את המחקר החברתי בעידן הדיגיטלי - המחקר שאני עומד לתאר - חשוב שנבקש שתי שאלות מובחנות: "עד כמה זה סגנון מחקר זה עובד עכשיו?" ו "כמה טוב זה יהיה סגנון של עבודת מחקר בעתיד? "החוקרים מאומנים לענות על השאלה הראשונה, אבל עבור הספר הזה אני חושב שהשאלה השנייה חשובה יותר. כלומר, למרות שהמחקר החברתי בעידן הדיגיטלי עדיין לא הניב תרומות אינטלקטואליות מסיביות ומשתנות, שיעור השיפור במחקרי העידן הדיגיטלי מהיר מאוד. זהו שיעור השינוי הזה - יותר מאשר הרמה הנוכחית - מה שהופך את המחקר בגיל-העידן למרגש כל כך בעיני.

למרות כי סעיף האחרון עשוי להיראות להציע לך עושר פוטנציאלי בזמן מסוים לא בעתיד, המטרה שלי היא לא למכור אותך על סוג מסוים של מחקר. אני לא מחזיק במניות באופן אישי בטוויטר, בפייסבוק, בגוגל, במיקרוסופט, באפל או בכל חברת טק אחרת (אם כי, לשם גילוי מלא, עלי להזכיר שעבדתי או קיבלתי מימון מחקרי, גוגל ופייסבוק). לאורך הספר, אם כן, המטרה שלי היא להישאר המספר אמין, לספר לך על כל הדברים החדשים מרגש כי הוא אפשרי, תוך הנחיית אותך מן כמה מלכודות שראיתי אחרים נופלים (ומדי פעם נפל לתוך עצמי) .

הצומת של מדעי החברה ומדעי הנתונים מכונה לעתים מדע חברתי חישובי. יש הרואים בכך שדה טכני, אבל זה לא יהיה ספר טכני במובן המסורתי. לדוגמה, אין משוואות בטקסט הראשי. בחרתי לכתוב את הספר בדרך זו משום שרציתי לספק מבט מקיף על מחקר חברתי בעידן הדיגיטלי, כולל מקורות נתונים גדולים, סקרים, ניסויים, שיתוף פעולה המוני, ואתיקה. התברר שלא ניתן לכסות את כל הנושאים הללו ולספק פרטים טכניים על כל אחד מהם. במקום זאת, מצביע על חומר טכני נוסף ניתנים בסעיף "מה לקרוא בהמשך" בסוף כל פרק. במילים אחרות, ספר זה לא נועד ללמד אותך כיצד לעשות כל חישוב ספציפי; אלא היא נועדה לשנות את הדרך שבה אתה חושב על מחקר חברתי.

כיצד להשתמש בספר זה בקורס

כפי שאמרתי קודם, ספר זה יצא בחלקו מסמינר בוגר על מדעי החברה חישובית כי אני מלמד מאז 2007 ב פרינסטון. מכיוון שאתה עשוי לחשוב על שימוש בספר זה כדי ללמד קורס, חשבתי שזה עשוי להיות מועיל לי להסביר איך זה גדל מתוך הקורס שלי איך אני מדמיין את זה בשימוש בקורסים אחרים.

במשך כמה שנים לימדתי את הקורס בלי ספר; אני רק להקצות אוסף של מאמרים. בעוד התלמידים היו מסוגלים ללמוד מן המאמרים האלה, המאמרים לבדם לא הובילו לשינויים רעיוניים שאני מקווה ליצור. אז הייתי מבלה את רוב הזמן בכיתה לספק פרספקטיבה, הקשר, ועצה כדי לעזור לתלמידים לראות את התמונה הגדולה. הספר הזה הוא הניסיון שלי לרשום את כל הפרספקטיבה, ההקשר והייעוץ באופן שאין לו תנאים מוקדמים - במונחים של מדעי החברה או מדעי הנתונים.

בקורס של סמסטרים, אני ממליץ לקשר את הספר עם מגוון של קריאות נוספות. לדוגמה, קורס כזה עשוי לבלות שבועיים בניסויים, ואתה יכול זוג פרק 4 עם קריאות על נושאים כגון תפקיד של מידע לפני הטיפול בעיצוב וניתוח של ניסויים; סוגיות סטטיסטיות וחישוביות המועלות על ידי בדיקות A / B בקנה מידה גדול בחברות; תכנון ניסויים המותאמים במיוחד למנגנונים; מעשיים, מדעיים, ואתיים הקשורים בשימוש המשתתפים בשוקי עבודה מקוונים, כגון אמזון מכניקה טורק. זה יכול להיות גם יחד עם קריאות ופעילויות הקשורות תכנות. הבחירה הנכונה בין זוגות אפשריים רבים אלה תלויה בתלמידים בקורס (לדוגמה, לתואר ראשון, לתואר שני או לדוקטורט), לרקע שלהם ולמטרות שלהם.

קורס באורך סמסטר יכול לכלול גם קבוצות שבועיות של בעיות. לכל פרק יש מגוון פעילויות אשר מסומנות על פי מידת הקושי: קל ( קַל ), בינוני ( בינוני ), קשה ( קָשֶׁה ), וקשה מאוד ( קשה מאוד ). כמו כן, יש לי תווית כל בעיה על ידי מיומנויות זה דורש: מתמטיקה ( דורש מתמטיקה ), קידוד ( דורש קידוד ), וכן איסוף נתונים ( איסוף נתונים ). לבסוף, אני שכותרתו כמה פעילויות שהם המועדפים שלי אישי ( המועדף עליי ). אני מקווה כי בתוך אוסף זה מגוון של פעילויות, תמצא כמה המתאימים לתלמידים שלך.

על מנת לעזור לאנשים המשתמשים בספר זה בקורסים, התחלתי אוסף של חומרי לימוד כגון תוכניות, שקופיות, זוגות מומלצים עבור כל פרק, ופתרונות לפעילויות מסוימות. אתה יכול למצוא את החומרים האלה ולתרום להם - http://www.bitbybitbook.com.