Bit By Bit: Social Research in the Digital Age
  • ስለ
    • ክፈት ክለሳ
    • መጥቀስ
    • ኮድ
    • ስለደራሲው
    • ግላዊነት እና ስምምነት
  • ቋንቋዎች
    • English
    • Afrikaans
    • Albanian
    • Amharic
    • Arabic
    • Armenian
    • Azerbaijani
    • Basque
    • Belarusian
    • Bengali
    • Bosnian
    • Bulgarian
    • Catalan
    • Cebuano
    • Chichewa
    • Chinese Simplified
    • Chinese Traditional
    • Corsican
    • Croatian
    • Czech
    • Danish
    • Dutch
    • Esperanto
    • Estonian
    • Filipino
    • Finnish
    • French
    • Frisian
    • Galician
    • Georgian
    • German
    • Greek
    • Gujarati
    • Haitian Creole
    • Hausa
    • Hawaiian
    • Hebrew
    • Hindi
    • Hmong
    • Hungarian
    • Icelandic
    • Igbo
    • Indonesian
    • Irish
    • Italian
    • Japanese
    • Javanese
    • Kannada
    • Kazakh
    • Khmer
    • Korean
    • Kurdish (Kurmanji)
    • Kyrgyz
    • Lao
    • Latin
    • Latvian
    • Lithuanian
    • Luxembourgish
    • Macedonian
    • Malagasy
    • Malay
    • Malayalam
    • Maltese
    • Maori
    • Marathi
    • Mongolian
    • Myanmar (Burmese)
    • Nepali
    • Norwegian
    • Pashto
    • Persian
    • Polish
    • Portuguese
    • Punjabi
    • Romanian
    • Russian
    • Samoan
    • Scots Gaelic
    • Serbian
    • Sesotho
    • Shona
    • Sindhi
    • Sinhala
    • Slovak
    • Slovenian
    • Somali
    • Spanish
    • Sudanese
    • Swahili
    • Swedish
    • Tajik
    • Tamil
    • Telugu
    • Thai
    • Turkish
    • Ukrainian
    • Urdu
    • Uzbek
    • Vietnamese
    • Welsh
    • Xhosa
    • Yiddish
    • Yoruba
    • Zulu
  • Teaching
  • Media
  • Read Online
  • መጽሐፍ ይግዙ
    • Princeton University Press
    • Amazon
    • Barnes and Noble
    • IndieBound
  • መግቢያ
  • 1 መግቢያ
    • 1.1 አንድ ቀለም ውስጥ ይወድቃል
    • 1.2 ወደ የዲጂታል ዘመን እንኳን በደህና መጡ
    • 1.3 ምርምር ንድፍ
    • 1.4 በዚህ መጽሐፍ ገጽታዎች
    • 1.5 . የዚህ መጽሐፍ ዝርዝር
    • ቀጥሎ ምን ማንበብ አለብህ
  • 2 መጠበቃችን ባህሪ
    • 2.1 መግቢያ
    • 2.2 ትልቅ ውሂብ
    • 2.3 ትላልቅ የውሂብ መረጃዎች አሥር የተለመዱ ባህሪያት
      • 2.3.1 ትልቅ
      • 2.3.2 ሁሌም ይሠራል
      • 2.3.3 ገባሪ ያልሆኑ
      • 2.3.4 ያልተሟላ
      • 2.3.5 የማይደረስ
      • 2.3.6 ተቃራኒ ያልሆነ
      • 2.3.7 ስበት
      • 2.3.8
      • 2.3.9 ቆሻሻ
      • 2.3.10 ጥንቃቄ
    • 2.4 ምርምር ስልቶች
      • 2.4.1 መቁጠር ነገሮች
      • 2.4.2 ትንበያ እና nowcasting
      • 2.4.3 Approximating ሙከራዎች
    • 2.5 ማጠቃለያ
    • የማቲማቲካል ማስታወሻዎች
    • ቀጥሎ ምን ማንበብ አለብህ
    • ተግባራት
  • 3 መጠየቅ ጥያቄዎች
    • 3.1 መግቢያ
    • 3.2 ከተቃራኒያን ጋር መገናኘት
    • 3.3 አጠቃላይ የዳሰሳ ጥናት ስህተት ማዕቀፍ
      • 3.3.1 ውክልና
      • 3.3.2 መለካት
      • 3.3.3 ወጪ
    • 3.4 ማን መጠየቅ
    • 3.5 ጥያቄዎች መጠየቅ አዲስ መንገዶች
      • 3.5.1 የማይበክል ጊዜያዊና ግምገማዎች
      • 3.5.2 Wiki የዳሰሳ ጥናቶች
      • 3.5.3 Gamification
    • 3.6 ትላልቅ የመረጃ ምንጮች ጋር የተያያዙ መጠይቆች
      • 3.6.1 በጥበብ መጠየቅ
      • 3.6.2 በማንሳት ጥያቄ
    • 3.7 ማጠቃለያ
    • የማቲማቲካል ማስታወሻዎች
    • ቀጥሎ ምን ማንበብ አለብህ
    • ተግባራት
  • 4 ሩጫ ሙከራዎች
    • 4.1 መግቢያ
    • 4.2 ሙከራዎች ምንድን ናቸው?
    • 4.3 ሙከራዎች ሁለት ገጽታዎች: ቤተ ሙከራ-መስክ እና አናሎግ-ዲጂታል
    • 4.4 ቀላል ሙከራዎች በላይ በመውሰድ ላይ
      • 4.4.1 ስለሚቆይበት
      • 4.4.2 የህክምና ውጤቶች መካከል የተለያያ
      • 4.4.3 መንገዶችን
    • 4.5 ይህ ሊሆን ማድረግ
      • 4.5.1 አካባቢዎችን ይጠቀሙ
      • 4.5.2 የራስዎን ሙከራ ይገንቡ
      • 4.5.3 የራስዎን ምርት ይገንቡ
      • 4.5.4 አጋርነት
    • 4.6 ምክር
      • 4.6.1 ዜሮ ተለዋዋጭ ወጪ ውሂብ ፍጠር
      • 4.6.2 ስነ- 4.6.2 ይገንቡ: መተካት, ማጽዳት እና መቀነስ
    • 4.7 ማጠቃለያ
    • የማቲማቲካል ማስታወሻዎች
    • ቀጥሎ ምን ማንበብ አለብህ
    • ተግባራት
  • 5 የጅምላ ትብብርን መፍጠር
    • 5.1 መግቢያ
    • 5.2 የሰው ስሌት
      • 5.2.1 ጋላክሲ Zoo
      • 5.2.2 የፖለቲካ manifestos መካከል ብዙ ሕዝብ-ኮድ
      • 5.2.3 ማጠቃለያ
    • 5.3 ክፈት ጥሪዎች
      • 5.3.1 Netflix ሽልማት
      • 5.3.2 Foldit
      • 5.3.3 የአቻ-ወደ-የፓተንት
      • 5.3.4 ማጠቃለያ
    • 5.4 የተሰራጩ የውሂብ ስብስብ
      • 5.4.1 eBird
      • 5.4.2 PhotoCity
      • 5.4.3 ማጠቃለያ
    • 5.5 የራስህን ዲዛይን ማድረግ
      • 5.5.1 እናነሳሳ ተሳታፊዎች
      • 5.5.2 የሚገፋፉ የተለያያ
      • 5.5.3 የትኩረት ትኩረት
      • 5.5.4 የሚገርመው አንቃ
      • 5.5.5 የስነምግባር ሁን
      • 5.5.6 የመጨረሻ ንድፍ ምክር
    • 5.6 ማጠቃለያ
    • ቀጥሎ ምን ማንበብ አለብህ
    • ተግባራት
  • 6 ስነ ምግባርና
    • 6.1 መግቢያ
    • 6.2 ሦስት ምሳሌዎች
      • 6.2.1 ስሜታዊ ወረርሽኝ
      • 6.2.2 መመገብ, ወዳጅነት, እና ጊዜ
      • 6.2.3 Encore
    • 6.3 ዲጂታል የተለየ ነው
    • 6.4 አራት መሠረታዊ ሥርዓቶች
      • 6.4.1 ጉዳተኞች አክብሮት
      • 6.4.2 Beneficence
      • 6.4.3 ፍትህ
      • 6.4.4 ህግ እና የህዝብ የወለድ አክብሮት
    • 6.5 ሁለት የስነምግባር ማዕቀፎችን
    • 6.6 ችግር መስኮች
      • 6.6.1 ስምምነት
      • 6.6.2 መረዳት እና ከመቆጣጠር የመረጃ አደጋ
      • 6.6.3 ግላዊነት
      • 6.6.4 አለመረጋጋት ፊት የፈጀ ውሳኔዎች
    • 6.7 ተግባራዊ ጠቃሚ ምክሮች
      • 6.7.1 የ IRB አንድ ወለል እንጂ ጣሪያ ነው
      • 6.7.2 ሁሉም ሰው በሌላ ጫማ ውስጥ ራስህን አስቀምጥ
      • 6.7.3 ተከታታይ, discrete ሳይሆን እንደ የምርምር ስነ ምግባር አስብ
    • 6.8 ማጠቃለያ
    • ታሪካዊ ትርፍ አንጀት
    • ቀጥሎ ምን ማንበብ አለብህ
    • ተግባራት
  • 7 የወደፊቱ
    • 7.1 በጉጉት እየተጠባበቁ ነው
    • 7.2 የወደፊቱ ገጽታዎች
      • 7.2.1 የንባብ ናሙናዎች ቅልቅል
      • 7.2.2 ተሳታፊ-ማእከል ያደረገ ውሂብ ክምችት
      • 7.2.3 ምርምር ንድፍ ​​ውስጥ የሥነምግባር
    • 7.3 በመጀመሪያ ተመለስ
  • ምስጋና
  • ማጣቀሻዎች
ይህ ትርጉም አንድ ኮምፒውተር የተፈጠረ ነበር. ×

ቀጥሎ ምን ማንበብ አለብህ

  • መግቢያ (ክፍል 2.1)

እዚህ ምዕራፍ ውስጥ ያልተካተተ አንድ ዓይነት አያያዝ ኢዝኖግራፊ ነው. ስለ Boellstorff et al. (2012) በዲጂታል ቦታዎች የበለጠ ለማወቅ Boellstorff et al. (2012) , እና ለተጨማሪ ዲዛይነሮች ዲጂታል እና አካላዊ ቦታዎች ላይ, Lane (2016) ይመልከቱ.

  • ትላልቅ መረጃዎች (ክፍል 2.2)

"ትልቅ ውሂብ" ላይ አንድም መግባባት ትርጉም የለም, ነገር ግን ብዙ ትርጓሜዎች በ "3 ቪክስ" ላይ የሚያተኩሩ ናቸው, ይኸውም መጠን, ልዩነት እና ፍጥነት (ለምሳሌ, Japec et al. (2015) ). De Mauro et al. (2015) ትርጓሜዎች ክለሳ.

በትልቅ መረጃ ምድብ ውስጥ የመንግስት አስተዳደራዊ መረጃን ማካተት ትንሽ ያልተለመደ ነው, ሌሎች ደግሞ ይህን Legewie (2015) , Connelly et al. (2016) , እና Einav and Levin (2014) . ስለ ምርምር የመንግስት የአስተዳደራዊ መረጃ ዋጋ ተጨማሪ መረጃ ለማግኘት Card et al. (2010) , Adminstrative Data Taskforce (2012) , እና Grusky, Smeeding, and Snipp (2015) .

በመንግሥት የስታቲስቲክስ ስርዓት ውስጥ የአስተዳደር ምርምር እይታ, በተለይም የአሜሪካ የህዝብ ቆጠራ ቢሮ, Jarmin and O'Hara (2016) . በስታቲስቲክስ ስዊድን ውስጥ አስተዳደራዊ ሬኮርዶች Wallgren and Wallgren (2007) ሪከርድ ለህፃናት ረጅም ጉዞ አያያዝን, Wallgren and Wallgren (2007) .

በምዕራፉ ውስጥ እንደ አጠቃላይ ማህበራዊ ጥናት (ማህበራዊ ጥናት) (GSS) እንደ ማህበራዊ የመገናኛ ዘዴዎች እንደ Twitter የመሳሰሉ የተለመዱ የዳሰሳ ጥናቶችን አነበብኩ. በተለምዷዊ መጠይቆች እና በማህበራዊ ሚዲያ መረጃ መካከል ጥልቅ እና ጥንቃቄን Schober et al. (2016) , Schober et al. (2016) .

  • ትላልቅ መረጃዎችን (የተለቀቀው 2.3)

እነዚህ 10 ትላልቅ መረጃዎች ባህርያት በተለያዩ የተለያዩ መንገዶች በተለያዩ የተለያዩ ፀሐፊዎች ተብራርተዋል. በነዚህ ጉዳዮች ላይ ተጽእኖ ያሳደረሁትን ፅሁፍ Lazer et al. (2009) Groves (2011) , Howison, Wiggins, and Crowston (2011) , boyd and Crawford (2012) , SJ Taylor (2013) Howison, Wiggins, and Crowston (2011) SJ Taylor (2013) , Mayer-Schönberger and Cukier (2013) Ruths and Pfeffer (2014) Mayer-Schönberger and Cukier (2013) Golder and Macy (2014) , Ruths and Pfeffer (2014) Golder and Macy (2014) , Ruths and Pfeffer (2014) , Tufekci (2014) , Sampson and Small (2015) , K. Lewis (2015b) , Lazer (2015) , Horton and Tambe (2015) , Japec et al. (2015) , እና Goldstone and Lupyan (2016) .

በዚህ ምዕራፍ ውስጥ, በአንጻራዊ ሁኔታ ገለልተኛ ነኝ ብዬ ያሰብኳቸው ዲጂታል ትራኮች የሚለውን ቃል ተጠቀምኩ. ሌላ ዲጂታል ቃል ለዲጂታል ትራኮች ዲጂታል ዱካዎች (Golder and Macy 2014) ግን በሄል አቤልሰን, ኬን ኤልዲን እና ሃሪ ሌውስ (2008) እንዳሉት ይበልጥ ተስማሚነት ያለው የዲጂታል የጣት አሻራዎች ናቸው . የእግር ዱካን በሚፈጥሩበት ጊዜ, ምን እየተከሰተ እንደሆነ እና የእግር ዱካዎ በአጠቃላይ ለእርስዎ በግልፅ ሊገኝ አይችልም. ለእርስዎ ዲጂታል ዱካዎች ተመሳሳይነት አይኖርም. በመሠረቱ, በጣም ብዙ ዕውቀት የሌለብዎት ሁሌም ትውስታዎችን እየፈቱ ነው. እና እነዚህ ምልክቶች በርስዎ ላይ ስም ባይኖራቸውም በአብዛኛው ወደርስዎ ሊገናኙ ይችላሉ. በሌላ አባባል, የጣት አሻራዎች ናቸው, የማይታይ እና በግል ማንነትን.

  • ትልቅ (ክፍል 2.3.1)

የበለጠ መረጃ ሰጪዎች የስታቲስቲክስ ሙከራዎች ለምን ችግር M. Lin, Lucas, and Shmueli (2013) ተጨማሪ መረጃ ለማግኘት, M. Lin, Lucas, and Shmueli (2013) እና McFarland and McFarland (2015) . እነዚህ ጉዳዮች ተመራማሪዎች ተመራማሪዎችን ከስታትስቲካዊ ጠቀሜታ ይልቅ በተግባር ጠቃሚነት ላይ እንዲያተኩሩ ሊያደርጋቸው ይገባል.

ሮክ ኬቲ እና ባልደረቦቹ የግብር መዝገቦችን እንዴት እንደሚያገኙ የበለጠ ለማወቅ Mervis (2014) ይመልከቱ.

ትላልቅ የውሂብ ስብስቦች በአጠቃላይ ከአንድ ኮምፒዩተር አቅም በላይ የሆኑ የሂሳብ ስራዎችን ሊፈጥሩ ይችላሉ. ስለዚህ ትልቅ የውሂብ ስብስቦች ላይ ስሌቶች በማድረግ ተመራማሪዎች ብዙ ጊዜ, በብዙ ኮምፒውተሮች ላይ አንዳንድ ትይዩ ፕሮግራም ተብሎ በሚጠራው ሂደት ሥራ ያነጥፉ ነበር. ትይዩው መርሃ ግብር ለማስተዋወቅ, በተለይም Hadoop ተብሎ የሚጠራ ቋንቋ, Vo and Silvia (2016) የሚለውን ይመልከቱ.

  • ሁልጊዜ (በክፍል 2.3.2)

ሁልጊዜ መረጃዎችን በሚመለከቱበት ጊዜ ትክክለኛውን ተመሳሳይ ሰዎች በጊዜ ሂደት እያወዳደሩ እንደሆነ ወይም አንዳንዱን የተለመዱ የሰዎች ስብስቦችን እያወዳደሩ እንደሆነ ግምት ውስጥ ማስገባት አስፈላጊ ነው. ምሳሌ Diaz et al. (2016) .

  • አልተቀዘቀዘም (ክፍል ¿ሰአት አይደገምም ? )

በተግባር ላይ ያልዋሉ እርምጃዎች ላይ አንድ ግልጽ መጽሐፍ, Webb et al. (1966) . በዚህ መጽሐፍ ውስጥ ያሉት ምሳሌዎች የዲጂታል ዘመንን ይከተላሉ, ነገር ግን አሁንም አሁንም አብረዋቸው ይታያሉ. በጅምላ ክትትል ምክንያት ሰዎችን ባህሪያቸውን ለመቀየር ምሳሌዎች ይመልከቱ, Penney (2016) እና Brayne (2014) .

ተካካይነት (Orne 1962; Zizzo 2010) ተመራማሪው የፍላጎት ውጤት (Orne 1962; Zizzo 2010) እና Hawthorne ውጤቶች (Adair 1984; Levitt and List 2011) (Orne 1962; Zizzo 2010) ጋር በጣም የተዛመደ ነው.

  • ያልተሟላ (ክፍል 2.3.4)

ለተመዘገበው ግንኙነት ተጨማሪ, Dunn (1946) , Fellegi and Sunter (1969) (ታሪካዊ) እና Larsen and Winkler (2014) (ዘመናዊ) ይመልከቱ. በተመሳሳይም በኮምፕዩተር ሳይንስ (Elmagarmid, Ipeirotis, and Verykios 2007) ስም ማመሳሰል, ብዜት ፈልጎ ማግኛ (Elmagarmid, Ipeirotis, and Verykios 2007) ማባዛት. ግላዊ ማንነትን የሚያመለክቱ መረጃዎችን በማስተላለፍ የማያስፈልግ ግንኙነትን ለመመዝገብ የግላዊነት-ጥበቃ ዘዴዎች (Schnell 2013) . ፌስቡክ መዝገባቸውንም የድምፅ አሰራር ባህሪን የሚያገናኙ ሂደትን አዘጋጅቷል, ይህ በምዕራፍ 4 ውስጥ የምነግርዎን አንድ ልምምድ ለመገምገም ነበር. (Bond et al. 2012; Jones et al. 2013) .

ተቀባይነት Shadish, Cook, and Campbell (2001) ተጨማሪ ለማግኘት Shadish, Cook, and Campbell (2001) ምዕራፍ 3 ን ተመልከቱ.

  • ተደራሽ ያልሆነ (ክፍል 2.3.5)

በ AOL የፍለጋ ምዝግብ ማስታወሻ ላይ ተጨማሪ መረጃ ለማግኘት Ohm (2010) ይመልከቱ. ሙከራዎች በምናብራራበት በምዕራፍ 4 ላይ ከድርጅቶች እና መንግስታት ጋር ስላለን ትብብር ምክር እሰጣለሁ. በርካታ ደራሲያን በበቂ ቁጥጥር ላይ የተመሰረተ መረጃን በተመለከተ Huberman (2012) ጥናቶች ያላቸውን ስጋት ገልፀዋል, Huberman (2012) , boyd and Crawford (2012) .

ዩኒቨርሲቲ ተመራማሪዎች ውሂብ መዳረሻ ማግኘት አንዱ ጥሩ መንገድ አንድ እሥረኛ ወይም ለቤት ተመራማሪ እንደ ኩባንያ ላይ መስራት ነው. የውሂብ መዳረሻ በማንቃት በተጨማሪ, ይህ ሂደት ደግሞ ተመራማሪ የውሂብ ትንታኔ አስፈላጊ ነው, ይህም የተፈጠረው እንዴት ይበልጥ ለማወቅ ይረዳናል.

የመንግስት መረጃን የማግኘት ሁኔታን በተመለከተ እ.ኤ.አ. Mervis (2014) ስለ ጂም ራትቲ እና ባልደረቦቹ በማህበራዊ ተንቀሳቃሽነት ጥናት ላይ ጥቅም ላይ የዋለውን የግብር መዝገቦች እንዴት ማግኘት እንደሚችሉ ያብራራል.

  • ተወካይ ያልሆኑ (ሰአት: ተወካይ ያልሆኑ)

ስለ "ውክልና" ታሪክ እንደ ጽንሰ ሐሳብ የበለጠ ለማወቅ, Kruskal and Mosteller (1979a) Kruskal and Mosteller (1979b) , Kruskal and Mosteller (1979b) Kruskal and Mosteller (1979c) , Kruskal and Mosteller (1979c) እና Kruskal and Mosteller (1979c) , እና Kruskal and Mosteller (1979c) Kruskal and Mosteller (1980) .

የበረዶ ሥራዬ ማጠቃለያዎች እና የዎትና ሒል ሥራ አጭር ነበሩ. Freedman (1991) ላይ በሚያኮራበት ሥራ ላይ ተጨማሪ መረጃ ለማግኘት Freedman (1991) ይመልከቱ. ለታላቁ የብሪታንቶች ዶክተሮች ተጨማሪ መረጃ Doll et al. (2004) እና Keating (2014) .

ብዙ ተመራማሪዎች ፑትና ኩል ከሴት ሃኪሞች እና ከ 35 አመት ጀምሮ ከዶክተሮች የተገኙ መረጃዎችን ቢሰበስቡም, በመጀመሪያ ይህንን መረጃ በመጀመሪያ ትንታኔያቸው አይጠቀሙም. "የሳንባ ካንሰር ከ 35 አመት በታች ለሆኑ ወንዶችና ወንዶች እምብዛም ስላልተራከመ በሚቀጥሉት ጥቂት አመታት በእነዚህ ጠቃሚ ቡድኖች ውስጥ ጠቃሚ መረጃዎች አይገኙም. በዚህ የመጀመሪያ ዘገባ ውስጥ ለ 35 አመት እና ከዚያ በላይ ለሆኑ ወንዶች ብቻ ትኩረት ሰጥተነዋል. " Rothman, Gallacher, and Hatch (2013) ," ለምን ተወካይ መሆን ያለብን ለምንድን ሊሆን እንደሚገባ " ሰጭነት ያለባትን ውሂብን ሆን ብሎ መፍጠርን.

በጠቅላላው ህዝብ ላይ ሃተታ ለማቅረብ ለሚፈልጉ ተመራማሪዎችና መንግስታት አገለግሎት መስጠት ወሳኝ ችግር ነው. ይሄ በተለምዶ በተጠቃሚዎቻቸው ላይ የሚያተኩሩት ለኩባንያዎች አሳሳቢ ነው. ስለ Buelens et al. (2014) ኔዘርላንድ የንግድ መረጃን Buelens et al. (2014) ጉዳይ ያለውን ጉዳይ በተመለከተ ተጨማሪ መረጃ ለማግኘት, Buelens et al. (2014) .

ተመራማሪዎች ምሳሌ ስለ ትላልቅ የመረጃ ምንጮች ውክልና Hargittai (2015) boyd and Crawford (2012) , K. Lewis (2015b) Hargittai (2015) K. Lewis (2015b) , እና Hargittai (2015) .

ለማህበራዊ ጥናቶች እና ኢፒዶሚዮሎጂ ምርምር ግኝቶች የበለጠ ዝርዝር ንፅፅር ለማግኘት, Keiding and Louis (2016) .

Jungherr (2013) በተለይም በ 2009 የጀርመን ምርጫ ላይ Jungherr (2013) ተጨማሪ መረጃ ለማግኘት, Jungherr (2013) እና Jungherr (2015) . Tumasjan et al. (2010) በዓለም ዙሪያ ያሉ ተመራማሪዎች የተለያዩ ዓይነት ምርጫዎችን ለመተንበይ የዊንዶው (የቲውተር) መረጃ ችሎታ ችሎታውን ለማሻሻል (ለምሳሌ በፓርቲዎች አወንታዊ እና አሉታዊ መግለጫዎች መካከል ያለውን ልዩነት (Gayo-Avello 2013; Jungherr 2015, chap. 7.) . Huberty (2015) ምርጫዎችን ለመገመት ሙከራዎች Huberty (2015) በዚህ መንገድ ነው-

"በማህበራዊ ሚዲያ ላይ የተመሰረቱ የታወቁ የቅድመ መላምት ዘዴዎች ትክክለኛውን የምርምር ትንታኔ ፍላጎቶች ሲያሟሉ አልተሳኩም. እነዚህ አለመሳካቶች በመሰረታዊ የመገናኛ ዘዴዎች ወይም በአልጎሪዝም ችግሮች ይልቅ በማህበራዊ ሚዲያዎች ባህሪያት የተሞሉ ናቸው. በአጭሩ ማህበራዊ ማህደረመረጃ የመራጮችን አወንታዊ, ያልተጠበቀና የተወካይ ምስል አይሰጥም, ምናልባትም በጭራሽ አይሆንም. እና እነዚህ ማህበራዊ ሚዲያዎች እነዚህን ችግሮች በተለመዱት ጊዜ ለማስተካከል በቂ መረጃ ስለሌላቸው.

በምዕራፍ 3 ውስጥ ናሙናዎችን እና ግምቶችን በበለጠ ጥልቀት እገልጻለሁ. ምንም እንኳን ውሂቡ ውክልና የሌለበት ቢሆንም, በአንዳንድ ሁኔታዎች, ጥሩ ግምታዊ ግምታዊ ግምት እንዲኖረው ክብደት ሊኖራቸው ይችላል.

  • መንኮራኩር (ክፍል ¿ሰከንድ: መንሸራተት? )

የስርዓት ትራንዚንግ ከውጭ ለመመልከት በጣም ከባድ ነው. ሆኖም ግን, የፊሎሜንስ ፕሮጀክት (በምእራፍ 4 ተብራርቷል) የተካሄደው በአካዳሚክ የምርምር ቡድን ውስጥ ከ 15 ዓመታት በላይ ነው. ስለሆነም ስርዓቱ በጊዜ ሂደት መሻሻልን ስለሚፈጥርበት ዘዴ እና እንዴት መተንተን እንደሚችል (Harper and Konstan 2015) መረጃዎችን ማካተት ችለዋል.

በርካታ ምሁራን በ Twitter ላይ ልንዋጋው ላይ ትኩረት አድርገዋል: Liu, Kliman-Silver, and Mislove (2014) እና Tufekci (2014) .

የህዝብ ብዛት መጨመር አንዱ አቀራረብ ተመራማሪዎች በጊዜ ሂደት ተመሳሳዩን ሰዎች እንዲያጠኑ የሚያስችላቸውን ተጠቃሚዎችን መፍጠር ነው, Diaz et al. (2016) .

  • አልጎሪምታሜም ግራ መጋባት (ክፍል ¿ሰከንድ ገርቷል -በግዛዊ ግራ መጋባት? )

በመጀመሪያ በጆን ክላይንበርግ (ጆን ክላይንበርግ) የተጠቀመውን "በአልጎሪዝም ግራ መጋባት" የሚለውን ቃል ሰማሁ, ግን በሚያሳዝን ሁኔታ ንግግሩ መቼ እና የት እንደሰጠ አላስታውስም. ቃሉ ለመጀመሪያ ጊዜ የተተወው በ Anderson et al. (2015) , ቀጠሮ ቦታዎችን የሚጠቀሙባቸው ስልተ ቀመሮች እንዴት እንደሚጠቀሙ የተሻሉ ውይይቶች የእነዚህን ድረገጾች መረጃዎችን ማህበራዊ ምርጫዎች ለማጥናት ያላቸውን ችሎታ ውስብስብ ያደርጋቸዋል. ይህ አሳሳቢነት የተነሳው K. Lewis (2015a) Anderson et al. (2014) .

ከፌስቡክ በተጨማሪ, ሶስት ሰዎች በሶስትዮሽነት መዘጋትን በተጠቃሚዎች መሰረት እንዲከተሉ ይመክራል. Su, Sharma, and Goel (2016) . ስለዚህ በቲውተር ውስጥ ሦስት የሶዲዬድ መዘጋት በሶስትዮሽነት መዘጋት እና በአንዳንድ የአልጅሪዝም አዝማድ ሶስት አመላካች መጨመር የመፈለግ አዝማሚያ ነው.

በተግባራዊነት በተለይም አንዳንድ የማህበራዊ ሳይንስ ጽንሰ-ሐሳቦች "ሞተሮች ያልሆኑ ካሜራዎች" ናቸው (ማለትም, ስለ ዓለም ከመተርጎም ይልቅ ቅርፅን ይሰራሉ) -ማሼ Mackenzie (2008) .

  • ቆሻሻ (ክፍል 2.3.9)

የመንግስት ስታትስቲክስ ድርጅቶች የንፅፅር ስታቲስቲክስ መረጃን ማስተካከያ ይደረጋሉ . De Waal, Puts, and Daas (2014) ለዳሰሳ ጥናት የተዘጋጁ የስታትስቲክስ መረጃ ማስተካከያ ቴክኒኮችን ይጠቀማሉ እና ለትልቅ የውሂብ ምንጮች Puts, Daas, and Waal (2015) ደረጃ ይመረምራል Puts, Daas, and Waal (2015) ለአብዛኞቹ ተመሳሳይ ሀሳቦች ያቀርባሉ. ሰፋ ያለ አጠቃላይ ታዳሚዎች.

ስለ ማኅበራዊ ቦቶች አጠቃላይ እይታ, Ferrara et al. (2016) . ለአንዳንድ ምሳሌዎች በትዊተር ውስጥ አይፈለጌ መልዕክት ማግኘትን ላይ ያተኩራሉ, Clark et al. (2016) እና Chu et al. (2012) . በመጨረሻም Subrahmanian et al. (2016) ድህረ-ገፅ (ቦርዶች) በቲዊተር ላይ ለመከታተል የሚረዱ ዘዴዎችን ለማነፃፀር የተቀላቀለ የ DARPA Twitter Bot Challenge ውጤቶችን ያብራሩ.

  • ሚስጥራዊነት (ክፍል 2.3.10)

Ohm (2015) ቀደም ሲል ጥንቃቄ የተሞላበት መረጃን በተመለከተ ጥናቶች ላይ ጥናት ያካሂዳል እና በርካታ-ልኬት ፈተናን ያቀርባል. እሱ የሚያቀርባቸው አራት ዋና ዋና ምክንያቶች አደጋ, የተጠያቂነት ዕድል, ምሥጢራዊ ግንኙነት መኖሩ, እና አደጋው ታላላቅ ፍላጎቶችን የሚያንፀባርቅ መሆኑን ነው.

  • ነገሮችን መቁጠር (ክፍል 2.4.1)

ፋርበር በኒው ዮርክ ታክሲዎች ላይ ያካሄደው ጥናት የተካሄደው ቀደም ሲል Camerer et al. (1997) የሶስት የወረቀት ቅዝቃዜ ናሙናዎችን ይጠቀማል. ይህ ቀደምት ጥናት አሽከርካሪዎች ሊደረስባቸው የሚፈልጓቸው መስለው የሚታዩ ይመስላሉ: ደመወዛቸው ከፍ ባለባቸው ቀናት ላይ ይሠሩ ነበር.

በቀጣይ ሥራ, ንጉሥ እና ባልደረቦች በቻይና (King, Pan, and Roberts 2014, [@king_how_2016] ) ላይ በመስመር ላይ ሳንሱር (King, Pan, and Roberts 2014, [@king_how_2016] ) . በቻይና ውስጥ የመስመር ላይ ሳንሱር ለመለካት በተዛመደ አቀራረብ, Bamman, O'Connor, and Smith (2012) . King, Pan, and Roberts (2013) ለ 11 ሚሊዮን ልኡክ ጽሁፎች ያላቸውን ስሜት ለመገመት በስታቲስቲክስ ዘዴዎች የበለጠ መረጃ ለማግኘት Hopkins and King (2010) . በበቂ ቁጥጥር ላይ የተመሰረተ ትምህርት ለማግኘት, James et al. (2013) (ዝቅተኛ ቴክኒካዊ) እና Hastie, Tibshirani, and Friedman (2009) (ተጨማሪ ቴክኒካዊ).

  • ትንበያ እና አሁን እያደጉ (ክፍል 2.4.2)

ትንበያ የኢንዱስትሪ መረጃ ሳይንስ አካል ነው (Mayer-Schönberger and Cukier 2013; Provost and Fawcett 2013) . በአብዛኛው በማህበራዊ ምርምር አማካይነት የሚሰራ አንድ ዓይነት ትንበያ የሰዎች ትንታኔ ነው. ለምሳሌ Raftery et al. (2012) .

የኢንፍሉዌንዛ ተጋላጭነት ለማዳበር የፍለጋ ውሂብን የሚጠቀም የመጀመሪያው የ Google የጉንፋን አዝማሚያ አልነበረም. በእርግጥ በዩናይትድ ስቴትስ የሚገኙ ተመራማሪዎች (Polgreen et al. 2008; Ginsberg et al. 2009) (Hulth, Rydevik, and Linde 2009) እና በ (Polgreen et al. 2008; Ginsberg et al. 2009) እና በስዊድን (Hulth, Rydevik, and Linde 2009) የተወሰኑ የፍለጋ ቃላቶች (ለምሳሌ "ፍሉ") የአገሪቱ የህዝብ ጤና ጥበቃ ክትትል መረጃው ከመታቀቁ በፊት. ከጊዜ በኋላ ብዙ ሌሎች ፕሮጀክቶች ለክትትል ክትትል ለይቶ ማወቅን ለመከታተል ሞክረዋል. Althouse et al. (2015) ለግምገማ.

የጤና ውጤቶችን ለመገመት ዲጂታል የመከታተያ መረጃን ከመጠቀም በተጨማሪም አሰራርን ለመተንበይ የ Twitter ውሂብ በመጠቀም ከፍተኛ መጠን ያለው ሥራ አለው; ለግምገማዎች Gayo-Avello (2011) , Gayo-Avello (2013) , Jungherr (2015) (ምዕራፍ 7), እና Huberty (2015) . እንደ ጠቅላላ የሀገር ውስጥ ምርት (ጠቅላላ) የኢኮኖሚ መለኪያዎችን ማሳተፍ በመካከለኛው ማዕከላዊ ቦታዎች ላይ የተለመደ ነው, Bańbura et al. (2013) . ሠንጠረዥ 2.8 በዓለም ላይ አንድ አይነት ክስተትን ለመገመት አንድ ዓይነት ዲጂታዊ ዕይታ የሚጠቀሙ የጥናት ውጤቶችን ያቀርባል.

ሠንጠረዥ 2.8-አንድ ትልቅ መረጃን የሚጠቀሙ ጥናቶች / ክንውኖች
ዲጂታል ትራክ ውጤት ዋቢ
ትዊተር አሜሪካ ውስጥ ያሉ ፊልሞች ገቢ ሳጥን Asur and Huberman (2010)
የፍለጋ ምዝግብ ማስታወሻዎች በዩኤስ ውስጥ ፊልሞች, ሙዚቃ, መጽሐፍት እና የቪዲዮ ጨዋታዎች ሽያጭ Goel et al. (2010)
ትዊተር የ Dow Jones ኢንዱስትሪ አማካይ (የአሜሪካ የገንዘብ ገበያ) Bollen, Mao, and Zeng (2011)
ማህበራዊ ሚዲያ እና የፍለጋ ምዝግብ ማስታወሻዎች በዩናይትድ ስቴትስ, በዩናይትድ ኪንግደም, በካናዳ እና በቻይና ያሉ የኢንቨስትመንት ምልከታዎች እና የአክሲዮን ገበያዎች ጥናቶች Mao et al. (2015)
የፍለጋ ምዝግብ ማስታወሻዎች በዴንጊን እና ባንኮክ ውስጥ የዴንጊ ትኩሳት ቁጥር እየጨመረ ነው Althouse, Ng, and Cummings (2011)

በመጨረሻም, ጆን ክላይንበርግ እና ባልደረቦች (2015) ትንበያ ችግሮች በሁለት እና በተዘዋዋሪ የተለያዩ ምድቦች እንደሚሰሩ እና ማህበራዊ ሳይንቲስቶች አንዱን ላይ በማተኮር እና የሌላውን ችላ እንደሚሉ አመልክተዋል. አንድ የፖሊሲ ሰሪ ነጋዴ, ድርቅ እያጋጠማት ያለችውን አናን እጠራታለሁ, እናም አንድ ዝማሬ ዝናብ የመከሰት እድልን ለማሳደግ ዝናቡን ለመዝናናት መወሰን አለብኝ. ሌላ የፖሊሲ አውጭ ሠራተኛ, ቤቲን እደውላለሁ, ወደ ቤት ለመመለስ ጃንጥላ ለመያዝ ጃንጥላ ለመውሰድ መወሰን አለበት. አና እና ቤቲ የአየር ሁኔታን ከተረዱ የተሻለ ውሳኔ ሊወስኑ ይችላሉ ነገር ግን የተለያዩ ነገሮችን ማወቅ ያስፈልጋቸዋል. አና የዝናብ ዳንስ ዝናብ መሆኑን ወይም አለመግባባት መገንዘብ ያስፈልገዋል. በሌላ በኩል ግን ቤቲ ስለ ጉዳዩ ምንም ነገር ማወቅ አያስፈልገውም; ትክክለኛ ትንበያን ብቻ ይፈልጋል. ማህበራዊ ተመራማሪዎች በአብዛኛው ትኩረት የሚያደርገው አና ውስጥ ያጋጠሟትን ችግሮች ነው - ክላይንበርግ እና ባልደረቦቹ "ዝናብ ተመሳሳይ" የፖሊሲያዊ ችግሮች - ምክንያቱም ምክንያታዊ ጥያቄዎችን ያካትታል. ቤቲ-ካምቤርበርግ እና ባልደረቦቻቸው እንደ "ዣንጥላ" የፖሊሲያዊ ችግሮች ያሉባቸው መሰል ጥያቄዎችም ተመሳሳይ ናቸው, ሆኖም ግን ከማህበራዊ ተመራማሪዎቹ ያነሰ ትኩረት አልተሰጣቸውም.

  • ሙከራዎችን ማደመጥ (ክፍል 2.4.3)

PS ፖለቲካዊ ሳይንስ ( መጽሔት) መጽሔት ትልቅ መረጃን, የድንገቴ ፍቺን እና መደበኛ ጽንሰ-ሃሳቦችን ያካተተ ሲምፖዚየም አለው, እና Clark and Golder (2015) እያንዳንዱን አስተዋፅኦ ጠቅለል አድርጎ ያቀርባል. የዩናይትድ ስቴትስ የአሜሪካ ብሔራዊ የሳይንስ አካዳሚዎች Proceedings of the National Journal of causal inference እና ትልቅ መረጃ Shiffrin (2016) እያንዳንዱን መዋጮ ጠቅለል አድርጎ አቅርቧል. በትልቅ የውሂብ ምንጮች ውስጥ ተፈጥሮአዊ ሙከራዎችን በራስ-ሰር ለማግኘት የሚሞክሩ የማሽን መማሪያ ዘዴዎች, Jensen et al. (2008) , Sharma, Hofman, and Watts (2015) እና Sharma, Hofman, and Watts (2016) .

በተፈጥሯዊ ሙከራዎች, Dunning (2012) በበርካታ ምሳሌዎች የመግቢያና የመፅሀፍ ረጅም ሕክምና ያቀርባል. ተፈጥሯዊ ሙከራዎችን በተመለከተ ተጠራጣቂ እይታ ለማግኘት Rosenzweig and Wolpin (2000) (ኢኮኖሚክስ) ወይም Sekhon and Titiunik (2012) (ፖለቲካዊ ሳይንስን) ይመልከቱ. Deaton (2010) እና Heckman and Urzúa (2010) በተፈጥሯዊ ሙከራዎች ላይ ማተኮር ተመራማሪዎቹ አስፈላጊ ዋና ጉዳትን በመገመት ላይ ማተኮር እንዳለባቸው ይከራከራሉ. Imbens (2010) እነዚህ ክርክሮች ስለዚህ የተፈጥሮ ሙከራዎች ዋጋዎች በበለጠ ተስፋ ሰጪ አስተያየት Imbens (2010) .

አንድ ተመራማሪ በአገልግሎቱ ላይ ወደ ተፃፈው ተፅዕኖ ተጽፈው መወሰድ እንደሚቻሉ በሚገልጹበት ጊዜ, በመሳሪያ የተለዋዋትን ተለዋዋጭ ስልት እያብራራሁ ነበር . Imbens and Rubin (2015) , በምዕራፍ 23 እና 24 ውስጥ, መግቢያ ያቅርቡ እና ረቂቅ ሎተሪን እንደ ምሳሌ ይጠቀማሉ. በወታደራዊ አገልግሎት ሰጪዎች ላይ ወጤት የሚያስከትለው ተጨባጭ ተጨባጭ ምክንያታዊ አማካይ ውጤት (CAcE) እና አንዳንዴ የአካባቢያዊ አማካይ የሕክምና ውጤት (LATE) ተብሎ ይጠራል. በፖለቲካ ሳይንስ, በኢኮኖሚክስ እና በሶሺዮሎጂ, በፖለቲካ ሳይንስ, በኢኮኖሚና ስነ-ስነ-ህይወት ውስጥ Sovey and Green (2011) ተለዋዋጭ ተለዋዋጭ ተለዋዋጭዎችን ግምገማዎች ያቀርባል, Sovey and Green (2011) , Angrist and Krueger (2001) , እና Bollen (2012) በመሣሪያዊ ተለዋዋጭ በመጠቀም ጥናት መመርመር.

በ 1970 የተደነገገው የሎተሪ ዕጣ ሳይሆን, በአግባቡ ተመርምረው ነበር. ከንጹህ ድንገተኛ (Fienberg 1971) ትንሽ ልዩነቶች ነበሩ. Berinsky and Chatfield (2015) ይህ ትንሽ Berinsky and Chatfield (2015) እንዳለበት ይከራከራል.

ከተዛመደው አንጻር, Stuart (2010) Sekhon (2009) ግምታዊ አስተያየት, እና Sekhon (2009) ን ለአተከለናዊ ግምገማን ይመልከቱ. ለተጨማሪ እንደ አንድ የመግረዝ አይነት ለማዛመድ, Ho et al. (2007) . ለእያንዳንዱ ሰው አንድ ትክክለኛውን ግጥሚያ ማግኘት ብዙውን ጊዜ አስቸጋሪ ነው, ይህ ደግሞ በርካታ ውስብስብ ነገሮችን ያስተዋውቃል. አንደኛ, ትክክለኛ ማጣቀሻዎች በማይገኙበት ጊዜ ተመራማሪዎች በሁለት አንዶች መካከል ያለውን ርቀት እንዴት እንደሚለኩ እና አንድ የተወሰነ ርቀት በጣም በሚጠጋበት ጊዜ እንዴት እንደሚለካ መወሰን ያስፈልጋል. ሁለተኛው ውስብስብነት የሚጀምረው ተመራማሪዎች እጅግ በጣም ትክክለኛ የሆኑ ግተቶችን ወደ መድረሻው ውስጥ ለእያንዳንዱ ጉዳይ በእያንዳንዱ ጉዳይ ላይ በርካታ ክሶችን መጠቀም ቢፈልጉ ነው. ሁለቱም ጉዳዮች, እና ሌሎች, በምዕራፍ 18 ላይ Imbens and Rubin (2015) ውስጥ በዝርዝር ተገልጸዋል. በተጨማሪም ክፍል II ን ( ??? ) .

የማመሳሰል ዘዴዎች ከተራቀቁ ቁጥጥር የተደረገባቸው ሙከራዎች ጋር ተመሳሳይነት ያላቸውን መመዘኛዎች ማድረግ የሚችሉበትን ምሳሌ Dehejia and Wahba (1999) ይመልከቱ. ሆኖም ግን, ተዛማጅ ዘዴዎች አንድ የሙከራ ደረጃን ለመትከል ያልተሳካላቸው ምሳሌዎችን ለማግኘት Arceneaux, Gerber, and Green (2006) እና Arceneaux, Gerber, and Green (2010) ን ይመልከቱ.

Rosenbaum (2015) እና Hernán and Robins (2016) በትልልቅ የውሂብ ምንጮች ውስጥ ጠቃሚ ንፅፅር ለማግኘት የሚረዳ ሌላ ምክር አቅርበዋል.

Powered by Open Review Toolkit

Buy The Book

Image of Bit by Bit cover Princeton University Press Amazon Barnes and Noble IndieBound