2.4.1 መቁጠር ነገሮች

መልካም ውሂብ ጋር ጥሩ ጥያቄ ያዋህዳል ከሆነ ቀላል ቆጠራ አስደሳች ሊሆን ይችላል.

ምንም እንኳን በጣም የተራቀቀ በሚመስሉ ቋንቋዎች የተቀመጠ ቢሆንም, ብዙ ማህበራዊ ጥናቶች እንዲሁ በትክክል መቁጠር ማለት ነው. በትልልቅ መረጃዎች ዘመን ተመራማሪዎች ከመቼውም ጊዜ የበለጠ ሊቆጠሩ ይችላሉ, ግን ያኔ የጅራጮችን ቁጥር መቁጠር መጀመር አለበት ማለት አይደለም. ከዚህ ይልቅ ተመራማሪዎች የሚከተሉትን ሊጠይቁ ይገባል: - ምን ነገሮች መቁጠር አለባቸው? ይህ ሙሉ በሙሉ ሊታወቅ ይችላል, ነገር ግን አንዳንድ የአጠቃላይ ቅጦች አሉ.

ብዙውን ጊዜ ተማሪዎች የእራሳቸውን የጥናት ውጤት ያበረታታቸዋል-ማንም ሰው ማንም ከዚህ በፊት ተቆጥረው የማያውቅትን ነገር እቆጥረዋለሁ. ለምሳሌ, አንድ ተማሪ ብዙ ስደተኞች ሲያጠኑ እና ብዙ ሰዎች መንትያዎችን ሲያጠኑ ቢኖሩም ግን ማንም ሰው ስደተኛ የሆኑትን መንተሮች ያጠናል ማለት ይችላል. በእኔ ልምድ በድርጊቱ የተነሳ ተነሳሽነት ያቀረብኩት ይህ ስልት በአብዛኛው በጥሩ ምርምር አይመራም. በመውደቁ የተነሳ የሚነሳሳ ነገር ማለት እዚያው ጉድፍ አለ ማለት ነው, ለመሙላት በጣም ጠንክሬ እሰራለሁ. ነገር ግን እያንዳንዱ ጉድጓድ መሞላት የለበትም.

ይልቅ መቅረት በ ለተግባር ምክንያት, እኔ የተሻለ ስትራቴጂ አስፈላጊ ወይም ሳቢ (ወይም በሐሳብ ሁለቱም) ናቸው ምርምር ጥያቄዎች መፈለግ ነው ይመስለኛል. ሁለቱም እነዚህ ቃላት ለመግለጽ ትንሽ ውስብስብ ናቸው, ነገር ግን አስፈላጊ ምርምርን ለማሰብ ከሚያስችሉ መንገዶች አንዱ በመምሪያ ፖሊሲ ሰጭዎች ወሳኝ ውሳኔ ላይ ሊለካ የሚችል ተጽዕኖ ወይም ምግብ ያለው መሆኑ ነው. ለምሳሌ, የስራ አጥነት ምጣኔ መለኪያን መወሰን የፖሊሲ ውሳኔዎችን የሚያንቀሳቅሰው ኢኮኖሚው አመላካች ስለሆነ ነው. በአጠቃላይ, ተመራማሪዎች በጣም አስፈላጊ ስለሆኑ በጣም ጥሩ ስሜት አላቸው. ስለዚህ, በዚህ ክፍል የቀረበው, መቁጠር የሚደንቅ ሆኖ ሳለ እኔ ሁለት ምሳሌዎችን እጠባለሁ. በእያንዳንዱ ሁኔታ ተመራማሪዎቹ ድንገት አይቆጥሩትም. ይልቁንም, እነሱ ማኅበራዊ ስርዓቶች እንዴት እንደሚሰሩ አጠቃላይ ወሳኝ ሀሳቦችን የሚያመለክቱ በጣም በተለዩ መቼቶች ውስጥ ይቆጥሩ ነበር. በሌላ አነጋገር, እነዚህን የተሞሉ አሰራሮች (ስሌቶች) ትኩረት የሚስቡ በርካታ ነገሮች አይደሉም, ይህም ከተመሳሳይ ሀሳቦች የሚመጣ ነው.

የኒው ዮርክ ሲቲ ታክሲ ነጂዎችን ባህሪ ከ Henry Henry Ferrero (2015) ጥናት ያመጣል. ምንም እንኳ ይህ ቡድን በተፈጥሯዊ ስሜት ላይ የተመሠረተ ባይሆንም, በሁለት የስራ-ግኝቶች ውስጥ ሁለት ተፎካካሪዮ ንድፈቶችን ለመሞከር የሚያስችል ስልታዊ የጥናት ቦታ ነው. ለፋርበር ጥናቶች ዓላማ ስለ ታክሲ ሾፌሮች የሥራ ሁኔታ ሁለት አስፈላጊ ባህሪያት አሉ (1) እንደ የሰሜኑ የአየር ሁኔታ የመሳሰሉትን በከፊል ያገናዘበ የሥራ ድርሻቸው በየቀኑ እየቀነሰ እና (2) ስራዎች በየቀኑ ውሳኔዎቻቸው መሰረት ሊለዋወጡ ይችላሉ. እነዚህ ባህሪያት በሰዓቱ ደመወዝ እና በሰዓታት መካከል ስላለው ግንኙነት ወደ አንድ አስደሳች ጥያቄ ይመራሉ. በኢኮኖሚክስ ኒኮላሲካል ሞዴሎች እንደ ታክሲ አሽከርካሪዎች ከፍተኛ የሰዓት ደመወዝ በሚከፈላቸው ቀናት የበለጠ እንደሚሠሩ ይገምታሉ. በአማራጭ, የባህርይ ኢኮኖሚክስ ሞዴሎች በትክክል ተቃራኒውን ይተነብያሉ. ሾፌሮች አንድ የተወሰነ ገቢን ዒላማ ካሳዩ በቀን $ 100 በማለት ይናገሩ እና ዒላማው እስኪያልቅ ድረስ ይሠራል, አሽከርካሪዎች የበለጠ በከፍተኛ ዋጋ እየጨመሩ ባሉበት የስራ ቀናት ጊዜ ውስጥ መሥራት ይጀምራሉ. ለምሳሌ, የሽያጭ ገቢ ካደረክ በጥሩ ቀን ውስጥ (በአመት 25 ዶላር) እና በአከፋ ቀን (በአመት 20 ዶላር) ውስጥ ለአራት ሰዓታት መሥራት ትችል ይሆናል. ስለዚህ, ነጅዎች በከፍተኛ ሰዓታዊ የደመወዝ ክፍያ (በኒኮልሻል ሞዴሎች እንደሚተነበበው) በአብዛኛው የሰዓታት ደመወዝ ይሠራሉ ወይም በቀኑ ውስጥ በሰዓት ውስጥ ብዙ ሰአቶች (በባህሪ ኢኮኖሚያዊ ሞዴሎች እንደሚተነብዩ)?

ለዚህ ጥያቄ መልስ ለማግኘት ፋበር በየዓመቱ በአደባባይ የሚገኙት በኒው ዮርክ ከተማ ካቢቦች በተወሰዱ በሁሉም የታክሲ ጉዞዎች ላይ መረጃዎች አግኝቷል. ከተማው ታክሲዎችን እንዲጠቀም በሚጠይቁ ኤሌክትሮ ሜኮች የሚሰበሰቡት እነዚህ መረጃዎች ስለ እያንዳንዱ ጉዞ መረጃን ያካትታሉ: የመነሻ ሰዓት, ​​ቦታን ይጀምሩ, የመጨረሻ ጊዜ, የመጨረሻ ቦታ, ዋጋ እና ጫፍ (ጠቃሚ ምክሩ በክሬዲት ካርድ ተከፍሎ ከሆነ) . ይህን የታክሲ ሜትር ዉሂብ በመጠቀም, አብዛኞቹ ነጂዎች ከቀድሞው የኔኮላክ ንድፈ ሐሳብ ጋር የተጣጣመ ደመወዝ ከፍ እያለ በሚመጣባቸው ቀናት ላይ ብዙ ስራዎች ይሰራሉ.

ከዚህ ዋነኛ ግኝት በተጨማሪ, ፋርበር ስለ ውስጣዊ አመጣጥ እና ተለዋዋጭነት የተሻለ ግንዛቤ እንዲኖረው ተደርጓል. ከጊዜ በኋላ, አዳዲስ ነጂዎች ቀስ በቀስ ተጨማሪ የስራ ሰዓታት መሥራት እንደሚችሉ ተገንዝቧል (ለምሳሌ, እንደ ኒዶክሲያ ሞዴል ትንበያ ነው). እንደ ታሳቢ ከሚያገኙት ገቢ ያላቸው አሽከርካሪዎች የበለጠ አዲስ አሽከርካሪዎች ታክሲ ነጂዎች ማቆም ይነሳሉ. የተደረጉት የሁለተኛውን ሾፌሮች ባህሪን ለማብራራት ሁለቱም ጥልቅ የሆኑ ግኝቶች ሊኖሩ የቻሉት በውሂብ ስብስቡ መጠን ምክንያት ነው. በአጭር ጊዜ ውስጥ በአነስተኛ ታክሲዎች ሾፌሮች ላይ የወረቀት ወረቀቶችን የወሰዱ ቀደምት ጥናቶችን (Camerer et al. 1997) ተችሏል (Camerer et al. 1997) .

የፋርበር ጥናቱ ትልቅ የመረጃ ምንጭ በመጠቀም ለምርምር የምርምር ፕሮጀክት በጣም የቀረበ ነበር. ምክንያቱም በከተማው የተሰበሰበው መረጃ ፎርበር ከተሰበሰበ መረጃ ጋር ቅርበት ያለው ነው (አንዱ ልዩነት ፎርበር አጠቃላይ መረጃን የደመወዝ-ክፍያ ክፍያዎች እና ጠቃሚ ምክሮችን-ሆኖም ግን የከተማ መረጃው በክሬዲት ካርድ የተከፈለባቸው ጠቃሚ ምክሮችን ብቻ ይጨምራል). ይሁን እንጂ መረጃው ብቻውን በቂ አልነበረም. ለፋርበር ምርምር ዋናው ነገር ለየትኛው ጥያቄ ወደ ውሂቡ ማምጣት ነበር, ይህም ከዚሁ የተለየ ትርጉም በላይ የሆነ ትልቅ ጠቀሜታ ያለው ጥያቄ ነው.

ቁጥሮችን መቁጠር የሚቻልበት ሁለተኛው ምሳሌ Gary King, Jennifer Pan እና Molly Roberts (2013) በቻይና መንግስታት ሳንሱር ማስተርጎም ላይ ያተኮረ ጥናት ነው. ይሁን እንጂ በዚህ ሁኔታ ተመራማሪዎች የራሳቸውን ትልቅ መረጃ መሰብሰብ ነበረባቸው እና ያሰሟቸው መረጃዎች ያልተሟሉ መሆናቸውን መቀበል ነበረባቸው.

ንጉሥና ባልደረቦቹ በቻይና ውስጥ ማህበራዊ ሚዲያዎች በአሥር ሺዎች የሚቆጠሩ ሰዎችን የሚያካትት በሚያስደንቅ አንድ ግዛት ውስጥ ባለው ሳንሱር ሳንሱር ተጠይቀው ነበር. ተመራማሪዎችና ዜጎች ግን ምን ዓይነት ይዘቶች እንደሚሰረዙ የሚወስኑት እነዚህ ሳንሱር ምን እንደሚመስሉ ያላቸው ስሜት አነስተኛ ነው. የቻይና ምሁራን በርግጥ የትኞቹ አይነት ልጥፎች ሊሰረዙ እንደሚችሉ የሚጠበቁ ነገሮች አሉ. አንዳንዶች ሳንሱር በክልሎች ላይ ለሚነሱ ልጥፎች ላይ ያተኩራሉ, ሌሎቹ ግን እንደ የተቃውሞ ሰልፎች ያሉ የጋራ ባህሪን በሚያበረታቱ ልጥፎች ላይ እንደሚያተኩሩ ያስባሉ. ከእነዚህ ትንበያዎች ውስጥ የትኛው ነው በትክክል መገንዘብ ተመራማሪዎች የቻይና እና ሌሎች ፈላጭ ቆራጭ መንግስታትን ሳንሱር ለሚያደርጉት ዕውቀት እንዴት እንደሚረዱት ላይ ያመጣል. ስለዚህ, ንጉሱ እና ባልደረቦቹ በታተሙ እና ፈጽሞ በማይሰረዙ ልኡክ ጽሁፎች የታተሙ እና በመጨረሻ ተሰርዘዋል.

እነዚህን ልጥፎች በመሰብሰብ ላይ የተለየ ገጽ ተገቢ ልጥፎችን አቀማመጦች-እያገኘ; ከዚያም በኋላ ላይ ተሰርዟል የነበሩ ለማየት እነዚህን ልጥፎች በማቋቋምና ጋር ከ 1,000 የቻይና የማህበራዊ ሚዲያ ድረ-እያንዳንዱ የሚድሁ አስደናቂ የምሕንድስና ይጨምራል. መጠነ ሰፊ ድር-አሰሳ ጋር የተያያዘ መደበኛ የምሕንድስና ችግሮች በተጨማሪ, ይህ ፕሮጀክት ብዙ ሳንሱር ልጥፎች ከ 24 ሰዓት ባነሰ ውስጥ የሚወርድ ነው; ምክንያቱም ይህ በከፍተኛ ፍጥነት የግድ አስፈላጊ መሆኑን ያለውን አክለዋል ፈታኝ ነበር. በሌላ አነጋገር, ዘገምተኛ ዳሂ ሳንሱር ይደረጉ ነበር ልጥፎች ብዙ መቅረት ነበር. በተጨማሪም ጎቢኚዎች የማህበራዊ ሚዲያ ድር ጥናት ምላሽ ፖሊሲያቸውን ሊቀይሩ አለበለዚያ መዳረሻ ለማገድ ወይም እንዳይሆን ማወቅን ላለመወጣት ጊዜ ሁሉ ይህን ውሂብ ስብስብ ማድረግ ነበረብኝ.

ይህ ግዙፍ የኢንጂነሪንግ ሥራ በተጠናቀቀበት ጊዜ ንጉስ እና ባልደረቦቻቸው በ 85 የተለያዩ የተለዩ ርዕሰ ጉዳዮች ዙሪያ 11 ሚሊዮን ልኡክ ጽሑፎችን አግኝተዋል. ለምሳሌ ያህል, ከፍተኛ የስሜት ሕዋስ ርእስ ኦቢ ዌይ, ተቃዋሚ አርቲስት ነው. መካከለኛ የስሜት ገላጭ ጉዳይ የቻይና ምንዛሪ ዋጋ እና ውድቀት እና የአለም ዋንጫ ዝቅተኛነት ነው. ከነዚህ 11 ሚሊዮን ልኡክ ጽሁፎች ውስጥ ወደ 2 ሚሊዮን ገደማ የሚሆኑት ሳንሱር ተደርገዋል. በሚገርም ሁኔታ ንጉሥ እና ባልደረቦቹ ከፍተኛ በሆኑ ጉዳዮች ላይ ያሉ ልኡክ ጽሁፎች በመካከለኛ እና በዝቅተኛ-ተኮር ርእሰ-ነገሮቹ ላይ ከሚሰጡ ልኡክ ጽሑፎች ይልቅ በአብዛኛው ሳንሱር ብቻ ተወስደዋል. በሌላ አነጋገር, የቻይናውያን ሳንሱርዎች ዌይ ዌይ ዌስተን (የዓለም ዋንጫን) የሚጠቅስ ልጥፍ አድርገው ይቆጥሩታል. እነዚህ ግኝቶች በተነሱ ርእሶች ዙሪያ ሁሉንም ልኡክ ጽሁፎች ሳንሱር ሳንሱር ሲደግፉ አይቀበሉም.

ይሁን እንጂ ይህ ቀላል የማጣሪያ ፍጥነት በነጥብ አሰጣጥ ላይ ሊያሳስት ይችላል. ለምሳሌ, መንግሥት የ Ai ዊያንን የሚደግፉ ልጥፎችን ሳንሱር ሊያደርግ ይችላል, ነገር ግን እሱን የሚተቹትን ልኡክ ጽሁፎች ያስቀምጡ. ተመራማሪዎቹ በልኡክ ጽሁፎች ውስጥ በበለጠ ጥልቀት ለመለየት እያንዳንዱ የእያንዳንዱን አስተያየት ስሜት መለካት አለበት. በሚያሳዝን ሁኔታ ብዙ ስራዎች ቢኖሩም ብዙ ቅድመ-ቋንቋ መዝገበ-ቃላትን በመጠቀም ሙሉ ለሙሉ የነቃ ቁጥጥር ስርዓቶች አሁንም እጅግ በጣም ጥሩ አይደሉም (የሴፕቴምበር 11, 2001 የስሜት ቀውስ ጊዜ የሚፈጥሩትን ችግሮች ለማወቅ ያስቡ). ስለዚህ, ንጉሥ እና ባልደረቦቻቸው 11 ሚሊዮን የማህበራዊ ሚዲያ ልኡክ ጽሑፎቻቸውን (1) የስቴቱን ትችት, (2) የስቴቱን ደጋፊ, ወይም (3) ስለ ክስተቶች ያልተረጋገጡ ወይም ተጨባጭ ሪፖርቶች መሆናቸውን ለመግለፅ የሚያስችላቸውን መንገድ ፈልገዋል. ይህ ግዙፍ ሥራ ይመስላል: ነገር ግን እነርሱ የውሂብ ሳይንስ ውስጥ የተለመደ ነገር ግን ማኅበራዊ ሳይንስ ውስጥ አልፎ አልፎ ነው ኃይለኛ ብልሃት በመጠቀም ሊፈታ: የመማር ክትትል የሚደረግባቸው; ስእል 2.5 ይመልከቱ.

በመጀመሪያ ደረጃ ቅድመ አሠራር ተብሎ በሚታወቀው ደረጃ ተመራማሪዎቹ የማኅበራዊ ሚዲያ ልጥፎችን ወደ ሰነድ የሰነድ ማትሪክስ ለውጠው በእያንዳንዱ ሰነድ አንድ ረድፍ እና ልኡክ ጽሁፍ አንድ የተወሰነ ቃል (ለምሳሌ, ተቃውሞ ወይም ትራፊክ) . በመቀጠልም የምርምር ባለሙያዎች ቡድን አንድ የናሙና ልምዶች ስሜት በእጅ ያሸንፋል. ከዚያ, በእራፊክ የተሰየመውን ይህን ውሂብ በባህሪያቸው ላይ ተመስርቶ የልኡክ ጽሁፍ ሞዴልን ለመግለጽ የሚረዳ የማሽን ሞዴል መፈጠሩን ተጠቅመዋል. በመጨረሻም, በአጠቃላይ 11 ሚልዮን ልኡክ ጽሁፎች ያላቸውን ስሜት ለመገመት ሞዴሉን ተጠቅመዋል.

በመሆኑም 11 ሚሊዮን ልኡክ ጽሁፎችን በእጃቸው ላይ ማንበብና መጻፍ ከመቀየስ ይልቅ ንጉሠ ነገሥት እና የስራ ባልደረቦቹ አነስተኛ ቁጥር ያላቸውን ልኡክ ጽሁፎች በእራስ ስያሜዎች ከዛ በኋላ የሁሉንም ልዕለቶች ስሜት ለመገመት ቁጥጥር ያለው ትምህርት ተጠቅመዋል. እነዚህ ትንታኔዎች ከጨረሱ በኋላ ሊሰረዙት የሚችሉትን ልጥፋቸው የስቴቱን መንግሥት ወይም ደጋፊን እየደገፈ እንደሆነ ከመጥቀስ ጋር የተገናኘ ነው የሚል መደምደሚያ ላይ ደርሰዋል.

ምስል 2.5: በንጉስ ፒን እና ሮበርትስ (2013) የ 11 ሚልዮን የቻይና ማህበራዊ ሚዲያ ልምዶችን ስሜት ለመገመት የተጠቀመበትን ዘዴ ቀለል አድርገዋል. በመጀመሪያ በሂደቱ ሂደት ውስጥ ተመራማሪዎቹ የማህበራዊ ማህደረመረጃ ጽሑፎችን ወደ ሰነድ የሰነድ ማትሪክስ ቀይረዋል (ለበለጠ መረጃ Grimmer and Stewart (2013) ይመልከቱ). በሁለተኛ ደረጃ, አነስተኛ የናሙና ናሙናዎችን ስሜት በእጅ ያመሰግኑ ነበር. ሶስተኛ, የልብ ሀሳቦችን ለመከፋፈል ክትትል የሚደረግበት የመማሪያ ሞዴል አሠልጥነዋል. አራተኛ, የሁሉንም ልኬቶች ስሜት ለመገምገም ክትትል የሚደረግበትን የትምህርት ሞዴል ይጠቀማሉ. ለበለጠ ዝርዝር ገለፃን King, Pan እና Roberts (2013), አባሪን ይመልከቱ.

ምስል 2.5: King, Pan, and Roberts (2013) የ 11 ሚልዮን የቻይና ማህበራዊ ሚዲያ ልምዶችን ስሜት ለመገመት የተጠቀመበትን ዘዴ ቀለል አድርገዋል. በመጀመሪያ በሂደቱ ሂደት ውስጥ ተመራማሪዎቹ የማህበራዊ ማህደረመረጃ ጽሑፎችን ወደ ሰነድ የሰነድ ማትሪክስ ቀይረዋል (ለበለጠ መረጃ Grimmer and Stewart (2013) ይመልከቱ). በሁለተኛ ደረጃ, አነስተኛ የናሙና ናሙናዎችን ስሜት በእጅ ያመሰግኑ ነበር. ሶስተኛ, የልብ ሀሳቦችን ለመከፋፈል ክትትል የሚደረግበት የመማሪያ ሞዴል አሠልጥነዋል. አራተኛ, የሁሉንም ልኬቶች ስሜት ለመገምገም ክትትል የሚደረግበትን የትምህርት ሞዴል ይጠቀማሉ. ለበለጠ ዝርዝር ገለፃን King, Pan, and Roberts (2013) , አባሪን ይመልከቱ.

በመጨረሻም ንጉሥና ባልደረቦቹ እንደገለጹት የብልግና ምስሎች, የሲንደን አንባቢዎች ትችት, እና የጋራ የድርጊት እምብርት ያላቸው (ማለትም, ወደ ትላልቅ ተቃውሞዎች የመጋለጥ ዕድል) ያሉ ሶስት ዓይነቶች በቋሚነት ሲታገዱ እንደነበሩ ደርሰውበታል. የተሰረዙ በጣም ብዙ ልጥፎችን እና የማይሰረዙ ልጥፎችን በመመልከት ንጉሥ እና ባልደረቦቹ ሳንሱር የሚሰሩትን በመመልከት እና በመቁጠር እንዴት እንደሚሠሩ መማር ችለዋል. በተጨማሪም በዚህ መጽሐፍ ውስጥ የሚፈጸመውን ጭብጥ የሚያንጸባርቁትን ጭብጦች የሚያንጸባርቁበት መንገድ, አንዳንድ ውጤቶችን ተጠቅመዋል ለማለት እና ሌሎች ቀሪዎችን ለመሰየም የማሽን መማሪያ ሞዴል መገንባት በዲጂታል ዘመን ውስጥ በማህበራዊ ምርምር ውስጥ በጣም የተለመደ ሆኖ ተገኝቷል. . ከምዕራፍ 3 ውስጥ (ምስጢራዊ ጥያቄዎችን) 2.5 ጋር በጣም ተመሳሳይ የሆኑ ምስሎችን እና 5 (የጅምላ ትብብርን መፍጠር); ይህ በበርካታ ምዕራፎች ከሚታዩት ጥቂት ሐሳቦች ውስጥ አንዱ ነው.

እነዚህ ምሳሌዎች-በኒው ዮርክ የሚገኙ የታክሲ ሾፌሮች ባህሪ እና የቻይናን መንግስት ማህበራዊ ማህደረ መረጃ ሴንሰርሺንግ ባህርይ-በአንጻሩ ትላልቅ የውሂብ ምንጮች በቀላሉ ሊቆጠሩ እንደሚችሉ እና በአንዳንድ ሁኔታዎች ወደ አስደሳች እና ጠቃሚ ምርምር ሊያመራ ይችላል. በሁለቱም ሁኔታዎች ግን ተመራማሪዎቹ ጥያቄዎችን ወደ ትልቁ የውሂብ ምንጭ ማምጣት ነበረባቸው. መረጃው ራሱ በራሱ በቂ አልነበረም.