Տուրիզմ

Այս թարգմանությունը ստեղծվել է համակարգչի համար. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

Տուրիզմ

Բանալի:

աստիճանը դժվարությամբ հեշտ , միջին , դժվար , շատ բարդ
պահանջում է math ( $պահանջում է math$ )
պահանջում է կոդավորման ( )
տվյալների հավաքագրումը ( )
Իմ սիրելիները ( )

[ , ] Ալգորիթմական զարմանալի էր մի խնդիր Google Flu միտումները: Կարդացեք թուղթը կողմից Lazer et al. (2014) , եւ գրել կարճ, հստակ նամակ է ինժեներ Google- ի բացատրելով խնդիրը եւ առաջարկում է պատկերացում, թե ինչպես ամրագրել խնդիրը.
[ ] Bollen, Mao, and Zeng (2011) պնդում է, որ տվյալները Twitter- ից կարող են օգտագործվել է կանխատեսել ֆոնդային շուկան: Այս եզրակացությունը հանգեցրեց ստեղծման մի ցանկապատ ֆոնդի-Derwent Կապիտալի շուկաները-են ներդրումներ կատարել ֆոնդային շուկայում հիման վրա տվյալների հավաքագրված Twitter (Jordan 2010) : Ինչ ապացույցներ, որ դուք ուզում եք տեսնել, նախքան դնելով ձեր գումար այդ հիմնադրամում:
[ Մինչդեռ որոշ հասարակական առողջապահական փաստաբանները կարկուտը էլեկտրոնային ծխախոտներ, որպես արդյունավետ օգնություն ծխելու դադարեցման, մյուսները զգուշացնում են այն մասին, որ հնարավոր ռիսկերը, ինչպիսիք են բարձր մակարդակներում նիկոտինի: Պատկերացրեք, որ մի հետազոտող որոշում է ուսումնասիրել հանրային կարծիքը նկատմամբ Էլեկտրոնային ծխախոտ է հավաքում էլեկտրոնային ծխախոտները-ի հետ կապված Twitter հաղորդագրություններ եւ անցկացման տրամադրություններ վերլուծություն:
1. Որոնք են այն երեք հնարավոր շեղումներ, որ դուք շատ անհանգստանում է այս ուսումնասիրության.
2. Clark et al. (2016) Վազեց ընդամենը այդպիսի ուսումնասիրություն: Նախ, նրանք հավաքվել 850,000 Թվիթեր, որ օգտագործվել էլեկտրոնային սիգարետ հետ կապված արտահայտություն է 2012 թ. Հունվարի ից մինչեւ դեկտեմբերի 2014 թ. Հետո մոտ ստուգման, նրանք հասկացան, որ շատերն այդ Թվիթեր են ավտոմատացված (այսինքն, ոչ թե արտադրվում է մարդկանց) եւ շատերն այդ ավտոմատացված Թվիթեր ըստ էության գովազդի. Նրանք մշակել է մարդու բացահայտումը Ալգորիթմ առանձնացնել ավտոմատացված Թվիթեր օրգանական Թվիթեր. Օգտագործելով այս Human հայտնաբերել Ալգորիթմ նրանք պարզել են, որ 80% - ը Թվիթեր են ավտոմատացված. Արդյոք սա եզրակացությունը փոխել ձեր պատասխանը մասի (ա).
3. Երբ նրանք համեմատեց տրամադրությունների օրգանական եւ ավտոմատացված Թվիթեր նրանք գտել են, որ ավտոմատացված Թվիթեր ավելի դրական են, քան օրգանական Թվիթեր (6,17 versus 5.84). Արդյոք սա եզրակացությունը փոխել ձեր պատասխանը (բ)?
[ ] 2009-ի նոյեմբերին, Twitter փոխվել այն հարցին ի Tweet վանդակում է «Ինչ եք անում?" To "Ինչ է կատարվում» (https://blog.twitter.com/2009/whats-happening):
1. Ինչպես եք կարծում, որ փոփոխությունը հուշում կազդի ովքեր ծլվլոց եւ / կամ ինչ են նրանք միանալ.
2. Անունը մեկ հետազոտական ծրագիր, որի համար դուք կարող եք նախընտրելի արագ "Ինչ եք անում?" Բացատրիր, թե ինչու:
3. Անունը մեկ հետազոտական ծրագիր, որի համար դուք պետք է նախընտրում արագ «Ինչ է կատարվում« Բացատրիր, թե ինչու:
[ ] Kwak et al. (2010) Վերլուծվում 41.7 մլն օգտվողի պրոֆիլներ, 1.47 մլրդ հասարակական հարաբերությունների 4262 trending թեմաներ, եւ 106 մլն թվիթ հունիսի 6-ին եւ հունիսի 31-ին, 2009 թ. Հիմնվելով այս վերլուծության Նրանք եզրակացրել են, որ Twitter սպասարկում է ավելի, որպես նոր միջին տեղեկատվության փոխանակման, քան սոցիալական ցանց.
1. Հաշվի առնելով, Kwak et al-ի հայտնաբերման, թե ինչ տեսակի հետազոտությունների որ դուք անում Twitter տվյալները: Ինչ տեսակի հետազոտությունների որ դուք չեք անում Twitter տվյալները: Ինչու:
2. 2010 թ., Twitter ավելացրել է, թե ով է Հետեւեք ծառայություն կատարելու հարմարեցված առաջարկ է օգտվողների համար: Երեք առաջարկություններ են ցուցադրվել են մի ժամանակ գլխավոր էջում: Առաջարկություններ հաճախ են վերցված մեկ «ընկերներից-ի ընկերների», եւ փոխադարձ շփումներ են նաեւ ցուցադրվում է առաջարկությամբ: Օգտագործողները կարող են թարմացնել տեսնել մի նոր շարք առաջարկությունների կամ այցելեք էջը ավելի երկար ցանկում առաջարկությունների: Ինչ եք կարծում, այս նոր հատկությունը կարող է փոխել ձեր պատասխանը Part A). Ինչու կամ ինչու ոչ:
3. Su, Sharma, and Goel (2016) Գնահատել է ազդեցությունը ով է Հետեւեք ծառայություն եւ գտել է, որ մինչ օգտվողները ողջ ժողովրդականությունը սպեկտրի շահել է առաջարկությունների, ամենատարածված օգտվողները օգուտ զգալիորեն ավելի, քան միջին: Արդյոք սա եզրակացությունը փոխել ձեր պատասխանը մասի բ). Ինչու կամ ինչու ոչ:
[ «ReTweets» հաճախ օգտագործվում է չափել ազդեցությունը եւ տարածել վրա ազդեցության Twitter. Սկզբում, օգտվողները ստիպված էր պատճենեք եւ տեղադրեք ծլվլոց նրանք դուր եկավ, պիտակների բնօրինակը հեղինակին իր / իր բռնակի, եւ ձեռքով մուտքագրել «RT» նախքան միանալ ցույց են տալիս, որ դա մի retweet. Այնուհետեւ, 2009 թ. Twitter ավելացրել է «retweet» կոճակը: Ի 2016, Twitter համար հնարավոր դարձրեց օգտվողները retweet իրենց սեփական Թվիթեր (https://twitter.com/twitter/status/742749353689780224): Ինչ եք կարծում, այդ փոփոխությունները պետք է ազդի, ինչպես եք դուք օգտագործում "ReTweets" Ձեր հետազոտության. Ինչու կամ ինչու ոչ:
[ , , ] Michel et al. (2011) կառուցվել է կորպուսի ձեւավորվող Google- ի ջանքերի թվայնացնելու գրքեր. Օգտագործելով առաջին տարբերակը կորպուսի, որը հրապարակվել է 2009 թ., Եւ պարունակում էր շուրջ 5 միլիոն թվայնացված գրքերի, հեղինակները վերլուծել են բառերի գործածությունը հաճախականությունը հետաքննել լեզվական փոփոխություններ եւ մշակութային միտումները: Շուտով Google Books Corpus հայտնի դարձավ տվյալների աղբյուրը հետազոտողների համար, եւ 2-րդ տարբերակը մասնակի ազատ էր արձակվել 2012 թ.

Սակայն, Pechenick, Danforth, and Dodds (2015) զգուշացրեց, որ հետազոտողները պետք է լիարժեք բնութագրել ընտրանքի գործընթացը կորպուսի օգտագործելուց առաջ այն նկարելու լայն եզրակացություններ: Հիմնական խնդիրն այն է, որ կորպուսը է գրադարանը նման, որը պարունակում է մեկ յուրաքանչյուր գրքի: Արդյունքում, անհատի, բեղմնավոր հեղինակ կարող է նկատելիորեն տեղադրեք նոր արտահայտություններ մեջ Google Books բառապաշար: Ավելին, գիտական տեքստեր կազմում է ավելի էական մասը կորպուսի ողջ 1900. Բացի այդ, համեմատելով երկու տարբերակները անգլերեն գեղարվեստական գրականության տվյալների, Pechenick et al. գտել վկայում է, որ ոչ բավարար զտիչ օգտագործվել է արտադրում առաջին տարբերակը: Բոլոր տվյալները համար անհրաժեշտ գործունեության հասանելի է այստեղ: http://storage.googleapis.com/books/ngrams/books/datasetsv2.html
1. Ի Միշել et al. Բնօրինակ թղթի (2011) , Դրանք օգտագործել են 1-ին տարբերակը անգլիական տվյալների set, որը հիմնված հաճախականությունը օգտագործման տարիների «1880», «1912» եւ «1973 թ.», Եւ եզրակացրել է, որ «մենք մոռանալով մեր անցյալը արագ յուրաքանչյուր անցնող տարվա »(նկ. 3A, Միշել et al.): Վերարտադրելու նույն հողամասի օգտագործելով 1) 1-ին տարբերակը կորպուսի, Անգլերեն dataset (նույնն է, Նկ. 3 ա, Միշել et al.):
2. Այժմ վերարտադրելու նույն հողամասի հետ 1-ին տարբերակի, անգլերեն գեղարվեստական dataset.
3. Այժմ վերարտադրելու նույն հողամասի հետ 2-րդ տարբերակի կորպուսի, անգլերեն dataset.
4. Վերջապես, վերարտադրելու նույն հողամասի հետ 2-րդ տարբերակի, անգլերեն գեղարվեստական dataset.
5. Նկարագրեք տարբերությունները եւ նմանությունները միջեւ չորս սյուժեները: Համամիտ եք Միշել et al. Բնօրինակը մեկնաբանության Նկատվող միտումը. (Ակնարկ: գ) եւ դ) պետք է լինեն նույնը, քանի Նկար 16-ին Pechenick et al.)
6. Այժմ, որ դուք replicated այս մեկ եզրակացություն, օգտագործելով տարբեր Google Գրքեր կորպուսներ, ընտրել մեկ այլ լեզվական փոփոխություն կամ մշակութային երեւույթները ներկայացված Միշել et al. Բնօրինակ թղթի վրա: Համամիտ եք, իրենց մեկնաբանության լույսի ներքո սահմանափակումների ներկայացված Pechenick et al.. Որպեսզի ձեր փաստարկը ուժեղ է, փորձեք վերարտադրելու նույն գրաֆիկը օգտագործելով տարբեր վարկածներ տվյալները սահմանված, ինչպես նաեւ վերը նշված.
[ , , , ] Penney (2016) Հետազոտում, թե արդյոք համատարած հրապարակայնությունը մասին NSA / պրիզմայով հսկողության (այսինքն, Սնոուդենը բացահայտումներից) 2013 թվականի հունիսին, որը կապված է կտրուկ եւ անսպասելի նվազման երթեւեկության Վիքիպեդիայի հոդվածներում, թեմաների, որոնք բարձրացնում գաղտնիության մտահոգությունները: Եթե այդպես է, այս փոփոխությունը վարքի կլինի համահունչ է chilling effect արդյունքում զանգվածային հսկողության. Մոտեցումը Penney (2016) , Որը երբեմն կոչվում է ընդհատված ժամանակային շարքերի դիզայն եւ կապված է մոտեցումների գլխում մոտ մոտեցնել փորձեր է դիտողական տվյալների (Բաժին 2.4.3):

Ընտրել թեմա հիմնաբառեր, Penney անդրադարձել է ցուցակում, որն օգտագործվում է ԱՄՆ դեպարտամենտի Հայրենիքի անվտանգության համար հետեւել եւ մոնիտորինգի սոցիալական լրատվամիջոցների. The DHS ցանկը դասակարգում որոշակի փնտրման տերմինները մեջ մի շարք հարցերի շուրջ, այսինքն, «Առողջություն կոնցեռն», «Ենթակառուցվածքի անվտանգության» եւ «ահաբեկչության դեմ:« Հանուն ուսումնասիրության խմբի, Penney օգտագործվում է քառասունութ հիմնաբառերից կապված «Ահաբեկչությունը» (տես Աղյուսակ 8 Հավելված): Նա այնուհետեւ ընդհանրացվել Վիքիպեդիայի դիտեք ակնկալում է ամսական կտրվածքով համար համապատասխան քառասունութ Վիքիպեդիայի հոդվածներում ավելի քան երեսուն երկու ամսվա ընթացքում, սկսած հունվարի սկզբին 2012 թ. Օգոստոսի վերջին 2014 թ-ից ամրապնդել իր փաստարկը, նա նաեւ ստեղծել է մի քանի համեմատություն խմբերի հետեւել հոդված տեսակետները այլ թեմաների շուրջ:

Այժմ, դուք պատրաստվում են վերարտադրելու եւ ընդլայնել Penney (2016) : Բոլոր հում տվյալները, որ դուք պետք է այս գործունեության հասանելի է Վիքիպեդիայից (https://dumps.wikimedia.org/other/pagecounts-raw/~~HEAD=pobj). Կամ դուք կարող եք ստանալ այն R փաթեթի wikipediatrend (Meissner and Team 2016) : Երբ եք գրել մինչեւ ձեր պատասխանները, խնդրում ենք նկատի ունենալ, ինչը տվյալների աղբյուրը եք օգտագործել. (Նշում: Այս նույն գործունեությամբ նաեւ հայտնվում է 6-րդ գլխում)
1. Կարդալ Penney (2016) Եւ վերարտադրելու նկ. 2, որը ցույց է տալիս էջի հայացքների համար «ահաբեկչության» կիրառմամբ էջերի առաջ եւ հետո Սնոուդենի հայտնության: Մեկնաբանել արդյունքները:
2. Հաջորդը, վերարտադրելու Նկ 4 ա, որը համեմատում է ուսումնասիրության խումբ ( «ահաբեկչության» կիրառմամբ հոդվածներ) մի comparator խմբի օգտագործելով հիմնաբառեր կարգերի տակ «DHS եւ այլ գործակալությունների» է DHS ցուցակ (տես Հավելված Աղյուսակ 10): Մեկնաբանել արդյունքները:
3. Ի Մաս Բ) Դուք համեմատ ուսումնասիրության խումբը մեկ comparator խմբին: Penney նաեւ, համեմատած մյուս երկու համեմատման խմբերի «ենթակառուցվածքի անվտանգության» կիրառմամբ հոդվածներ (Հավելվածի աղյուսակ 11) եւ հայտնի Վիքիփեդիայի էջերում (Հավելված Աղյուսակ 12): Գալ այլընտրանքային comparator խմբի, եւ փորձարկել եթե արդյունքները մասից բ) զգայուն է ձեր ընտրությամբ համեմատիչ խմբի: Որ ընտրությունն համեմատիչ խմբի կազմում ամենաշատ զգացում. Ինչու:
4. Հոդվածի հեղինակը հայտարարել է, որ հիմնաբառեր վերաբերող «ահաբեկչության» համար օգտագործվել են ընտրելու Վիքիփեդիայի հոդվածները, քանի որ ԱՄՆ-ի կառավարությունը մեջբերել ահաբեկչությունը որպես հիմնական արդարացում իր տեղադրվել են առցանց հսկողության պրակտիկայի. Որպես ստուգման այդ 48 «ահաբեկչության» կիրառմամբ հիմնաբառեր, Penney (2016) Ինչպես նաեւ իրականացրել է հետազոտություն MTurk խնդրելով պատասխանողներին գնահատում յուրաքանչյուրը հիմնաբառերից առումով կառավարության Trouble, գաղտնիության զգայուն է, եւ խուսափելը (Հավելված Աղյուսակ 7 եւ 8). Վերարտադրելու հարցում MTurk եւ համեմատել ձեր արդյունքները.
5. Հիման վրա արդյունքների Part D), եւ ձեր ընթերցմամբ հոդվածի, դուք համաձայն հեղինակային ընտրության թեմայի հիմնաբառեր ուսումնասիրության խմբի. Ինչու կամ ինչու ոչ: Եթե ոչ, ինչ եք առաջարկում փոխարեն.
[ ] Efrati (2016) Հաշվետվությունները, հիման վրա գաղտնի տեղեկությունները, որ «ընդհանուր փոխանակում» Facebook- ում նվազել էր մոտ 5.5 տոկոսով, իսկ «օրիգինալ հեռարձակումը փոխանակում» էր ներքեւ 21 տոկոսով: Այս անկումը եղել հատկապես սուր հետ Facebook- ի օգտատերերի ներքո 30 տարեկանից: Զեկույցում վերագրվում անկումը երկու գործոններով: Դրանցից մեկն այն է, որ աճը թվի «ընկերների» մարդիկ ունենք Facebook. Մյուսը, որ ինչ-որ փոխանակման ակտիվությունը տեղափոխվել հաղորդագրությունների եւ մրցակիցների, ինչպիսիք են SnapChat: Զեկույցում նաեւ բացահայտեց մի քանի մարտավարությունը Facebook փորձել է խթանել փոխանակման, այդ թվում, Լրահոս ալգորիթմ tweaks, որոնք կազմում օրիգինալ հաղորդագրություններ ավելի հայտնի, ինչպես նաեւ պարբերաբար հիշեցումներ օրիգինալ գրառումները օգտվողների «Այս օրը» մի քանի տարի առաջ: Ինչ հետեւանք, եթե այդպիսիք կան, արդյոք այդ արդյունքները պետք է հետազոտողներին, ովքեր ցանկանում են օգտագործել Facebook որպես տվյալների աղբյուր.
[ ] Tumasjan et al. (2010) Հաղորդում է, որ համամասնությամբ Թվիթեր նշելով քաղաքական կուսակցություն համապատասխանում համամասնությամբ ձայների այդ կուսակցությունն ստացել է գերմանական խորհրդարանական ընտրություններին 2009 թ. (Նկար 2.9). Այլ կերպ ասած, պարզվել է, որ դուք կարող եք օգտագործել Twitter- ը կանխատեսել ընտրություններում: Միեւնույն ժամանակ, այս ուսումնասիրությունը հրապարակվել էր, որ այն համարվում էր չափազանց հետաքրքիր է, քանի որ թվում էր, առաջարկել արժեքավոր օգտագործման համար միասնական աղբյուր մեծ տվյալների.

Հաշվի առնելով վատ հատկանիշները մեծ տվյալների, սակայն, դուք պետք է անմիջապես թերահավատ այս արդյունքը: Գերմանացիները Twitter- ում 2009 թ բավական ոչ ներկայացուցիչ խումբը, եւ կողմնակիցները մեկ կուսակցության կարող է միանալ քաղաքականության մասին ավելի հաճախ: Այսպիսով, թվում է, զարմանալի է, որ բոլոր հնարավոր շեղումներ, որոնք դուք կարող եք պատկերացնել, որ ինչ-որ կերպ չեղյալ են: Ի դեպ, արդյունքները Tumasjan et al. (2010) Պարզվեց, որ շատ լավ է, որ ճշմարիտ է: Իրենց թուղթ, Tumasjan et al. (2010) Համարվում է վեց քաղաքական կուսակցություններ `քրիստոնյա դեմոկրատները (CDU), Քրիստոնեա-սոցիալական դեմոկրատները (CSU), SPD, ազատականները (FDP), ձախ (Die Linke) եւ Կանաչների կուսակցության (Grune): Սակայն, առավել նշված գերմանական քաղաքական on Twitter այդ ժամանակ էր, Pirate Party (Piraten), մի կողմ է, որ պայքարում է կառավարության կարգավորումը Ինտերնետում: Երբ է ծովահեն կուսակցությունը ներառվել է վերլուծության, Twitter նշում է դառնում սարսափելի predictor ընտրությունների արդյունքների (Նկար 2.9) (Jungherr, Jürgens, and Schoen 2012) :

Նկար 2.9: Twitter նշում է հայտնվում է կանխատեսել արդյունքները 2009 թ. Գերմանական ընտրություններում (Tumasjan et al. 2010) , սակայն այս արդյունքը պարզվում է, կախված է մի շարք կամայական եւ չարդարացված ընտրության (Jungherr, Jürgens, and Schoen 2012) :

Հետագայում, այլ հետազոտողներ ամբողջ աշխարհում օգտագործվող գիտակ մեթոդներ, ինչպիսիք են `օգտագործելով տրամադրությունները վերլուծություն է տարբերակել դրական եւ բացասական նշում է, որ կուսակցությունների, որպեսզի բարելավել ունակությունը Twitter տվյալների կանխատեսել մի շարք տարբեր տեսակի ընտրությունների (Gayo-Avello 2013; Jungherr 2015, Ch. 7.) : Ահա թե ինչպես Huberty (2015) Ամփոփել է այդ փորձերի է կանխատեսել ընտրություններ:

«Բոլոր հայտնի կանխատեսման մեթոդների վրա հիմնված սոցիալական լրատվամիջոցների չի հաջողվել, երբ ենթարկվել պահանջներին ճշմարիտ շրջահայաց ընտրական կանխատեսումների. Այս անհաջողությունները հայտնվել է պայմանավորված հիմնարար հատկությունների սոցիալական մեդիայի, այլ ոչ թե մեթոդաբանական կամ ալգորիթմիկ դժվարություններին: Կարճ ասած, սոցիալական լրատվամիջոցները չեն, եւ, հավանաբար, երբեք չի, առաջարկում է կայուն, անաչառ, ներկայացուցչական պատկեր է ընտրազանգվածի, եւ հարմարության նմուշները սոցիալական մեդիայի չունեն բավարար տվյալներ է ամրագրել այդ խնդիրները փակցնել hoc »:

Կարդացեք որոշ հետազոտությունների, որոնք հանգեցնում Huberty (2015) Այդ եզրակացության, եւ գրել մեկ էջանոց հուշագիր է քաղաքական թեկնածուի նկարագրելով, եթե, եւ թե ինչպես Twitter պետք է օգտագործվի կանխատեսել ընտրություններ:
[ ] Որն է տարբերությունը սոցիոլոգ եւ պատմաբան: Ըստ Goldthorpe (1991) , Հիմնական տարբերությունն սոցիոլոգ եւ պատմաբան է վերահսկողությունն տվյալների հավաքագրման. Պատմաբանները ստիպված են օգտագործել մասունքները, իսկ սոցիոլոգները կարող եք հարմարեցնել իրենց տվյալների հավաքագրումը կոնկրետ նպատակներով. Կարդալ Goldthorpe (1991) : Ինչպես է տարբերությունը սոցիոլոգիայի եւ պատմության հետ կապված գաղափարին Custommades եւ մոդայիկ?
[ ] Հիմնվելով նախորդ հարցին, Goldthorpe (1991) Ոչ-ոքի է մի շարք քննադատական արձագանքներ, այդ թվում մեկը Nicky Hart (1994) Որոնք սպառնում Goldthorpe ի նվիրվածությունը դերձակ կազմել տվյալները: Է հստակեցնել հնարավոր սահմանափակումները մշակված տվյալների, Hart նկարագրեց բարեկեցիկ Worker ծրագիրը, մեծ հետազոտություն է չափել փոխհարաբերությունները սոցիալական խավի եւ քվեարկության, որը վարում Goldthorpe եւ գործընկերների 1960-ականների կեսին: Ինչ կարելի է ակնկալել մի գիտնական, որը արտոնված մշակված տվյալներ հայտնաբերվել տվյալների, բարեկեցիկ գործիչ Ծրագրի հավաքագրված տվյալների, որը հարմարեցված է անդրադառնալ վերջերս առաջարկված տեսությունը մասին ապագայի սոցիալական խավի է դարաշրջանում բարձրացման կենսամակարդակի: Բայց, Goldthorpe եւ գործընկերները ինչ-որ կերպ «մոռացել» է հավաքել տեղեկատվություն մասին քվեարկության վարքագծի կանանց. Ահա թե ինչպես Nicky Hart (1994) ամփոփումներ ամբողջ դրվագ:

" , , այն [is] դժվար է խուսափել այն եզրակացության, որ կանայք են բաց թողնվել, քանի որ այս «դերձակ կազմել 'dataset սահմանափակվել է մի պարադիգմային տրամաբանությամբ, որը բացառված իգական փորձ: Պայմանավորված է մի տեսական տեսլականով դասի գիտակցության եւ գործողության որպես արական preoccupations: , , , Goldthorpe եւ նրա գործընկերները կառուցվել է մի շարք էմպիրիկ ապացույցների, որոնք սնվում եւ սնուցվի սեփական տեսական ենթադրությունները փոխարեն Արմեն նրանց վավեր քննության ադեկվատության »:

Hart շարունակեց.

«Այն էմպիրիկ բացահայտումները վտակ բանվորական նախագծի պատմել մեզ մասին ավելի masculinist արժեքների կեսերին-րդ դարի սոցիոլոգիայի, քան նրանք տեղեկացնում գործընթացները շերտավորումը քաղաքականության եւ նյութական կյանքում»:

Կարող եք կարծում, այլ օրինակներ, որտեղ անպաճույճ տվյալների հավաքագրման ունի biases է տվյալների կոլեկցիոներ կառուցված մեջ այն. Ինչպես է դա համեմատել ալգորիթմական Խառը. Ինչ հետեւանք կարող է դա անհրաժեշտ, երբ հետազոտողները պետք է օգտագործել, մոդայիկ եւ, երբ նրանք պետք է օգտագործեն Custommades.
[ ] Այս գլխում, ես հակադրել տվյալները հավաքված են հետազոտողների համար հետազոտողների հետ վարչական գրանցումների ստեղծած ընկերությունների եւ կառավարությունների: Որոշ մարդիկ անվանում են այդ վարչական արձանագրություններ «գտել տվյալներով,« որը նրանք հակադարձելով », որոնք նախատեսված տվյալները.« Դա ճիշտ է, որ վարչական գրառումները հայտնաբերվել են, ըստ հետազոտողների, բայց նրանք նաեւ բարձր մշակված: Օրինակ, ժամանակակից տեխնոլոգիական ընկերությունները ծախսում հսկայական քանակությամբ ժամանակ եւ ռեսուրսներ հավաքել եւ համադրելու իրենց տվյալները: Այսպիսով, այդ վարչական արձանագրություններ են, այնպես էլ հայտնաբերվել եւ նախագծված, դա պարզապես կախված է ձեր տեսանկյունից (Նկար 2.10):

Նկար 2.10: Պատկերը, այնպես էլ մի բադ եւ նապաստակ. ինչ դուք տեսնում եք կախված է ձեր տեսանկյունից. Կառավարության եւ գործարար վարչական արձանագրություններ են, այնպես էլ հայտնաբերվել եւ նախագծված, ինչ դուք տեսնում եք կախված է ձեր տեսանկյունից. Օրինակ, Զանգահարեք տվյալների գրառումները հավաքված է բջջային հեռախոսի ընկերության հայտնաբերվել են տվյալներ տեսանկյունից հետազոտող: Սակայն, այդ ճիշտ նույն գրառումները, որոնք նախատեսված են տվյալների հեռանկար մեկի աշխատանքային է հաշվարկային բաժնի հեռախոսի ընկերության. Աղբյուր ` Wikimedia Commons

Օրինակ տվյալների աղբյուր, որտեղ տեսնելով այն, այնպես էլ որպես հայտնաբերվել եւ մշակված օգտակար է, երբ, օգտագործելով այդ տվյալների աղբյուրը հետազոտության.
[ ] Ի մտախոհ շարադրություն, Christian Sandvig եւ Eszter Hargittai (2015) Նկարագրել երկու տեսակի թվային հետազոտությունների, որտեղ թվային համակարգը "գործիքի» կամ «օբյեկտ ուսումնասիրության.« Օրինակ առաջին տեսակի ուսումնասիրության, որտեղ Bengtsson եւ գործընկերները (2011) , որն օգտագործվում բջջային հեռախոս տվյալների է հետեւել միգրացիայի երկրաշարժից հետո Հայիթիում 2010 թ. Որպես օրինակ երկրորդ տեսակի, որտեղ Jensen (2007) ուսումնասիրությունները, թե ինչպես է ներդրումը բջջային հեռախոսների ողջ Kerala, Հնդկաստանը ազդեցություն գործունեությունը շուկայում ձուկ. Ես գտնում եմ, որ այս օգտակար է, քանի որ պարզաբանում է, որ ուսումնասիրությունները օգտագործելով թվային տվյալների աղբյուրները կարող են ունենալ միանգամայն տարբեր նպատակներ, նույնիսկ այն դեպքում, եթե նրանք օգտագործում են նույն տեսակի տվյալների աղբյուր: Որպեսզի հետագայում պարզել այս տարբերակում, նկարագրելու չորս ուսումնասիրություններ, որ դու տեսել երկու, որ օգտագործել թվային համակարգի, որպես գործիքի, իսկ երկու օգտագործել թվային համակարգի, որպես օբյեկտ ուսումնասիրության. Դուք կարող եք օգտագործել օրինակներ այս գլխում, եթե դուք ուզում եք.