Bit By Bit: Social Research in the Digital Age
  • аб
    • адкрыць водгук
    • цытаванне
    • код
    • пра аўтара
    • Канфідэнцыяльнасць і Згоды
  • Мовы
    • English
    • Afrikaans
    • Albanian
    • Amharic
    • Arabic
    • Armenian
    • Azerbaijani
    • Basque
    • Belarusian
    • Bengali
    • Bosnian
    • Bulgarian
    • Catalan
    • Cebuano
    • Chichewa
    • Chinese Simplified
    • Chinese Traditional
    • Corsican
    • Croatian
    • Czech
    • Danish
    • Dutch
    • Esperanto
    • Estonian
    • Filipino
    • Finnish
    • French
    • Frisian
    • Galician
    • Georgian
    • German
    • Greek
    • Gujarati
    • Haitian Creole
    • Hausa
    • Hawaiian
    • Hebrew
    • Hindi
    • Hmong
    • Hungarian
    • Icelandic
    • Igbo
    • Indonesian
    • Irish
    • Italian
    • Japanese
    • Javanese
    • Kannada
    • Kazakh
    • Khmer
    • Korean
    • Kurdish (Kurmanji)
    • Kyrgyz
    • Lao
    • Latin
    • Latvian
    • Lithuanian
    • Luxembourgish
    • Macedonian
    • Malagasy
    • Malay
    • Malayalam
    • Maltese
    • Maori
    • Marathi
    • Mongolian
    • Myanmar (Burmese)
    • Nepali
    • Norwegian
    • Pashto
    • Persian
    • Polish
    • Portuguese
    • Punjabi
    • Romanian
    • Russian
    • Samoan
    • Scots Gaelic
    • Serbian
    • Sesotho
    • Shona
    • Sindhi
    • Sinhala
    • Slovak
    • Slovenian
    • Somali
    • Spanish
    • Sudanese
    • Swahili
    • Swedish
    • Tajik
    • Tamil
    • Telugu
    • Thai
    • Turkish
    • Ukrainian
    • Urdu
    • Uzbek
    • Vietnamese
    • Welsh
    • Xhosa
    • Yiddish
    • Yoruba
    • Zulu
  • Teaching
  • Media
  • Read Online
  • купіць кнігу
    • Princeton University Press
    • Amazon
    • Barnes and Noble
    • IndieBound
  • прадмову
  • 1 Увядзенне
    • 1.1 Чарніла блот
    • 1.2 Сардэчна запрашаем у эпоху лічбавых тэхналогій
    • 1.3 Дызайн даследаванні
    • 1.4 Тэмы гэтай кнігі
    • 1.5 Структура гэтай кнігі
    • Што чытаць далей
  • 2 Назіраючы паводзіны
    • 2.1 Уводзіны
    • 2.2 Вялікія дадзеныя
    • 2.3 Дзесяць агульныя характарыстыкі вялікіх аб'ёмаў дадзеных
      • 2.3.1 Вялікі
      • 2.3.2 Заўсёды-на
      • 2.3.3 нереакционноспособные
      • 2.3.4 Няпоўныя
      • 2.3.5 Недаступны
      • 2.3.6 нерепрезентативности
      • 2.3.7 дрэйфуючых
      • 2.3.8 алгарытмічныя брыдка ім
      • 2.3.9 Брудныя
      • 2.3.10 Адчувальны
    • 2.4 Стратэгіі даследаванняў
      • 2.4.1 Counting рэчы
      • 2.4.2 Прагназаванне і прагназаванне бягучай надвор'я
      • 2.4.3 Аппроксимационные эксперыменты
    • 2.5 Заключэнне
    • матэматычныя нататкі
    • Што чытаць далей
    • дзейнасць
  • 3 Задаваць пытанні
    • 3.1 Уводзіны
    • 3.2 Прасіць супраць назірання
    • 3.3 Агульная структура памылак абследавання
      • 3.3.1 Прадстаўленне
      • 3.3.2 Вымярэнне
      • 3.3.3 Кошт
    • 3.4 Хто спытаць
    • 3.5 Новыя спосабы задаваць пытанні
      • 3.5.1 Экалагічныя імгненныя ацэнкі
      • 3.5.2 Wiki апытанні
      • 3.5.3 Gamification
    • 3.6 Даследаванні звязаны з вялікімі крыніцамі дадзеных
      • 3.6.1 Абагачаны запытаная
      • 3.6.2 Узмоцнены просяць
    • 3.7 Заключэнне
    • матэматычныя нататкі
    • Што чытаць далей
    • дзейнасць
  • 4 правядзення эксперыментаў
    • 4.1 Уводзіны
    • 4.2 Якія эксперыменты?
    • 4.3 Два вымярэння эксперыментаў: лабараторнага поля і аналога-лічбавыя
    • 4.4 Пераход ад простых эксперыментаў
      • 4.4.1 Тэрмін дзеяння
      • 4.4.2 Неаднастайнасць эфектаў лячэння
      • 4.4.3 Механізмы
    • 4.5 Стварэнне гэта адбылося
      • 4.5.1 Выкарыстанне існуючых асяроддзяў
      • 4.5.2 Стварыце свой уласны эксперымент
      • 4.5.3 Стварыце свой уласны прадукт
      • 4.5.4 Партнёр з магутным
    • 4.6 Рэкамендацыі
      • 4.6.1 Стварэнне нулявых зменных дадзеных аб выдатках
      • 4.6.2 Пабудова этыкі ў дызайн: замяніць, удакладніць і скараціць
    • 4.7 Заключэнне
    • матэматычныя нататкі
    • Што чытаць далей
    • дзейнасць
  • 5 Стварэнне масавага супрацоўніцтва
    • 5.1 Уводзіны
    • 5.2 Чалавечыя вылічэнні
      • 5.2.1 Galaxy Zoo
      • 5.2.2 натоўпу кадаваньне палітычных маніфэстаў
      • 5.2.3 Заключэнне
    • 5.3 Адкрытыя выклікі
      • 5.3.1 Netflix Prize
      • 5.3.2 Foldit
      • 5.3.3 Роўны-Патэнт
      • 5.3.4 Заключэнне
    • 5.4 Размеркаваныя збору дадзеных
      • 5.4.1 eBird
      • 5.4.2 PhotoCity
      • 5.4.3 Заключэнне
    • 5.5 Праектаванне самастойна
      • 5.5.1 Удзельнікі Матываваць
      • 5.5.2 Рычагі гетэрагеннасць
      • 5.5.3 Фокус увагі
      • 5.5.4 Уключыць сюрпрыз
      • 5.5.5 этычна
      • 5.5.6 Канчатковы дызайн парады
    • 5.6 Заключэнне
    • Што чытаць далей
    • дзейнасць
  • 6 Этыка
    • 6.1 Уводзіны
    • 6.2 Тры прыкладу
      • 6.2.1 Эмацыйная Contagion
      • 6.2.2 Густы, Гальштукі, і час
      • 6.2.3 Encore
    • 6.3 Digital адрозніваецца
    • 6.4 Чатыры прынцыпу
      • 6.4.1 Павага асоб
      • 6.4.2 Beneficence
      • 6.4.3 правасуддзе
      • 6.4.4 Захаванне закона і грамадскіх інтарэсаў
    • 6.5 Два этычных рамак
    • 6.6 Вобласці цяжкасці
      • 6.6.1 інфармаваць згоду
      • 6.6.2 Разуменне і кіраванне рызыкамі інфармацыйнай
      • 6.6.3 Канфідэнцыяльнасць
      • 6.6.4 Прыняцце рашэнняў ва ўмовах нявызначанасці
    • 6.7 Практычныя парады
      • 6.7.1 ЭСН з'яўляецца падлогу, а ня столь
      • 6.7.2 Пастаўце сябе на месца ўсіх астатніх
      • 6.7.3 Прыдумайце даследчай этыкі як бесперапынны, а ня дыскрэтны
    • 6.8 Заключэнне
    • гістарычнае прыкладанне
    • Што чытаць далей
    • дзейнасць
  • 7 Будучыня
    • 7.1 Зазіраючы наперад
    • 7.2 Тэмы будучага
      • 7.2.1 Змешванне readymades і custommades
      • 7.2.2 збор дадзеных аб удзельніку ў цэнтры
      • 7.2.3 Этыка ў канструкцыі даследаванні
    • 7.3 Вярнуцца да пачатку
  • выраз удзячнасці
  • спасылкі
Гэты пераклад быў створаны з дапамогай кампутара. ×

Што чытаць далей

  • Ўвядзенне (раздел 3.1)

Многія з тэм , у гэтым раздзеле таксама адлюстраваны ў апошніх прэзідэнцкіх пасланнях ў Амерыканскай асацыяцыі даследаванняў грамадскай думкі (AAPOR), такія як тыя , па Dillman (2002) , Newport (2011) , Santos (2014) і Link (2015) .

Больш падрабязнай інфармацыі пра адрозненні паміж аглядныя даследаваннем і паглыбленымі інтэрв'ю, см Small (2009) . Які адносіцца да паглыбленым інтэрв'ю сямейства падыходаў, званых этнаграфіяй. У этнаграфічных даследаваннях, даследчыкі звычайна праводзяць значна больш часу з удзельнікамі у іх натуральным асяроддзі. Больш падрабязную інфармацыю пра адрозненні паміж этнаграфіяй і паглыбленых інтэрв'ю, см Jerolmack and Khan (2014) . Больш падрабязнай інфармацыі аб лічбавай этнаграфіі см Pink et al. (2015) і Pink et al. (2015) .

Маё апісанне гісторыі агляднага даследавання занадта коратка, каб ўключаць у сябе многія з захапляльных падзей, якія мелі месца. Для больш гістарычнага фону, см Smith (1976) , Converse (1987) , і Igo (2008) . Больш падрабязную інфармацыю пра ідэі трох эпох агляднага даследавання, см Groves (2011) і Dillman, Smyth, and Christian (2008) (які распадаецца на тры эпохі трохі па- іншаму).

Groves and Kahn (1979) прапануюць зазірнуць ўнутр пры пераходзе ад першай да другой эры ў агляднай даследаванні, робячы дэталёвае параўнанне галавы да галавы паміж твар у твар і тэлефонны апытання. ( ??? ) азірацца на гістарычнае развіццё метадаў выбаркі выпадковых лічбаў набору нумара.

Больш як даследаванне даследаванні змянілася ў мінулым у адказ на змены ў грамадстве, см Tourangeau (2004) , ( ??? ) , і Couper (2011) .

  • Прасіць супраць назірання (раздел 3.2)

Моцныя і слабыя бакі задаваць пытанні і назірання былі абмеркаваныя псіхолагі (напрыклад, Baumeister, Vohs, and Funder (2007) ) і сацыёлагі (напрыклад, Jerolmack and Khan (2014) ; Maynard (2014) ; Cerulo (2014) ; Vaisey (2014) ; Jerolmack and Khan (2014) ] розніца паміж просьбай і назіранні таксама ўзнікае ў эканоміцы, дзе даследчыкі кажуць аб заяўленых і выяўленых пераваг Напрыклад, даследчык можа папрасіць рэспандэнтаў аддаюць перавагу ці яны ядуць марозіва ці хадзіць у спартзалу .. (паказана перавагу), або мог назіраць , як часта людзі ядуць марозіва і хадзіць у спартзалу (выяўленыя перавагі). Існуе глыбокі скептыцызм у дачыненні да некаторых відаў , названых пераваг дадзеных у эканоміцы , як гэта апісана ў Hausman (2012) .

Асноўная тэма гэтых дыскусій з'яўляецца тое, што згодна са справаздачнасцю паводзіны не заўсёды дакладна. Але, як гэта было апісана ў чале 2, вялікія крыніцы дадзеных не могуць быць дакладнымі, то яны не могуць быць сабраны на выбарцы цікавасці, і яны не могуць быць даступныя для даследчыкаў. Такім чынам, я думаю, што ў некаторых сітуацыях, паведамляе паводзіны можа быць карысным. Акрамя таго, другая асноўная тэма гэтых дыскусій з'яўляецца тое, што паведамленні пра эмоцыях, ведаў, спадзяваннях і меркаваннях не заўсёды дакладныя. Але, калі інфармацыя аб гэтых унутраных станах патрабуюцца даследчыкі-небудзь, каб дапамагчы растлумачыць некаторы паводзіны ці як рэч, каб растлумачыць нешта пытаць, можа быць мэтазгоднымі. Вядома, даведаўшыся пра ўнутраныя станах, задаючы пытанні можа быць праблематычным , таму што часам самі рэспандэнты не ведаюць пра сваіх унутраных станах (Nisbett and Wilson 1977) , (Nisbett and Wilson 1977) .

  • Сумарная хібнасць апытання (раздел 3.3)

Кіраўнік 1 з Groves (2004) робіць выдатную працу пагадніла часам супярэчлівыя тэрміналогіі , выкарыстоўваную даследчыкамі даследаванні , каб апісаць агульную структуру памылкі абследавання. Для кнігі даўжыні лячэння агульнай структуры памылак абследавання, см Groves et al. (2009) і Groves et al. (2009) , і гістарычны агляд см Groves and Lyberg (2010) .

Ідэя раскладання памылкі ў прадузятасці і дысперсіі таксама прыходзіць у машынным навучанні; глядзіце, напрыклад, раздзел 7.3 Hastie, Tibshirani, and Friedman (2009) . Гэта часта прыводзіць даследчыкаў казаць пра «дыяганальнае-дысперсійны» кампрамісам.

З пункту гледжання прадстаўлення, вялікая ўвядзенне да пытанняў неатрыманне і неатрыманне зрушэння з'яўляецца даклад Нацыянальнага даследчага савета ўлонне ў сацыяльных навук Surveys: праграмы даследаванняў (2013) . Іншы карысны агляд забяспечваецца Groves (2006) . Акрамя таго , цэлыя спецыяльныя выпускі часопіса афіцыйнай статыстыкі, Public Opinion Quarterly, і Аналы Амерыканскай акадэміі палітычных і сацыяльных навук былі апублікаваныя на тэму адсутнасці адказу. Нарэшце, ёсць на самой справе шмат розных спосабаў разліку хуткасці водгуку; гэтыя падыходы падрабязна апісаны ў дакладзе Амерыканскай асацыяцыі даследчыкаў грамадскай думкі (AAPOR) ( ??? ) .

Больш падрабязную інфармацыю аб 1936 Literary Digest апытання см Bryson (1976) , Squire (1988) , Cahalan (1989) , і Lusinchi (2012) . Для іншага абмеркавання гэтага апытання як прытча папярэджання супраць бессістэмнага збору дадзеных, см Gayo-Avello (2011) . У 1936 год Джордж Гэлап выкарыстаў больш складаную форму адбору і быў у стане вырабляць больш дакладныя ацэнкі з значна меншай выбаркай. Поспех Гэлапа над Literary Digest быў вяхой у развіцці агляднага даследавання , як апісана ў раздзеле 3 @ converse_survey_1987; кіраўнік 4 Ohmer (2006) ; і кіраўнік 3 @ igo_averaged_2008.

З пункту гледжання вымярэння, першы вялікі рэсурс для праектавання апытальнік Bradburn, Sudman, and Wansink (2004) . Для больш прасунутых метадаў лячэння, см Schuman and Presser (1996) , які спецыяльна засяроджаны на адносінах да пытанняў, і Saris and Gallhofer (2014) , які з'яўляецца больш агульным. Некалькі іншы падыход да вымярэння бяруцца ў психометрии, як апісана ў ( ??? ) . Больш падрабязна аб папярэднім тэставанні даступна ў Presser and Blair (1994) , Presser et al. (2004) і Presser et al. (2004) , і ў чале 8 Groves et al. (2009) і Groves et al. (2009) . Больш падрабязную інфармацыю аб эксперыментах апытання см Mutz (2011) .

З пунктам гледжання кошту, класічнай, кніга даўжынёй лячэннем кампрамісу паміж выдаткамі абследавання і памылкамі абследавання з'яўляецца Groves (2004) .

  • Хто спытаць (раздел 3.4)

Два лячэння класічнай кнігі даўжыня стандартнай імавернаснай выбаркі і ацэнак з'яўляюцца Lohr (2009) (больш ўступнага) і Särndal, Swensson, and Wretman (2003) (больш прасунутым). Класічнае лячэнне кніжнай даўжынёй паста-стратыфікацыя і звязаныя з імі метадамі з'яўляецца Särndal and Lundström (2005) . У некаторых умовах лічбавага ўзросту, даследчыкі ведаюць зусім няшмат пра не адказалі, што было не часта праўда ў мінулым. Розныя формы неатрыманне рэгулявання магчымыя , калі даследчыкі маюць інфармацыю аб ня адказалі, як апісана Kalton and Flores-Cervantes (2003) і Smith (2011) .

Даследаванне Xbox па W. Wang et al. (2015) і W. Wang et al. (2015) выкарыстоўвае метад , званы шматузроўневы Рэгрэсійная і постстратификация ( «Г - н П.») , што дазваляе даследчыкам ацаніць групу азначае , што нават калі ёсць шмат, шмат гуртоў. Хоць ёсць некаторыя дэбаты аб якасці адзнак ад гэтай тэхнікі, ён здаецца перспектыўным напрамак для вывучэння. Гэты метад быў упершыню выкарыстаны ў Park, Gelman, and Bafumi (2004) , і было наступнае выкарыстанне і абмеркаванне (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) . Больш падрабязнай інфармацыі пра сувязь паміж асобнымі вагамі і вагамі групы см Gelman (2007) .

Для іншых падыходаў да вагавых інтэрнэту - апытанняў, см Schonlau et al. (2009) і Schonlau et al. (2009) , Bethlehem (2010) , і Valliant and Dever (2011) . Онлайн панэлі можна выкарыстоўваць або верагоднасці выбаркі або выбаркі неверагоднасці. Больш падрабязную інфармацыю аб інтэрнэт - панэляў, см Callegaro et al. (2014) і Callegaro et al. (2014) .

Часам даследнікі выявілі , што ўзоры імавернасных і ўзоры , ня імавернасныя даюць ацэнкі аналагічнай якасці (Ansolabehere and Schaffner 2014) , але і іншыя параўнання выявілі , што ўзоры не-імавернасных зрабіць горш (Malhotra and Krosnick 2007; Yeager et al. 2011) і (Malhotra and Krosnick 2007; Yeager et al. 2011) . Адной з магчымых прычын гэтых адрозненняў у тым, што ўзоры не-імавернасных палепшыліся з цягам часу. Для больш песімістычных метадаў выбаркі неверагоднасці см Мэтавы група AAPOR па неверагоднасці Sampling (Baker et al. 2013) і (Baker et al. 2013) , і я таксама рэкамендую прачытаць каментар , які варта кароткага справаздачы.

  • Як спытаць (раздел 3.5)

Conrad and Schober (2008) уяўляе сабой адрэдагаваны пад назвай Envisioning Інвентарызацыйныя інтэрв'ю будучага, і прапануе розныя пункты гледжання аб будучыні задаваць пытанні. Couper (2011) разглядаюцца аналагічныя тэмы, і Schober et al. (2015) і Schober et al. (2015) прапануюць добры прыклад таго , як метады збору дадзеных, якія з улікам новай устаноўкі могуць прывесці да павышэння якасці дадзеных. Schober and Conrad (2015) прапануюць больш агульны аргумент аб працягу карэктаваць працэс агляднага даследавання , каб адпавядаць зменам у грамадстве.

Tourangeau and Yan (2007) Разгляд пытанняў прадузятасцяў сацыяльнай пажаданасці у адчувальных пытаннях, і Lind et al. (2013) і Lind et al. (2013) прапануюць некалькі магчымых прычыны , чаму людзі могуць раскрываць больш канфідэнцыйную інфармацыю ў кампутарным падпарадкаванні інтэрв'ю. Больш падрабязнай інфармацыі пра ролю чалавека інтэрв'юераў ў павышэнні ўзроўню ўдзелу ў апытаннях см Maynard and Schaeffer (1997) , Maynard, Freese, and Schaeffer (2010) , Conrad et al. (2013) і Conrad et al. (2013) , і Schaeffer et al. (2013) і Schaeffer et al. (2013) . Для больш абследаванняў у мяшаным рэжыме, см Dillman, Smyth, and Christian (2014) .

Stone et al. (2007) і Stone et al. (2007) прапануе кнігу даўжыню лячэння экалагічнай маментальнай ацэнкі і звязаныя з імі метадамі.

Для атрымання дадатковых рэкамендацый аб унясенні апыталі Глядзіце прыемны і каштоўны вопыт для ўдзельнікаў, азнаёміцца з работай па праектаванню метадзе заказуНаша (Dillman, Smyth, and Christian 2014) . Іншы цікавы прыклад выкарыстання Facebook прыкладанняў для даследаванняў у галіне сацыяльных навук, см Bail (2015) .

  • Даследаванні , звязаныя з вялікімі крыніцамі дадзеных (раздел 3.6)

Judson (2007) апісвае працэс аб'яднання абследаванняў і адміністрацыйных дадзеных у якасці «інфармацыйнай інтэграцыі» і абмяркоўваюцца некаторыя перавагі такога падыходу, а таксама прапануе некалькі прыкладаў.

Што тычыцца абагачаных пытацца, было шмат папярэдніх спробаў для праверкі галасавання. Для агляду гэтай літаратуры, см Belli et al. (1999) і Belli et al. (1999) , Ansolabehere and Hersh (2012) , Hanmer, Banks, and White (2014) , і Berent, Krosnick, and Lupia (2016) . См Berent, Krosnick, and Lupia (2016) для больш скептычны погляд з вынікаў , прадстаўленых у Ansolabehere and Hersh (2012) .

Важна адзначыць, што, хоць Ansolabehere і Херш былі натхнёныя якасцю дадзеных ад Catalist, іншыя ацэнкі камерцыйных пастаўшчыкоў былі менш энтузіязмам. Pasek et al. (2014) і Pasek et al. (2014) выявілі , дрэнная якасць , калі дадзеныя апытання параўноўвалі са спажывецкім файлам з Marketing Systems Group (якая сама па сабе зліліся разам дадзеныя з трох правайдэраў: Acxiom, Experian, і InfoUSA). Гэта значыць, файл дадзеныя не адпавядаюць адказах апытання, што даследчыкі, як чакаюцца, будуць правільна, файл спажывец меў адсутнічаюць дадзеныя для вялікай колькасці пытанняў, і які адсутнічае шаблон дадзеных карэлявалі з абвешчаным значэннем апытання (іншымі словамі, не хапае дадзеныя былі сістэматычнымі, а не выпадковым чынам).

Больш падрабязнай інфармацыі пра сувязь паміж гуказапісвальнымі абследаваннямі і адміністрацыйнымі дадзенымі, см Sakshaug and Kreuter (2012) і Schnell (2013) . Больш падрабязнай інфармацыі аб гуказапісвальнай сувязі ў цэлым, см Dunn (1946) і Fellegi and Sunter (1969) (гістарычных) і Larsen and Winkler (2014) (сучаснай). Аналагічныя падыходы былі таксама распрацаваны ў кампутарнай навуцы пад такія назвамі, як дедупликации дадзеных, ідэнтыфікацыя асобніка, супастаўленне імёнаў, выяўленне дублікатаў, і дубляваць запісы выяўлення (Elmagarmid, Ipeirotis, and Verykios 2007) . Ёсць таксама прыватнасць якія захоўваюць падыходаў да гуказапісвальнай сувязі , якія не патрабуюць перадач ідэнтыфікавалай інфармацыі (Schnell 2013) . Даследчыкі Facebook распрацавалі працэдуру імавернасна звязаць свае запісы на электаральнае паводзіны (Jones et al. 2013) і (Jones et al. 2013) . ; гэтая сувязь была зроблена , каб ацаніць эксперымент , які я вам распавяду ў частцы 4 (Bond et al. 2012) і (Bond et al. 2012) . Больш падрабязную інфармацыю аб атрыманні згоды на гуказапісвальнай сувязі, см Sakshaug et al. (2012) і Sakshaug et al. (2012) .

Іншы прыклад ўвязкі буйнамаштабнага сацыяльнага абследавання для дзяржаўных адміністрацыйных запісаў адбываецца ад аховы здароўя і пенсійнага абследавання і Адміністрацыі сацыяльнага забеспячэння. Больш падрабязнай інфармацыі аб дадзеным даследаванні, уключаючы інфармацыю аб працэдуры атрымання згоды см Olson (1996, 1999) .

Працэс аб'яднання многіх крыніц адміністрацыйных запісаў у майстар-файл дадзеныя працэсу, які Catalist выкарыстоўвае-часта сустракаецца ў статыстычных упраўленнях некаторымі нацыянальных урадаў. Два даследчыка з статыстыкі Швецыі напісаў падрабязную кнігу па гэтай тэме (Wallgren and Wallgren 2007) . У якасці прыкладу такога падыходу ў адным графстве ў Злучаных Штатах (Olmstead Каўнці, штат Мінесота; дома з клінікі Mayo), см Sauver et al. (2011) і Sauver et al. (2011) . Больш падрабязную інфармацыю аб памылках , якія могуць з'яўляцца ў адміністрацыйных запісаў, см Groen (2012) .

Іншым спосабам, у якім даследчыкі могуць выкарыстоўваць вялікія крыніцы дадзеных у агляднай даследаванні з'яўляецца ў якасці асновы выбаркі для людзей з пэўнымі характарыстыкамі. На жаль, гэты падыход можа выклікаць пытанні , звязаныя з прыватнасцю (Beskow, Sandler, and Weinberger 2006) .

Што тычыцца Узмацняецца пытацца, гэты падыход не так новыя, як гэта можа здацца з таго, як я апісаў. Яна мае глыбокія сувязі ў трох буйных абласцей статыстыкі: на аснове мадэлі пасля стратыфікацыі (Little 1993) , стаўлення (Rubin 2004) , а таксама адзнака невялікі плошчы (Rao and Molina 2015) . Гэта таксама звязана з выкарыстаннем сурагатных зменных у медыцынскіх даследаваннях (Pepe 1992) .

Кошт і час ацэнкі ў Blumenstock, Cadamuro, and On (2015) ставяцца больш да зменнай выдаткаў кошту аднаго дадатковага абследавання, і не ўключаюць у сябе фіксаваныя выдаткі , такія як кошт ачысткі і апрацоўкі дадзеных выклікаў. Увогуле, узмоцненыя запытаны будзе, верагодна, маюць высокія фіксаваныя выдаткі і нізкія зменныя выдаткі, аналагічныя лічбавыя эксперыменты (гл главу 4). Больш падрабязнай інфармацыі аб тэлефонных апытаннях на аснове мабільных ў краінах, якія развіваюцца, см Dabalen et al. (2016) і Dabalen et al. (2016) .

Для ідэй аб тым , як зрабіць ўзмацняецца з просьбай лепш, я рэкамендаваў бы больш даведацца пра множным стаўлення (Rubin 2004) . Акрамя таго , калі даследчыкі Doing ўзмацняецца з просьбай аб дапамозе агрэгаваных падлікаў, а не чорт індывідуальнага ўзроўню, то падыходы да King and Lu (2008) і Hopkins and King (2010) можа быць карысным. Нарэшце, каб даведацца больш аб машынным навучанні падыходах у Blumenstock, Cadamuro, and On (2015) , см James et al. (2013) і James et al. (2013) (больш ўводны) або Hastie, Tibshirani, and Friedman (2009) (больш прасунуты).

Адзін этычны пытанне аб Узмацняецца пытацца, што ён можа быць выкарыстаны , каб вывесьці адчувальныя рысы , якія людзі не маглі б выбраць , каб выявіць падчас апытання , як апісана ў Kosinski, Stillwell, and Graepel (2013) .

Powered by Open Review Toolkit

Buy The Book

Image of Bit by Bit cover Princeton University Press Amazon Barnes and Noble IndieBound