machinelearningmastery.ru

Машинное обучение, нейронные сети, искусственный интеллект
Header decor

Home

Ошибка и неопределенность в ценностях избирателей

Дата публикации Sep 20, 2018

За последние пару месяцевПаула Серриджнаписал два действительно здоровоблогсообщенийизучение взаимосвязи между ценностями избирателей, их голосованием на референдуме ЕС и схемой их голосования в более общем плане.Ник Барлоуимеетаналогичный постпро центризм и либеральные демоны, что тоже очень интересно. Если вы их еще не прочитали, они того стоят.

Я хотел бы остановиться на некоторых моментах Паулы, но более подробно расскажу о том, как мы измеряем ценности и отношение избирателей. В частности, я хотел бы сравнить итоговые ответы натеория ответа предмета (IRT)подходы. Я не буду вдаваться в подробности о том, как работает IRT. Если тебе интересно,эта книгаобеспечивает хорошее введение.

Оба подхода основаны на одной и той же проблеме: этодействительнотрудно измерить отношение. Как говорит Ник, просьба к респондентам самоидентифицироваться в левом-правом, аутентичном или любом другом масштабе полна проблем. Не в последнюю очередь, он предполагает уровень политической изощренности, которым некоторые могут не обладать, и игнорирует тот факт, что респонденты с большей вероятностью выбирают ценности в центре или в крайностях.

Чтобы решить эту проблему, разработчики опросов включают вопросы, которые, по их мнению, выступают в качестве прокси для того, что они пытаются измерить. Давайте возьмем авторитарно-либеральный спектр, который Паула обсуждает в качестве примера. Чтобы измерить это, BES спрашивает респондентов, насколько они согласны с пятью утверждениями по шкалам от«1. Категорически не согласен »в«5. Полностью согласен".Эти:

  1. Молодежи сегодня не хватает уважения к традиционным британским ценностям
  2. За некоторые преступления смертная казнь является наиболее подходящим
  3. Школы должны учить детей подчиняться власти
  4. Цензура фильмов и журналов необходима для соблюдения моральных норм
  5. Людям, нарушающим закон, должны быть вынесены более жесткие приговоры

Чаще всего мы получаем общую шкалу, просто суммируя эти ответы. Хотя это легко и часто дает достаточно хорошие результаты, у него есть две основные проблемы. Во-первых, это работает только тогда, когда респонденты ответили на все вопросы. Если это требует политической изощренности, мы рискуем исключить менее политически подкованных респондентов. Это, в свою очередь, может повлиять на наши результаты. Во-вторых, суммирование обрабатывает упорядоченные категориальные переменные так, как если бы они были метрическими, и предполагает, что все элементы вносят одинаковый объем информации для размещения респондентов на шкале интересов. Это предположение может быть приемлемым в некоторых случаях, но, скорее всего, это не тот случай, когда вопросы различаются по сложности или имеют искаженные модели ответов.

IRT использует другой подход. Он использует то, что составляет шикарную логистическую регрессию, чтобы найти каждого респондента в скрытой шкале. Таким образом, у IRT нет многих проблем, связанных с суммированием. Например, он может оценить размещение даже там, где респонденты не ответили на все вопросы. Это также позволяет различным элементам вносить различное количество информации в поиск респондентов. Но самое лучшее в IRT, на мой взгляд, это то, что она основана на моделях. Таким образом, он дает оценки, которыевероятностный, Это означает, что мы можем рассчитать не толькогдемы думаем, что кто-то сидит в масштабе, но такженасколько уверенмы о нашем расчете.


Некоторые эмпирические результаты

Чтобы сравнить суммирование и IRT, я провел три логистических регрессии, предсказывающих, что голосование в отпуске зависит от возраста, пола и места размещения избирателей. Модель 1 использует суммированные значения, модель 2 использует оценки из модели дифференцированного отклика (тип IRT), а модель 3 использует эти оценки плюс их погрешность измерения. Модели не достаточно надежны, чтобы появиться вАмериканский журнал политических наук, но достаточно для наших целей.

Включение погрешности измерения в эти модели обычно затруднительно, если не невозможно. К счастью,Rимеет отличныйbrmsпакет, который делает это возможным (и тоже легко!).brmsтакже имеет действительно отличную функцию для создания графиков предельных эффектов, которые я включил ниже. Чтобы упростить сравнение, я z-стандартизировал итоговую шкалу размещения auth-lib.

Предельные эффекты размещения шкалы auth-lib на вероятность голосования. Оставьте результаты, полученные с помощью суммированных влево ответов, оценки с центральным фактором из модели с оценкой по шкале, 3 - те же самые коэффициенты, плюс ошибка измерения.

Как видно из первого и второго графиков, между моделями, использующими суммированные значения и оценки IRT, очень мало различий. Изменение стандартного отклонения на 1 при размещении aut-lib в первой модели приводит к изменению коэффициента 1 log при голосовании по сравнению с изменением коэффициента log 1 во второй. Если на мгновение вернуться к реальному миру, это означает, что две модели предсказывают, что кто-то со значением auth-lib, равным 1, в 2,7 раза и в 2,9 раза с большей вероятностью проголосует, чем кто-либо со счетом 0, соответственно.

Однако включение ошибки в модель приводит к другому результату. Кривая не только круче, но и наша оценка также содержит гораздо больше неопределенности (как показано серой доверительной полосой). Как и следовало ожидать, более крутая кривая означает больший коэффициент. В этом случае модель предсказывает, что изменение стандартного отклонения на 1 при размещении auth-lib приводит к изменению коэффициента входа в 1.51. Таким образом, мы должны ожидать, что кто-то со значением auth-lib, равным 1, будет в 4,5 раза чаще голосовать за Leave, чем кто-либо со значением 0. Это довольно большая разница по сравнению с оценками предыдущих моделей и предполагает, что Размещение lib важнее, чем мы думали.

Эффект не только больше, но и значение R² для третьей модели также выше, что позволяет предположить, что в нем учитывается большая разница в голосовании. Модель 3 объясняет около 25% различий в голосовании за выход из ЕС, по сравнению с 21% и 20% для моделей 1 и 2 соответственно.


«Подведение итогов»

Моя точка зрения здесь не в том, чтобы проповедовать об измерении. Я считаю это очень важным, но, как я уже говорил ранее, суммированные значения часто достаточно хороши, и я никого не жалею за их использование. Тем не менее, я надеюсь, что эта короткая статья вдохновляет исследователей проявлять осторожность в отношении влияния, которое измерение может оказать на достоверность получаемых ими оценок.

Это особенно важно, когда речь идет о точности. Например, если ваша модель лежит в основе политического решения, вы можете подумать о том, чтобы выбрать что-то ближе к модели 3, которая использует всю доступную информацию. Это может быть трудоемким и немного более техническим, но может привести к более надежным оценкам. Если вы так склонны, возможно, стоит подумать и о более масштабных исследованиях. Вы никогда не знаете, если этот анализ будет чем-то необходимым, этот эффект может быть даже важнее, чем вы думали!

Оригинальная статья

Footer decor

© machinelearningmastery.ru | Ссылки на оригиналы и авторов сохранены. | map