Южная Америка Консультация о получении ПМЖ и Гражданства в Уругвае

Что говорят опросы в Мексике? Шейнбаум имеет 89% шансов на победу


Мексика 2024-03-17 01:43:01 Телеграм-канал "Новости Мексики"

Что говорят опросы в Мексике? Шейнбаум имеет 89% шансов на победу

По средним данным опросов, проведенных EL PAÍS, Клаудия Шейнбаум является ведущим кандидатом на пост президента Мексики, набрав почти 60 % голосов, опережая Ксочитля Гальвеса (36 %) и Хорхе Альвареса Майнса (5 %). За три месяца до голосования кандидат от Морены является твердым фаворитом. Но насколько велика вероятность ее победы? Чтобы ответить на этот вопрос, мы построили модель прогнозирования, аналогичную той, которую EL PAÍS использовал на выборах 2018 года и еще примерно на двадцати выборах в разных странах. Как объясняется в методологии, модель работает в три этапа: (1) мы исходим из среднего значения предыдущих опросов, (2) мы включаем определенную степень неопределенности вокруг него, в соответствии с исторической точностью опросов в Мексике, и (3) мы моделируем выборы 20 000 раз, чтобы рассчитать вероятность каждого результата. Согласно нашему прогнозу, Клаудия Шейнбаум имеет 89 % шансов на победу, а ее соперник Ксочитль Гальвес сохраняет шансы на сюрприз 1 к 10. Важно правильно интерпретировать эти коэффициенты. Шейнбаум - явный фаворит, и ее победа в десять раз вероятнее, чем победа Гальвеса, но события с вероятностью 11 % не являются невозможными. В качестве примера можно привести футбольную статистику: поражение Шейнбаума более вероятно, чем пробитие первых двух пенальти в серии. Эта газета уже публиковала предсказания такого рода на президентских выборах шесть лет назад. В нашем первом прогнозе, сделанном в марте 2018 года, вероятность победы Лопеса Обрадора составляла 79 %; в последнем, за несколько дней до выборов, его шансы были повышены до 97 %, предвосхищая то, что произошло позже. С осени опросы стали сокращать разрыв между Шейнбаумом и Гальвесом: с 32 пунктов в декабре до 24 сегодня. С одной стороны, очевиден рывок вперед для Гальвеса, совпавший с ослаблением позиций Movimiento Ciudadano - когда было объявлено, что его кандидатом станет Хорхе Альварес Майнес, а не Самуэль Гарсия, который казался фаворитом в ноябре. В то же время с января Шейнбаум демонстрирует небольшое снижение, в среднем с 62% до 60% голосов. В ближайшие недели мы будем следить за развитием этих тенденций, хотя Шейнбаум имеет значительный перевес. Такие модели, как наша, превращают опросы в прогнозы, используя дополнительную информацию: историческую точность опросов. Насколько велики их ошибки? Насколько вероятно, что они ошибаются на 5 или 15 пунктов? Чтобы выяснить это, мы проанализировали десятки опросов в Мексике и тысячи опросов в других странах. Опросы оказались верными на президентских выборах в Мексике в 2006 и 2012 годах, но в 2000 и 2018 годах они были более ошибочными. Хотя шесть лет назад они предсказывали победу Лопеса Обрадора, на самом деле они дали ему на шесть пунктов меньше, чем он получил, - а ошибка в шесть пунктов при других обстоятельствах может изменить результат. На этих четырех выборах опросы в среднем ошиблись на одного кандидата на 3,8 пункта - с учетом только тех, которые превысили 10 процентов голосов. Другими словами, отклонения в 4-5 пунктов были обычным явлением, а погрешность составляла около 9 пунктов. На выборах в законодательные органы власти в 2009, 2015 и 2021 годах результаты опросов были лучше: средняя погрешность составила 2,1 пункта, что является высокой точностью, схожей с точностью опросов в США или Испании. Однако, руководствуясь принципом предосторожности, мы использовали эти первые данные - 3,8 пункта ошибки - в качестве основы для нашей модели прогнозирования. Кроме того, наша методология увеличивает неопределенность в зависимости от времени, оставшегося до голосования. За три месяца до июньского голосования погрешность (при 90%) составляет около 16 пунктов для кандидата, набравшего около 50% голосов, следовательно, Шейнбаум имеет около 90% вариантов. Прогнозы составляются с помощью статистической модели, основанной на опросах и их исторической точности. Она похожа на те, что мы использовали в Испании в 2023 году и дважды в 2019 году, в Андалусии, Каталонии или Мадриде... . А также в Мексике шесть лет назад, во Франции или Великобритании. Модель работает в три этапа: 1) агрегирование и усреднение данных опросов, 2) учет ожидаемой неопределенности и 3) моделирование 20 000 выборов с расчетом вероятностей. Шаг 1. Усреднение опросов. Для повышения точности усреднения мы учитываем десятки опросов. Данные были собраны в основном сайтом Oraculus.mx. Среднее значение взвешивается, чтобы придать разный вес каждому опросу в зависимости от двух факторов: организатора опроса (фирмы без послужного списка имеют меньший вес; исключаются те, которые не публикуют свои данные в INE) и даты. Мы хотим придать больший вес недавним опросам при расчете среднего значения, и чтобы в последний день имели значение только последние, опубликованные каждым опросчиком. Для этого мы присваиваем веса опросам по экспоненциально убывающему закону. Мы также определяем полосу исключения, в которой игнорируются опросы старше 30 дней. Кроме того, мы наказываем повторные опросы от одного и того же опроса. При вычислении среднего значения по дате ближайший опрос каждого дома имеет вес один, но остальные их опросы практически игнорируются. Средние показатели, подобные нашим, можно рассматривать как консенсусную оценку. Вместо того чтобы полагаться на одного опросчика, они объединяют суждения и предположения многих. Средние показатели снижают уровень шума, предотвращая случайные скачки трендов вверх и вниз. И самое главное: доказано, что они повышают точность. Шаг 2. Учет неопределенности опроса. Это самый сложный и самый важный этап. Нам необходимо оценить ожидаемую точность опросов в Мексике. Насколько велики типичные ошибки? Насколько вероятны ошибки в 3, 5 или 15 пунктов? Чтобы ответить на эти вопросы, изучаются десятки опросов в Мексике и тысячи опросов за рубежом. Калибровка ожидаемых ошибок. Сначала я оценил погрешность опросов в Мексике. Я создал базу данных с опросами по семи выборам с 2000 года. Средняя абсолютная ошибка (MAE) средних показателей опросов в Мексике по кандидатам или партиям, учитывая тех, кто набрал более 10 % голосов, составила около 3,8 пункта на президентских выборах и 2,2 пункта на выборах в законодательные органы. Иными словами, отклонения в четыре-пять пунктов были обычным явлением, а погрешность (95 %) составляла около девяти пунктов. Поскольку семь выборов - слишком мало, чтобы делать серьезные выводы, мы также проанализировали около двадцати голосований в других странах Латинской Америки, где ошибка MAE составила 4,1 пункта. В итоге, следуя принципу предосторожности, я решил, что наша модель предполагает MAE в 3,8 пункта в Мексике. Более того, эта неопределенность модулируется с учетом двух дополнительных факторов: размера партии-кандидата (поскольку легче оценить голоса партии, если они составляют около 5 %, чем если они близки к 50 %) и близости выборов (поскольку опросы в конце срока почти всегда более точны). Для подгонки этой части модели я использовал базу данных Дженнингса и Влезиена, опубликованную в журнале Nature, и проанализировал ошибки 4 100 опросов на 241 выборах в 19 западных странах. Выбор типа распределения. Чтобы учесть неопределенность в голосовании за каждого кандидата от партии в каждой симуляции, я использую многомерное распределение. Вместо нормального распределения я использую t-распределение Стьюдента, так как оно имеет более длинные хвосты (эксцесс): это повышает вероятность возникновения экстремальных событий. Преимущества такого предположения объяснил Нейт Сильвер. Я оцениваю уровень эксцесса с помощью вышеуказанной базы данных. Затем я определяю ковариационную матрицу этих распределений так, чтобы сумма голосов не превышала 100 % (идея Криса Ханретти). Наконец, я масштабирую ширину ковариационных матриц так, чтобы полученные распределения голосов имели ожидаемые MAE и стандартное отклонение в соответствии с калибровкой. Шаг 3. Моделирование. Последний шаг состоит в запуске модели 20 000 раз. Каждая итерация представляет собой симуляцию выборов с процентами голосов, изменяющимися в соответствии с распределением, определенным на предыдущем шаге. Результаты этих симуляций позволяют рассчитать вероятности того, что каждый кандидат наберет наибольшее количество голосов и станет президентом. Почему опросы. Эта модель полностью основана на опросах. Бытует мнение, что опросы ненадежны, но правда в том, что опросы работают. Опросы редко бывают идеальными, но нет альтернативы, которая доказала бы, что она лучше. Подпишитесь на рассылку EL PAÍS Mexico и избирательный канал WhatsApp и получайте всю самую важную информацию о текущих событиях в этой стране.