Дива -- не прочесть тайну
Jan. 19th, 2012 06:08 pmПро бимодальную динамику явки в Москве. После Н.Новгорода и Самары мы уже как-то поверили, что бимодальное распределение явки - это трололо и вообще очень интересно.
А в Москве, как известно, явка как раз бимодальная. Ну я и посмотрел, что у нас будет в течение дня:

Зеленые точки - это как раз обещанная бимодальная официальная явка на 20:00. Бимодальность, конечно, не очень выражена, но любой спектроскопист вам скажет, что тут две линии. Но вот какая незадача: на 18:00 явка... опять бимодальная. И на 15:00. И на 12:00. И даже на 10:00 видно небольшое крылушко.
Но - еще раз - конраста, чтобы ясно разделить два распределения, не хватает, поэтому придется немного помоделировать. Первая идея - а давайте сфитим линии двумя гауссами - не проходит, поскольку параметры одного гаусса могут компенсироваться параметрами другого. Фит нестабилен; нужны дополнительные условия. Я взял такие:
а). Есть два суб-ансамбля участков, которые голосуют с разной скоростью
б). Между суб-ансамблями нет перемешивания, т.е. полное количество участков внутри одного суб-ансамбля не меняется со временем
в). Фитуются все кривые одновременно (глобальный фит)
Результаты показаны на рисунке сплошными линиями. Получилось неожиданно (для меня) неплохо, посколько обычно подобные фиты норовят-таки разъехаться (а я их очень много переделал).
Теперь мы можем взять положение каждого гаусса во времени (что дает наиболее вероятную явку) и отложить ее как функцию времени, вместе со стандартным отклонением (рисунок наверху в углу). И - страшное дело - два суб-ансамбля выборщиков прекрасно прослеживаются с самого утра. Обычные избиратели имеют явку где-то 5% в час (примерно как в Н.Новгороде), активные - около 6.5%. Зависимости -- если не считать наклона -- примерно одинаковые, с разницей между ними, которая растет примерно линейно со временем. И да, мы уже знаем, что активные избиратели в основном голосуют за любимую партию, но в Москве они это делают не в последние 2 часа, а в течение всего дня.
Я, кстати, проверил гипотезу "выбросов" -- т.е. когда, например, с 10 до 12 на участке идет большой скачок явки, а потом явка замедляется до обычных 5% в час. Если таких скачков много и они происходят в разные времена, то они размажутся, и получится плавная кривая с увеличенным наклоном. Так вот, ничего, голимый ноль: скачки есть, но они ни с чем не коррелированы.
UPD Добавил распределения по участкам с КОИБами (тоненькие линии). В общем, мало что прояснилось. Они, конечно, тяготеют к низкой явке, но не совсем. Если посмотреть на средние (тут я просто считал первый момент, без фита), то на 15:00 явка аккурат посередке (звездочки), и понятно, из-за чего -- из-за длинного хвоста. А вот на 20:00 явка нормализуется, и почти совпадает с "медленными" уиками.
Как внутри огромной Москвы могли оказаться два четко выраженных типа избирателя, я не понимаю. Было бы одномодальное распределение, пусть и широкое, и не гауссовое, -- было бы понятно, а так -- нет. Что же это за два типа избирателя? Прямо тайна какая-то. Есть идеи?
А в Москве, как известно, явка как раз бимодальная. Ну я и посмотрел, что у нас будет в течение дня:
Зеленые точки - это как раз обещанная бимодальная официальная явка на 20:00. Бимодальность, конечно, не очень выражена, но любой спектроскопист вам скажет, что тут две линии. Но вот какая незадача: на 18:00 явка... опять бимодальная. И на 15:00. И на 12:00. И даже на 10:00 видно небольшое крылушко.
Но - еще раз - конраста, чтобы ясно разделить два распределения, не хватает, поэтому придется немного помоделировать. Первая идея - а давайте сфитим линии двумя гауссами - не проходит, поскольку параметры одного гаусса могут компенсироваться параметрами другого. Фит нестабилен; нужны дополнительные условия. Я взял такие:
а). Есть два суб-ансамбля участков, которые голосуют с разной скоростью
б). Между суб-ансамблями нет перемешивания, т.е. полное количество участков внутри одного суб-ансамбля не меняется со временем
в). Фитуются все кривые одновременно (глобальный фит)
Результаты показаны на рисунке сплошными линиями. Получилось неожиданно (для меня) неплохо, посколько обычно подобные фиты норовят-таки разъехаться (а я их очень много переделал).
Теперь мы можем взять положение каждого гаусса во времени (что дает наиболее вероятную явку) и отложить ее как функцию времени, вместе со стандартным отклонением (рисунок наверху в углу). И - страшное дело - два суб-ансамбля выборщиков прекрасно прослеживаются с самого утра. Обычные избиратели имеют явку где-то 5% в час (примерно как в Н.Новгороде), активные - около 6.5%. Зависимости -- если не считать наклона -- примерно одинаковые, с разницей между ними, которая растет примерно линейно со временем. И да, мы уже знаем, что активные избиратели в основном голосуют за любимую партию, но в Москве они это делают не в последние 2 часа, а в течение всего дня.
Я, кстати, проверил гипотезу "выбросов" -- т.е. когда, например, с 10 до 12 на участке идет большой скачок явки, а потом явка замедляется до обычных 5% в час. Если таких скачков много и они происходят в разные времена, то они размажутся, и получится плавная кривая с увеличенным наклоном. Так вот, ничего, голимый ноль: скачки есть, но они ни с чем не коррелированы.
UPD Добавил распределения по участкам с КОИБами (тоненькие линии). В общем, мало что прояснилось. Они, конечно, тяготеют к низкой явке, но не совсем. Если посмотреть на средние (тут я просто считал первый момент, без фита), то на 15:00 явка аккурат посередке (звездочки), и понятно, из-за чего -- из-за длинного хвоста. А вот на 20:00 явка нормализуется, и почти совпадает с "медленными" уиками.
Как внутри огромной Москвы могли оказаться два четко выраженных типа избирателя, я не понимаю. Было бы одномодальное распределение, пусть и широкое, и не гауссовое, -- было бы понятно, а так -- нет. Что же это за два типа избирателя? Прямо тайна какая-то. Есть идеи?
Re: Двугорбая Москва
Date: 2012-01-20 05:09 pm (UTC)гораздо полезней решить обратную задачу.
Re: Двугорбая Москва
Date: 2012-01-20 05:25 pm (UTC)Целью построения подобных моделей является получение истинного распределения явки, а в дальнейшем - реальных результатов голосования.
В данном случае я показываю, что поиск неких гипотетических различных классов избирателей не требуется. Их нет. Вся бимодальность (а на самом деле многомодальность) вполне объясняется различным количественным многообразием вброса на отдельных (совершенно однородных в остальном) избирательных участках.
Re: Двугорбая Москва
Date: 2012-01-20 06:45 pm (UTC)поэтому это не очень интересно (мне).
Re: Двугорбая Москва
Date: 2012-01-20 07:00 pm (UTC)Я предложил вам простое объяснение, не требующее привлечения иррациональных рассуждений о наличии разных классов избирателей (хотя с философской точки зрения привлечённых людей, голосующих пачками по 10 заполненных за ЕР бюллетеней, как и председателей ТИКОв, приписывающих ЕР по 100, 200, 300 и более бюллетеней, вполне можно считать сверхактивной группой избирателей, поддерживающей ЕР).
Жаль, что у вас не нашлось возражений по существу.
Re: Двугорбая Москва
Date: 2012-01-20 07:54 pm (UTC)Re: Двугорбая Москва
Date: 2012-01-20 08:20 pm (UTC)Re: Двугорбая Москва
Date: 2012-01-21 11:56 am (UTC)Но возможность объяснения чего-то фальсификациями все же не дает право отказаться от поиска других вариантов объяснения
Re: Двугорбая Москва
Date: 2012-01-21 02:56 pm (UTC)Альтернативные версии, конечно же, имеют право на существование. Но если есть простое, логичное и подтверждаемое выкладками объяснение, то смысла строить умозрительные конструкции вроде бы уже и нет. Или хотя бы сначала следует опровергнуть предложенное простое объяснение.
Особой сложности переписать протоколы некоторых комиссий в ТИКах, вписав 300 голосов за ЕР, попутно развалив распределение явки на два горба, на мой взгляд, особой трудности не представляет. Для этого всего лишь потребуется хорошее прикрытие тогда, когда выяснится различие протоколов наблюдателей с цифрами, обнародованными на сайте Центризбиркома, поскольку такое действие уголовно наказуемо.