Все суета сует и всяческая суета
Jan. 11th, 2012 11:46 amНо даже суета бывает та или не та. Вот давайте о ней и поговорим протрезвевшим от праздников сознанием.
podmoskovnik выдал блестящую идею, обратив внимание на полезность т.н. "динамической явки", т.е. на изменение явки на каждом участке во время дня голосования. Оказывается, это явка считается несколько раз в день и официально выложена на сайте избиркома.
podmoskovnik мне любезно прислал файл данных по Нижнему Новгороду (безусловный хит нонешних выборов), который я немного покрутил с целью визуализации.
Начнем с простого: с распределений участков по явке в разное время дня:

Первая диаграмма (красный цвет) снята в 12 часов дня (т.е. сняты данные с 540 участков, диаграмму я сам по ним строил), вторая (синий) в 15 и т.д. Во-первых, видно, что распределения довольно аккуратненькие и прекрасно описываются - не побоюсь этого слова - гауссовой функцией. Со временем распределения становится шире и шире, посколько случйным событиям дается больше времени на "растаскивание" распределения. Так как сумма всех точек в распределении должна давать общее количество УИК, т.е. постоянную величину, расширение функции сопровождается уменьшением ее амплитуды. Можно довольно аккуратно определить центр распределения (т.е. наиболее вероятную явку в данное время), и отложить ее как функцию времени (график наверху). Опять-таки хорошо видно, что с утра явка меняется медленно (народ спит), к трем дня изменение явки раскочегаривается до максимальной скорости, а потом опять идет на убыль.
...пока не наступает 20 нуль-нуль, оно же время закрытия участка. Тут важно отметить, что динамическая явка, предоставляемая сайтом избиркома, ограничена 18:00, но явку на 20:00 легко вытащить из итоговых результатов -- ведь с момента закрытия участка в 20:00 протоколы не менялись, верно? Итак, в 20:00 наша красивая теория терпит крах: в распределении вдруг появляются два максимума, разнесенные процентов эдак на 28, то есть их не спутаешь. Максимум с меньшей явкой прекрасно вписывается в предыдущую теорию (см кривую наверху), а новый явно вываливается из тренда. Такое распределение, кстати, называется бимодальным, и теория говорит нам, что к нему приводят два различных фактора. Один фактор мы знаем - это обычный избиратель, а вот со вторым пока непонятно. Давайте назовем его "гиперактивным избирателем".
Чтобы понять, какова роль гиперактивного избирателя, можно использовать традиционный корреляционный анализ. Для этого я нарисовал положение каждого участка на плоскости "приращение явки за последние 2 часа" (а мы уже знаем, что есть приращение обычное, где-то на 6%, а есть - гиперактивное, аж на 33%) - процент голосов за партию (например, ЕР):

Собственно корреляция показана на средней картинке, а на двух сопроводительных - сумма всех участков с таким-то изменением явки (внизу) и суммой всех участков, которые проголосовали за партию (слева). То есть левую диаграмму мы уже видели (как вспомню, где, дам ссылку), и знаем, что она бимодальна (т.е. с двумя максимумами), но откуда они берутся, было неясно. Теперь же на корреляционной диаграмме ясно видно, что второй максимум происходит от участков с гиперактивным избирателем. Который, к слову, весьма щедр к ЕР, поскольку дает ей аж 48% заместо 31% на остальных участках.
Теперь можно сделать последний шаг. Из графика хорошо видно, что граница между нормальными и гиперактивными участками проходит по изменению явки где-то около 13% (это называется "параметр контраста"). То есть мы можем поделить все участки на обычные и гиперактивные, и изобразить их на стандарной корреляционной диаграмме %ЕР-явка:

Довольно наглядно видно, что второй кластер участков, который так щедро голосует за ЕР -- это и есть кластер гиперактивных участков. И такох участков немало - 153 из 540. Также интересно, что в гиперактивном кластере нет ни одного участка с электронным считывателем бюллетеней - КОИБ (зеленые крестики)
Разумеется, возникает вопрос: что это за гиперактивные участки такие, так благоволящие к ЕР? У меня есть теория, но я сначала хочу послушать вас. Давайте, предлагайте версии.
Начнем с простого: с распределений участков по явке в разное время дня:
Первая диаграмма (красный цвет) снята в 12 часов дня (т.е. сняты данные с 540 участков, диаграмму я сам по ним строил), вторая (синий) в 15 и т.д. Во-первых, видно, что распределения довольно аккуратненькие и прекрасно описываются - не побоюсь этого слова - гауссовой функцией. Со временем распределения становится шире и шире, посколько случйным событиям дается больше времени на "растаскивание" распределения. Так как сумма всех точек в распределении должна давать общее количество УИК, т.е. постоянную величину, расширение функции сопровождается уменьшением ее амплитуды. Можно довольно аккуратно определить центр распределения (т.е. наиболее вероятную явку в данное время), и отложить ее как функцию времени (график наверху). Опять-таки хорошо видно, что с утра явка меняется медленно (народ спит), к трем дня изменение явки раскочегаривается до максимальной скорости, а потом опять идет на убыль.
...пока не наступает 20 нуль-нуль, оно же время закрытия участка. Тут важно отметить, что динамическая явка, предоставляемая сайтом избиркома, ограничена 18:00, но явку на 20:00 легко вытащить из итоговых результатов -- ведь с момента закрытия участка в 20:00 протоколы не менялись, верно? Итак, в 20:00 наша красивая теория терпит крах: в распределении вдруг появляются два максимума, разнесенные процентов эдак на 28, то есть их не спутаешь. Максимум с меньшей явкой прекрасно вписывается в предыдущую теорию (см кривую наверху), а новый явно вываливается из тренда. Такое распределение, кстати, называется бимодальным, и теория говорит нам, что к нему приводят два различных фактора. Один фактор мы знаем - это обычный избиратель, а вот со вторым пока непонятно. Давайте назовем его "гиперактивным избирателем".
Чтобы понять, какова роль гиперактивного избирателя, можно использовать традиционный корреляционный анализ. Для этого я нарисовал положение каждого участка на плоскости "приращение явки за последние 2 часа" (а мы уже знаем, что есть приращение обычное, где-то на 6%, а есть - гиперактивное, аж на 33%) - процент голосов за партию (например, ЕР):
Собственно корреляция показана на средней картинке, а на двух сопроводительных - сумма всех участков с таким-то изменением явки (внизу) и суммой всех участков, которые проголосовали за партию (слева). То есть левую диаграмму мы уже видели (как вспомню, где, дам ссылку), и знаем, что она бимодальна (т.е. с двумя максимумами), но откуда они берутся, было неясно. Теперь же на корреляционной диаграмме ясно видно, что второй максимум происходит от участков с гиперактивным избирателем. Который, к слову, весьма щедр к ЕР, поскольку дает ей аж 48% заместо 31% на остальных участках.
Теперь можно сделать последний шаг. Из графика хорошо видно, что граница между нормальными и гиперактивными участками проходит по изменению явки где-то около 13% (это называется "параметр контраста"). То есть мы можем поделить все участки на обычные и гиперактивные, и изобразить их на стандарной корреляционной диаграмме %ЕР-явка:
Довольно наглядно видно, что второй кластер участков, который так щедро голосует за ЕР -- это и есть кластер гиперактивных участков. И такох участков немало - 153 из 540. Также интересно, что в гиперактивном кластере нет ни одного участка с электронным считывателем бюллетеней - КОИБ (зеленые крестики)
Разумеется, возникает вопрос: что это за гиперактивные участки такие, так благоволящие к ЕР? У меня есть теория, но я сначала хочу послушать вас. Давайте, предлагайте версии.
no subject
Date: 2012-01-11 11:10 am (UTC)Там же ясно давали рекомендацию: приходить за пол-часа до закрытия, обнаруживать себя уже проголосовавшим, начинать шабаш с понятыми и заламыванием рук.
Вот гиперактивный избиратель и попёр, как лосось на нерест, перед самым закрытием ловить за руку нечистоплотную оппаЗицию.
По графикам явно видно, что участки, которых избежала участь посещения гиперактивными гражданами, вполне укладываются в нАрмальное рОспределение. А вот гиперактивный избиратель - он такой... его в шинель функции не засунешь, в дугу не загнёшь!
no subject
Date: 2012-01-11 11:17 am (UTC)no subject
Date: 2012-01-11 11:36 am (UTC)кстати да :)
(no subject)
From:no subject
Date: 2012-01-11 12:29 pm (UTC)no subject
Date: 2012-01-11 11:38 am (UTC)no subject
Date: 2012-01-11 12:25 pm (UTC)no subject
Date: 2012-01-11 02:01 pm (UTC)То есть, не в конце.
no subject
Date: 2012-01-11 06:39 pm (UTC)no subject
Date: 2012-01-11 11:40 am (UTC)no subject
Date: 2012-01-11 12:29 pm (UTC)no subject
Date: 2012-01-11 12:40 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2012-01-11 07:17 pm (UTC)правильно ли я понял, что
Date: 2012-01-11 12:07 pm (UTC)Re: правильно ли я понял, что
Date: 2012-01-11 12:26 pm (UTC)no subject
Date: 2012-01-11 12:17 pm (UTC)no subject
Date: 2012-01-11 12:27 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:Да
From:(no subject)
From:(no subject)
From:(no subject)
From:Ожившая легенда
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2012-01-11 12:23 pm (UTC)no subject
Date: 2012-01-11 12:29 pm (UTC)no subject
Date: 2012-01-11 12:33 pm (UTC)no subject
Date: 2012-01-11 12:44 pm (UTC)no subject
Date: 2012-01-11 12:58 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:истинно так
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2012-01-11 01:14 pm (UTC)no subject
Date: 2012-01-11 01:30 pm (UTC)Мне разумеется отказали (официально - решением комиссии) в просмотре списков/книг избирателей, чтобы удостовериться, что кол-во подписей в этих книгах = офиц явке. Я бы там нашел на 350-400 подписей меньше.
И таких участков было много. Могу сказать, что в мск вы тоже увидите такие закономерности во многих районах. Вбрасывали плотно.
no subject
Date: 2012-01-11 01:49 pm (UTC)А кстати - как данные по явке передаются в ТИК? По телефону? И с какой частотой? Так, как в таблицах на izbirkom.ru (10, 12, 15 и 18 часов) или чаще?
(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2012-01-11 01:55 pm (UTC)Наблюдатель от ЕР, впрочем, убеждала меня что под конец голосования набежит народ, так сказать, локальный максимум, из тех, кто весь день работал, но поспешил исполнить гражданский долг. А девушка от КПРФ убеждала меня, что к вечеру подтянутся троллеры-интернет молодежь, которые за полчаса до конца придут проверить не проголосовал ли кто-то за них.
Но на самом деле ничего не случилось. После 18-00 можно было впадать в спячку.
По моим записям, в период 18:00 - 20:00 участок посетило 5.2% от общей явки.
По вашей записи еще хочу добавить - что очень красиво все сделано, лаконично и эстетично до дрожи сердечных струн. Можно сказать, я для себя взял несколько уроков оформления и подхода к статистическим исследованиям (я не профи).
no subject
Date: 2012-01-11 02:11 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2012-01-11 06:22 pm (UTC)no subject
Date: 2012-01-11 06:50 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2012-01-11 07:01 pm (UTC)no subject
Date: 2012-01-11 07:10 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:неприличный вопрос
Date: 2012-01-11 09:41 pm (UTC)Потому что у нас тут получается другое: http://lovim-vorov.livejournal.com/9473.html и непонятно - это такая питерская специфика или... глюк подсчётов... или?
... доли вообще не могут быть распределены по гауссу, строго говоря...
Re: неприличный вопрос
Date: 2012-01-11 10:05 pm (UTC)Если вы обратили внимание, я отнюдь не везде даю гаусс.
И уж совсем в мои намеренья не входит гауссосрач.
Re: неприличный вопрос
From:Re: неприличный вопрос
From:BestEarn.RU - научись зарабатывать уже сегодня! cv
Date: 2013-03-30 02:42 pm (UTC)Мы даем стабильный заработок! Не более 5 минут личного времени в день! Мы всё сделаем за вас! Вам остается только выводить деньги!
Свежайший способ заработка денег! От 100$ в месяц ничего не делая!
http://www.bestearn.ru/
Начни зарабатывать уже сегодня!