Понеслись проценты по трубам
Dec. 22nd, 2012 10:23 pmНу в общем ничего нового. 2000 и 2003 разумны, а дальше понеслось. И 2008 - это, конечно, песня, его в учебниках будут изучать.
На правой картинке показывается центр бина, а группировка идет внутри половины значения бина в каждую сторону, т.е. для 90% и 0.2% бина это будет участок 89.9..90.1%. Фурье спектр доказывает, что есть периодические пики с частотой 1% и 5%. Для вычисления количества голосов под пиками использовался стандартный алгоритм: берутся по два значения справа и слева от целочисленного пика (т.е. -0.4%, -0.2%, +0.2%, +0.4%), усредняются и вычитаются из величины пика. В итоге получается график с выбросами на целочисленных значениях (не показан), который потом интегрируется. Суммарные голоса довольно наглядны для демонстрации, на каком именно проценте начался набор голосов (т.е. появились целочисленные пики) и с какой скоростью происходил этот набор.


UPD Добавил аналогичный анализ для участков с менее 1000 зарегистрированных избирателей. Эффект минимален, т.е. целочисленные пики не являются артефактами целочисленного деления.
На правой картинке показывается центр бина, а группировка идет внутри половины значения бина в каждую сторону, т.е. для 90% и 0.2% бина это будет участок 89.9..90.1%. Фурье спектр доказывает, что есть периодические пики с частотой 1% и 5%. Для вычисления количества голосов под пиками использовался стандартный алгоритм: берутся по два значения справа и слева от целочисленного пика (т.е. -0.4%, -0.2%, +0.2%, +0.4%), усредняются и вычитаются из величины пика. В итоге получается график с выбросами на целочисленных значениях (не показан), который потом интегрируется. Суммарные голоса довольно наглядны для демонстрации, на каком именно проценте начался набор голосов (т.е. появились целочисленные пики) и с какой скоростью происходил этот набор.


UPD Добавил аналогичный анализ для участков с менее 1000 зарегистрированных избирателей. Эффект минимален, т.е. целочисленные пики не являются артефактами целочисленного деления.
no subject
Date: 2012-12-22 09:42 pm (UTC)no subject
Date: 2012-12-22 09:51 pm (UTC)для 50% суммирование идет от 49.9% до 50.1%.
значения 50.1% быть не может: или 50.0%, или 50.2%.
no subject
Date: 2012-12-22 11:42 pm (UTC)Я в самых общих чертах представляю что такое Фурье-спектр. Понимаю соответствие 5% цифре 0.2 на шкале. Но не могу понять что означает скачок в районе 2.0 на шкале? По идее это означает высокую частоту использования шага в 0,5%. Но Вы используете шаг 0,2%! А 0,5% из 0,2% целочисленными операциями никак не получить... Прошу объяснить.
no subject
Date: 2012-12-23 08:31 am (UTC)no subject
Date: 2012-12-22 10:11 pm (UTC)no subject
Date: 2012-12-22 10:14 pm (UTC)Хотелось бы знать, как бы выглядел 2012-ый год, не подними вы с Подмосковником хороший скандальчик. Куда там 2008-му...
"Эх, испортил песню, дурак"
no subject
Date: 2012-12-22 10:21 pm (UTC)no subject
Date: 2012-12-22 11:09 pm (UTC)А волшебничают на местах и без ихнего руководства.
no subject
Date: 2012-12-22 11:10 pm (UTC)(ii) "Чеченские" пики 2011/12 на 99.5% не включаются в твой подсчет, верно? Потому что они не целочисленные?
(iii) Пятипроцентные пики-то пошире, чем 1%. Твой "четырехточечный" фильтр поэтому недооценивает их амплитуду. Надо будет потом попробовать разные фильтры.
no subject
Date: 2012-12-22 11:35 pm (UTC)(ии) нет, не включаются. Я про это дело думал, но их включение разрушало бы цельность алгоритма.
(иии) пошире, факт. И недооценивает, тоже факт -- по Фурье это хорошо видно. Но больше точек-то нет.
я пытался делать "скользящую гребенку": на первом этапе удаляем все 1%-пики, сдвигаем центр фильтра на 0.2%, удалям эти пики и т.п. -- но все это приводит к крохам в кол-ве голосов, а описание сильно усложняет.
no subject
Date: 2012-12-23 08:25 am (UTC)no subject
Date: 2012-12-23 11:16 am (UTC)no subject
Date: 2012-12-24 10:53 am (UTC)no subject
Date: 2012-12-24 09:28 am (UTC)no subject
Date: 2012-12-24 10:38 am (UTC)Это раз. Во-вторых, если речь идет про систематическое отклонение (сначала вниз, потом -- вверх), то это следствие линейного алгоритма аппроксимации: значение точки = среднему четырех соседей. По хорошему, надо было бы использовать квадратичную аппроксимацию, или, прости господи, сплайн. Возможно, так и надо делать, если все это переделывать -- меня же сейчас больше интересовала принципиальная возможность выделения 1%-пиков.
no subject
Date: 2012-12-24 10:56 am (UTC)no subject
Date: 2012-12-24 09:34 am (UTC)no subject
Date: 2012-12-24 10:45 am (UTC)2. я добавил часть годов отдельно для участков меньше 1000 зарегистрированных избирателей; изменения там минимальны.
no subject
Date: 2012-12-24 10:57 am (UTC)no subject
Date: 2012-12-24 11:05 am (UTC)только теперь ужасно лень все делать вручную.
напиши скрипт!
no subject
Date: 2012-12-24 11:09 am (UTC)no subject
Date: 2012-12-24 02:40 pm (UTC)no subject
Date: 2012-12-24 03:43 pm (UTC)http://cikrf.ru/banners/vib_arhiv/
http://cikrf.ru/banners/vib_arhiv/gosduma/index.html
http://cikrf.ru/banners/vib_arhiv/president/index.html