oude_rus: (Default)
[personal profile] oude_rus
Ну в общем ничего нового. 2000 и 2003 разумны, а дальше понеслось. И 2008 - это, конечно, песня, его в учебниках будут изучать.
На правой картинке показывается центр бина, а группировка идет внутри половины значения бина в каждую сторону, т.е. для 90% и 0.2% бина это будет участок 89.9..90.1%. Фурье спектр доказывает, что есть периодические пики с частотой 1% и 5%. Для вычисления количества голосов под пиками использовался стандартный алгоритм: берутся по два значения справа и слева от целочисленного пика (т.е. -0.4%, -0.2%, +0.2%, +0.4%), усредняются и вычитаются из величины пика. В итоге получается график с выбросами на целочисленных значениях (не показан), который потом интегрируется. Суммарные голоса довольно наглядны для демонстрации, на каком именно проценте начался набор голосов (т.е. появились целочисленные пики) и с какой скоростью происходил этот набор.

leader

years
UPD Добавил аналогичный анализ для участков с менее 1000 зарегистрированных избирателей. Эффект минимален, т.е. целочисленные пики не являются артефактами целочисленного деления.

Date: 2012-12-22 09:42 pm (UTC)
From: [identity profile] razbudili.livejournal.com
Подскажите неспециалисту, как группировались голоса? Т.е. 50,1% так и остается 50,1% или капает в столбик 50%? А 50,15% попадает в столбик 50,2%?

Date: 2012-12-22 09:51 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
правильное замечание, спасибо.
для 50% суммирование идет от 49.9% до 50.1%.
значения 50.1% быть не может: или 50.0%, или 50.2%.

Date: 2012-12-22 11:42 pm (UTC)
From: [identity profile] razbudili.livejournal.com
Спасибо, и еще один вопрос.

Я в самых общих чертах представляю что такое Фурье-спектр. Понимаю соответствие 5% цифре 0.2 на шкале. Но не могу понять что означает скачок в районе 2.0 на шкале? По идее это означает высокую частоту использования шага в 0,5%. Но Вы используете шаг 0,2%! А 0,5% из 0,2% целочисленными операциями никак не получить... Прошу объяснить.

Date: 2012-12-23 08:31 am (UTC)
From: [identity profile] oude-rus.livejournal.com
это вторая гармоника от 1%. Поскольку пики острые, они содержат основную частоту плюс кратные частоты (обертоны). Этот пик я показал специально, поскольку он показывает, что начальная функция имеет период в именно 1%.

Date: 2012-12-22 10:11 pm (UTC)
From: [identity profile] vit-r.livejournal.com
Прекрасно! Правый график самый говорящий.

Date: 2012-12-22 10:14 pm (UTC)
From: [identity profile] corbulon.livejournal.com
Хе-хе...
Хотелось бы знать, как бы выглядел 2012-ый год, не подними вы с Подмосковником хороший скандальчик. Куда там 2008-му...
"Эх, испортил песню, дурак"

Date: 2012-12-22 10:21 pm (UTC)
From: [identity profile] nibope.livejournal.com
Получается, что размах был набран еще при Вешнякове

Date: 2012-12-22 11:09 pm (UTC)
From: [identity profile] corbulon.livejournal.com
Дело Чурова, как и Вишнякова, - не замечать.
А волшебничают на местах и без ихнего руководства.

Date: 2012-12-22 11:10 pm (UTC)
From: [identity profile] kobak.livejournal.com
(i) Странно, что в 2012 получается больше, чем в 2011.

(ii) "Чеченские" пики 2011/12 на 99.5% не включаются в твой подсчет, верно? Потому что они не целочисленные?

(iii) Пятипроцентные пики-то пошире, чем 1%. Твой "четырехточечный" фильтр поэтому недооценивает их амплитуду. Надо будет потом попробовать разные фильтры.
Edited Date: 2012-12-22 11:10 pm (UTC)

Date: 2012-12-22 11:35 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
(и) почему странно, там же 1% пики включены теперь.
(ии) нет, не включаются. Я про это дело думал, но их включение разрушало бы цельность алгоритма.
(иии) пошире, факт. И недооценивает, тоже факт -- по Фурье это хорошо видно. Но больше точек-то нет.
я пытался делать "скользящую гребенку": на первом этапе удаляем все 1%-пики, сдвигаем центр фильтра на 0.2%, удалям эти пики и т.п. -- но все это приводит к крохам в кол-ве голосов, а описание сильно усложняет.

Date: 2012-12-23 08:25 am (UTC)
From: [identity profile] http://users.livejournal.com/leo_bonart_/
Сдается мне, что круглым пикам очень помогло введение традиции снятия губеров за плохой процент.

Date: 2012-12-23 11:16 am (UTC)
From: [identity profile] tov-y.livejournal.com
Всё это шикарно, но аппетит, как известно, приходит во время еды и всегда хочется большего. Нет ли желания сделать всё то же самое, но для круглого (кратного 100, 50 или даже 10) числа голосов за лидера? Плюс к тому, и то, и это - для явки?

Date: 2012-12-24 10:53 am (UTC)
From: [identity profile] oude-rus.livejournal.com
это все уже сделал corbulon.

Date: 2012-12-24 09:28 am (UTC)
From: [identity profile] shipilev.livejournal.com
Я тупой и не могу понять, почему в "Суммарные голоса на целочисленных процентах голосов" у функции... кхм... производная иногда меньше нуля? Это разве не побратим CDF, у которой f(x1) >= f(x2) iff (x1 >= x2)?

Date: 2012-12-24 10:38 am (UTC)
From: [identity profile] oude-rus.livejournal.com
Потому что статистически иногда выбросы бывают и вниз.

Это раз. Во-вторых, если речь идет про систематическое отклонение (сначала вниз, потом -- вверх), то это следствие линейного алгоритма аппроксимации: значение точки = среднему четырех соседей. По хорошему, надо было бы использовать квадратичную аппроксимацию, или, прости господи, сплайн. Возможно, так и надо делать, если все это переделывать -- меня же сейчас больше интересовала принципиальная возможность выделения 1%-пиков.

Date: 2012-12-24 10:56 am (UTC)
From: [identity profile] shipilev.livejournal.com
А, всё, понял. Я думал, что это бегущая сумма слева по всем голосам, а это бегущая сумма отклонений от локальной обстановки в каждой из точек.

Date: 2012-12-24 09:34 am (UTC)
From: [identity profile] shipilev.livejournal.com
Подумалось: было бы ещё элитнее рядом пририсовать фурье-спектр актуальной явки по участкам, чтобы показать, что это не эффекты квантования. Это вроде и так очевидно, судя по началу беспредела в 2004, но эта очевидность основывается на предположении о том же размере участков и том же jitter'е же посещаемости.

Date: 2012-12-24 10:45 am (UTC)
From: [identity profile] oude-rus.livejournal.com
1. рассчеты с явкой выложу сегодня.
2. я добавил часть годов отдельно для участков меньше 1000 зарегистрированных избирателей; изменения там минимальны.

Date: 2012-12-24 10:57 am (UTC)
From: [identity profile] shipilev.livejournal.com
Посмотрел, выглядит убедительно. Вот теперь бы ещё взять отдельный пик и на него аккуратно посмотреть, выделить там кластеры УИКов, которые ответственны за конкретный пик, и узнать, чем же они, чёрт возьми, так похожи. UPD: Помню, что кто-то что-то такое уже делал, но теперь-то можно из межгодовых данных вывалить кластера куда больше.
Edited Date: 2012-12-24 10:58 am (UTC)

Date: 2012-12-24 11:05 am (UTC)
From: [identity profile] oude-rus.livejournal.com
дык я и делал.
только теперь ужасно лень все делать вручную.
напиши скрипт!

Date: 2012-12-24 11:09 am (UTC)
From: [identity profile] shipilev.livejournal.com
Сорри, я тут вообще выпал из контекста. Дай данные, я попробую до НГ найти слот, чтоб поковыряться. (Я вообще-то обещал Подмосковнику выдрать все данные за десять лет напрямую из ЦИКа, но ручки-то вот они).

Date: 2012-12-24 02:40 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
http://oude-rus.livejournal.com/653892.html?thread=6206532#t6206532

Date: 2012-12-24 03:43 pm (UTC)
From: [identity profile] shipilev.livejournal.com
Я пока в фоне фикшу робота (он скачал без проблем 2008, 2007, 2004 и дальше запнулся на формате)... Смотри, что нашёл:
http://cikrf.ru/banners/vib_arhiv/
http://cikrf.ru/banners/vib_arhiv/gosduma/index.html
http://cikrf.ru/banners/vib_arhiv/president/index.html

Profile

oude_rus: (Default)
oude_rus

May 2026

S M T W T F S
     12
3456789
10111213 141516
17181920212223
24252627282930
31      

Style Credit

Expand Cut Tags

No cut tags
Page generated May. 25th, 2026 06:01 am
Powered by Dreamwidth Studios