oude_rus: (Default)
[personal profile] oude_rus
Для тех, кто интересуется статистикой.
На картинке внизу попытка восстановления голосов на целочисленных пиках явки (2008 здесь как наиболее показательный, для отработки методики). Алгоритм восстановления стандартный: берутся по два значения справа и слева от пика, усредняются и вычитаются из величины пика. В итоге получается средний график с выбросами на целочисленных значениях. Третий грфик - интеграл от пиков, т.е. аккумулированные в пиках голоса при данной явке -- очень удобный для сравнения.

votes
(обратите внимание на разную шкалу по оси Y: 1.75 - это такое магическое число, при котором правые левые стороны распределений голосов vs явка становятся одинаковыми)

 Голоса за лидера накопливаются скачками (коричневая кривая), но это мы и так знаем. Проблема же вот в чем: суммарные голоса за не-лидера тоже накапливаются скачками (фиолетовая кривая). Причем где-то до 75% явки эти голоса вполне скалируются с лидером, с магическим коэффициентом 1.75. Я проверил также вклады Зюга и Жирика, они вполне скалируются с фиолетовой кривой, и дают ее в сумме (про Богдана можно забыть).

Как такое может быть в парадигме, что пики явки соответствуют желанию выдать на-гора красивое число?

1. Члены избиркома, добросив (это предположение такое) столько-то бюллетеней до красивого процента, мусоля карандаш, перераспределяют доброшенные голоса пропорционально между кандидатами -- иначе пик голосов был бы только на одном кандидате. Как-то в этот карандаш тяжело поверить.
2. Добрасываемые голоса засчтываются за определенную партию согласно желания избиркома. То есть, иными словами, где-то добрасывают за ер, а где-то - за комми. В итоге получается среднее по палате. Ну а после 75% явки крышу конкретно срывает, и там добросы идут за одного кандидата.
3. Есть какая-то неучтенная систематическая фигня. Какая?

Вопрос: что вы думаете по этому поводу? и как вообще можно проверить разные сценарии? у меня есть пара идей, но я хотел бы прежде выслушать общественость.

Давайте, не стесняйтесь. 

Date: 2012-12-20 10:31 pm (UTC)
From: [identity profile] kobak.livejournal.com
"магическое число, при котором правые стороны распределений голосов vs явка становятся одинаковыми" -- левые стороны, наверное?

Date: 2012-12-20 10:33 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
разумеется; это называется "топологический кретинизм".

Date: 2012-12-21 07:05 pm (UTC)
From: [identity profile] barouh.livejournal.com
Если смотреть с той стороны экрана, то это будут такие правые стороны распределений :)

Date: 2012-12-20 10:35 pm (UTC)
From: [identity profile] corbulon.livejournal.com
А ты можешь посмотреть графичек:
по одной оси высота пичка лидера, по другой оси - всех остальных.
Точек будет столько же, сколько и пиков, но можно посмотреть кривую и прикинуть корреляцию величин.

Date: 2012-12-20 10:42 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
не очень понятно, как это сделать практически.

Date: 2012-12-20 10:52 pm (UTC)
From: [identity profile] corbulon.livejournal.com
Взять ординаты с пары графиков, которые в середине (можно сначала только кратные 5).

Date: 2012-12-21 06:53 am (UTC)
From: [identity profile] oude-rus.livejournal.com
то есть обычный (не 3хмерный) график? это можно, но только ведь уже и так все видно.

Date: 2012-12-21 08:08 am (UTC)
From: [identity profile] corbulon.livejournal.com
Я имею в виду вот такой график

(Это 2008г, 5% бин)

Только нужен не вице-лидер как у меня, а как у тебя - все остальные.
И точки не через 5%, а через один.

Date: 2012-12-21 06:15 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
я сделал, но там нет ничего особенно интересного.

Date: 2012-12-21 06:22 pm (UTC)
From: [identity profile] corbulon.livejournal.com
На мой взгляд там только ответ - есть значимая корреляция или нет.
Но надо подумать о том, надо ли сравнивать одинаковые проценты, например по 80%?
Может быть как раз надо сравнивать 80% лидера и 20% остальных?
Вот и думаю...

Date: 2012-12-21 07:09 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
разумеется, но очевидной коррелюции нет.

Date: 2012-12-20 10:39 pm (UTC)
From: [identity profile] kobak.livejournal.com
По существу -- я не очень понимаю твое недоумение. Предположим, что на самом деле на всех участках у лидера одинаковый процент (скажем, 50%), но явка бывает сильно разная. На некоторых участках происходят вбросы до круглой явки (скажем, 75%), причем вбрасываются только бюллетени за лидера. В итоге некоторые участки с низкой явкой переезжают на явку 75%. Количество бюллетеней за лидера на явке 75% сильно возрастает (мы наблюдаем пик). Но количество бюллетеней за конкурентов на явке 75% тоже возрастает, т.к. там появляются дополнительные участки, -- т.е. мы тоже наблюдаем пик, но поменьше.

Разве не так?

Date: 2012-12-20 10:41 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
//Но количество бюллетеней за конкурентов на явке 75% тоже возрастает//

откуда, если по оси Y откладываются голоса, и вброс голосов идет только за лидера?

Date: 2012-12-20 10:49 pm (UTC)
From: [identity profile] kobak.livejournal.com
Пусть до вброса у нас есть 10 участков с явкой 74%, 10 участков с явкой 75% и 10 участков с 76%. Везде 1000 избирателей в списке, везде лидер набирает 50%. На гистограмме и у лидера, и у конкурентов на явке 74-76% будут значения 10*1000*0.74*0.5=3700, потом 3750 и 3800 бюллетеней.

Теперь происходит вброс: на одном участке с низкой явкой в 20% добрасывают за лидера до явки в 75%. По честному там 100 бюллетеней за лидера и 100 за конкурентов. Должны добросить до 750 бюллетеней, т.е. вбрасывают 550 за лидера. У него получается 650 бюллетеней, за конкурентов остается 100.

Т.е. на твоей гистограмме на 75% на диаграмме за лидера появится пик высотой в 650 бюллетеней, но на диаграмме за конкурентов тоже появится маленький пик высотой в 100.

Что не так?
Edited Date: 2012-12-20 10:51 pm (UTC)

Date: 2012-12-20 11:36 pm (UTC)
From: [identity profile] vasja-iz-aa.livejournal.com
допустим, что участков с настоящей явкой 70+ мало, а участков с явкой ~20% много, и значительное число их преступно переделывается в 75% ровно. тогда Ваши настоящие цифры 3700 и 3800 такими и останутся, а 3750 будет стремиться к 100

Date: 2012-12-20 11:40 pm (UTC)
From: [identity profile] vasja-iz-aa.livejournal.com
не так. средняя у них к ста будет стремиться, сумма будет расти

Date: 2012-12-21 06:57 am (UTC)
From: [identity profile] oude-rus.livejournal.com
так вроде все логично получается.
то есть для озабоченности нет причин?

и еще вопрос: а что из этого можно вытащить? например, график за других кандидатов линеен, а за лидера - нет. Может это быть следствием больших перемещений по процентам?

Что не так?

Date: 2012-12-21 12:49 pm (UTC)
From: [identity profile] sergeima.livejournal.com
Не так то, что предложенный механизм не сохраняет пропорцию лидер/остальные (магическое число 1.75), которая в реале сохранялась до 75%-ой явки. Даже после этого рубежа (75%), когда фиолетовая кривая начинает отставать, до где-то 85% она отстает медленнее, чем могла бы при предложенном сценарии. Потом, 1.75 мого и в реале не быть константой для всех явок до 100%.

Я думаю, что до 75% имела место реальная "мобилизация вверенного электората", каковой приходил, как просили, но голосовал как хотел, обспечивая наблюдаемые пики за конкурентов. Потом переходный диапазон 75-85%, когда на долю "мобилизации" приходился все более убывающий процент, а потом уже начиналось превалирование беспредела с географическим адресом (-ами).
Edited Date: 2012-12-21 04:59 pm (UTC)

Date: 2012-12-21 11:53 pm (UTC)
From: [identity profile] kobak.livejournal.com
А я там не вижу особенных пиков до 75% (а безусловные пики вообще начинаются с 80%). Есть пик на 72%, но это не особо круглое число, так что генезис этого конкретного пика мне не очень понятен.

Date: 2012-12-22 10:46 am (UTC)
From: [identity profile] barouh.livejournal.com
Я ориентируюсь на левый нижний график. По нему получается, что начиная с 60% появляются "избыточные" голоса в начале однопроцентных и пятипроцентных диапазонов. Я считаю нелогичным (противоречащим нашим представлениям о механизмах фальсификаций и о природе пиков на определенных показателях явки), что голоса в этом "избытке" распределяются между лидером и остальными кандидатами в той же пропорции, что и на более низких явках

Если бы пики образовывались за счет вброса голосов за одного кандидата, распределение голосов в этих пиках было бы смещено в его пользу

Date: 2012-12-21 03:44 pm (UTC)
From: [identity profile] barouh.livejournal.com
Не так то, что пик у "прочих" должен быть сильно меньше, чем пик у лидера. Должна нарушаться пропорция в 1/1,75. А она до определенного момента вопреки логике сохраняется

Сохранение пропорции было бы нормальным, если бы явку завышали чуть-чуть, "округляли" - в этом случае небольшое количество добрасываемых бюллетеней не влияли бы существенно на проценты кандидатов. Но мы же знаем, что весь правый хвост высокой явки по большей части ненормальный, и что круглая явка в основном получалась за счет масштабных вбросов


Date: 2012-12-21 11:53 pm (UTC)
From: [identity profile] kobak.livejournal.com
Ответил выше.

Date: 2012-12-20 10:51 pm (UTC)
From: [identity profile] nonenoun.livejournal.com
Так частота участков (и соотв-но, кол-во голосов) в данном бине возрастает. Это влияет не только на голоса лидера.

но вроде

Date: 2012-12-20 10:53 pm (UTC)
From: [identity profile] a-shen.livejournal.com
эти самые голоса смещаются на другие вертикали (сохраняя интеграл)?

Date: 2012-12-20 10:59 pm (UTC)
From: [identity profile] corbulon.livejournal.com
Посмотри еще число действительных бюллетеней, а не только голоса
Там тоже пички

Date: 2012-12-21 06:58 am (UTC)
From: [identity profile] oude-rus.livejournal.com
да ты вроде уже смотрел.

Date: 2012-12-21 08:17 am (UTC)
From: [identity profile] corbulon.livejournal.com
Неее. Только что сделал, могу показать, но Кобак уже все правильно объяснил.

Date: 2012-12-21 07:15 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
я не совсем понял, о чем это говорит.
это же и есть суммарные голоса (почти), которые я уже разбирал.
ну да, в них есть пики.

Date: 2012-12-21 07:23 pm (UTC)
From: [identity profile] corbulon.livejournal.com
Можно повозиться с тем, что все "придуманные" голоса попадают в действительные, и их не может быть в недействительныъ

Date: 2012-12-21 02:15 am (UTC)
crower: (Default)
From: [personal profile] crower
В общем, понятно, что пики на правом графике могут являться побочным эффектом от "перенесения" УИКов из низкоявочных бинов в высокоявочные, от приписки в том числе и в пользу левого графика с целью доведения явки до нужного процента.

Проведённая работа показывает куда они были приписаны и даже позволяет их оценить.
Но есть один нюанс.
В высокоявочные бины были приписаны УИКи из относительно низкоявочных бинов.
Поскольку последние выбирались случайно (точнее - они были распределены по низкоявочным бинам случайно), то и провалов мы не наблюдаем. По сути проседание это размазано.
В результате методика восстановления более менее откинула из высокоявочных бинов приписные голоса - но в большинстве своём вместе с настоящими, которые должны были бы находиться в относительно низкоявочных бинах. Одновременно она не смогла вычислить "пропажу" голосов (вместе у УИКами) из низкоявочных бинов. Что тут можно поделать чтобы компенсировать этот эффект, связанный со "случайным" изыманием и неслучайной припиской - пока слабо соображаю, но напрашивается что-то довольно трудоёмкое, с отсылкой на относительные голоса за кандидатов, вычисление количества (абсолютного и/или относительного) УИКов с приписками, и пропорционального перемещения части голосов из высокоявочных бинов в низкоявочные.

Если же попытаться оценить как-нибудь по-простому, то например, можно предположить что средняя нижнего левого графика должна быть около нуля. Если предположить, что "остальные" остались при своих голосах, им не приписывали и у них не отписывали, либо результат обоих процессов более-менее компенсировал друг-друга.
Тогда можно оценить на сколько следует прибавить к низкоявочным бинам и на сколько и с какой явки приписывали. На глаз - где-то около 0.2 млн.
Ну а дальше в голову опять приходят какие-то мудрёные методы восстановления формы распределения. Не могу отделаться от ощущения, что тут не хватает многомерных графиков. :)


UPD. Ерунду спорол. :) Нижний-же интегральная оценка. И кстати, провалы небольшие всё-таки видны.
Так вот если среднее среднего правого графика привести к нулю и (чтобы итог последнего графика пришёл к нулю), то получившееся отклонение можно бы и наложить на первый график.


PS. После того как исполнители вместо приписки до определённых процентов станут просто накидывать какое-то количество бюллетеней, "зубы" рассосутся и вычистить что-либо будет горааздо сложнее.
Edited Date: 2012-12-21 02:29 am (UTC)

Date: 2012-12-21 03:49 am (UTC)
From: [identity profile] nonenoun.livejournal.com
> "зубы" рассосутся и вычистить что-либо будет горааздо сложнее
А их и не надо вычищать. Зубы - это лишь статистически значимый признак фальсификаций, очистка ведётся другими методами. Например, анализируя СКО и корреляцию по методу barouh:
http://trv-science.ru/2012/02/28/sto-vosemdesyat-chestnykh-gorodov

Или можно сравнить результат на КОИБ и соседних участках. Понятно ведь, что круглый процент рисуют на небольшой доле участков - чаще просто перебрасывают сотню-другую бюллетеней от одной партии к другой.

Кстати, стоит сказать спасибо "рисовальщикам" круглых чисел - именно благодаря им мы имеем надёжные доказательства массовых фальсификаций :)

Date: 2012-12-21 05:10 am (UTC)
From: [identity profile] zametilprosto.livejournal.com
Я думаю, что никто ничего не добрасывает.

Человек мусолит не карандаш, а клавиатуру, вводя в систему красивые данные. Отсюда и круглые числы у претендентов. Нарисовав 75 лидеру остальные проще расписать как 15 и 10 (к примеру). Думать не надо. А вот если напишешь за одного 23.71, то о втором крен посчитаешь.

Кстати, давно хочу спросить. А у количество голосов на участке есть пики на круглых значениях? То есть участков где проголосовало тысячу человек больше, чем тех, на котором проголосовало 817?

Date: 2012-12-21 06:51 am (UTC)
From: [identity profile] nonenoun.livejournal.com
> А у количество голосов на участке есть пики на круглых значениях?
Разумеется. corbulon эту тему вдоль и поперёк исследовал:
http://trv-science.ru/2012/03/13/pro-arifmetiku-i-nemnozhko-pro-vybory

Date: 2012-12-21 07:23 am (UTC)
From: [identity profile] zametilprosto.livejournal.com
Спасибо! Замечательная статья.

Date: 2012-12-21 10:56 am (UTC)
From: [identity profile] tsirel.livejournal.com
М.б. два сценария вбрасывания до круглого числа.
1. Из УИКа звонят: "У нас получается явка 73,4%", "Ну вы хотя бы до 75% дотяните". Они вбрасывают еще 1,6 п.п., но это немного и на общее распределение голосов мало влияет.
2. Заранее требуют (или сами принимают повышенные обязательства) набрать 80 (85, 90 и т.д.) % явки. А реально явка процентов 50, тогда вбрасывается 30 п.п. и все (почти все?) за Медведева.
При этом:
- высокая "некруглая" явка тоже в основном липовая, но сделанная не такими идиотами, и, возможно, образованная меньшими приписками, т.е. 85,0% делалось, к примеру, из 45% в среднем, а 83,6% - из 55%.
- эти якобы "честные" 73,4% или 50% тоже включают в себя фальсификации, но те, кто меньше приписывал явку,
меньше приписывал и голоса Медведеву.

Date: 2012-12-21 11:46 am (UTC)
From: [identity profile] vit-r.livejournal.com
Красивые пики там, где смухлевали. А в этом случае красивый заданный процент выпишут не только кандидату, но и "правильной" оппозиции.

В частности, по сообщениям с мест, голоса за "неугодных" перебрасывали на победителя и коммунистов. С высокой точностью попадания в круглое число. (Что бы там не говорили защитники образования, посмотреть, что голоса распределились правильно, председатели могут только на достаточно правильном распределении. С количеством бюллетеней даже они понимают, а вот на красивость процентов внимания не обращают)

Я бы вообще выкинул пики и построил графики отдельно без них, а отдельно построил бы график только для пиков.

Date: 2012-12-21 01:35 pm (UTC)
From: [identity profile] jemmybutton.livejournal.com
А насколько слева и справа от предполагаемого пика берутся значения? Навроде (-0,75%;-0,25%) и (+0,25%;+0,75%)? И насколько сам пик широким считается?
Edited Date: 2012-12-21 01:36 pm (UTC)

Date: 2012-12-21 02:52 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
на картинке показывается центр бина, т.е. для 90% и 0.2% бина это будет участок 89.9..90.1%.
Две точки справа -- это значения функции в точках -0.4% и -0.2%, т.е. если в интервалах - то -0.5..-0.1%.
Пик считается шириной в 1 бин. Для 1%-пиков это нормальное приближение (на Фурье видно, что они прекрасно вычищаются). Для 5%-пиков - так себе (по Фурье опять-таки). По графику видно, что острые пики вычищаются, но остаются, как я их называю, "релаксационные осцилляции" (это из лазеров): на 5% идет подъем, а потом постепенная релаксация шириной где-то около процента.

Я пробовал подавлять также пики на 5% плюс бин -- разница есть, но небольшая.

Date: 2012-12-21 03:47 pm (UTC)
From: [identity profile] barouh.livejournal.com
Выше в комментариях я не согласился с тем, что это нормальный эффект. Но как объяснить - не знаю

Как гипотеза: а что если единственное реальное число - это количество проголосовавших, а списочную численность и явку подгоняли под эту цифру? Типа, у нас есть 350 бюллетеней, а с нас требуют явку 70% - так напишем, что всего избирателей 500...

Предположение безумное, но мало ли

А можно попросить график - доля голосов за "других" по бинам?
И конечно не терпится увидеть аналогичные картинки по другим выборам

Date: 2012-12-21 06:20 pm (UTC)
From: [identity profile] oude-rus.livejournal.com
я не понял, какой именно график нужен. Распределение "за других" нарисовано фиолетовым цветом.

по другим выборам все будет, но требует времени. Я же не скрипты пишу, а ручками все делаю.

Date: 2012-12-21 07:07 pm (UTC)
From: [identity profile] barouh.livejournal.com
я имел ввиду график, где будет не абсолютное количество голосов, а проценты - доля голосов "прочих" от общего количества голосов при данной явке

Profile

oude_rus: (Default)
oude_rus

May 2026

S M T W T F S
     12
3456789
10111213 141516
17181920212223
24252627282930
31      

Style Credit

Expand Cut Tags

No cut tags
Page generated May. 25th, 2026 06:02 am
Powered by Dreamwidth Studios