oude_rus

(Чёртов Firefox умер и утащил с собой первую инкарнацию комментария.)

Я понял метод Слукашина так. Он неявно, в том числе и для себя, предполагает, что наброс явки и за ЕР в виде числа голосов статичтически независим от рамера участка. Т.е. что на всех участках наброс в виде числа голосов был одинаковый. И ещё предполагает, что проценты партий не зависят от размера участка. Из этого получается, что данные надо фитить именно гиперболами, и честные проценты партий будут асимптотами гипербол.

Его модель, конечно, неправильная, потому что нет оснований считать, что на больших участках наброс в виде числа голосов такой же, как на мелких. Зато есть основания считать, что они будут разные. Я уж не говорю о том, что он фитит не матожидания, а наиболее вероятные (частые) значения, которые не аддитивны при сложении случайных величин. Ещё непонятно зачем он дублирует борьбу в набросами, сначала беря максимум распределения вместо среднего (т.е. отбрасывая правое крыло), а потом ещё своими гиперболами. Если действовать последовательно, надо было выбрать что-то одно.

From:

его модель, как он объясняет, это
1. голосование независимо от размера участка
2. на больших участках голосование честнее, поскольку закон больших чисел.

фитит он не гиперболами, а "степенными" функциями, причем параметры - чтобы определить, гипербола ли это - он не приводит. А когда гипербола не нравится, фитится полиномом.

From:

> Потом я тупо сфитил левые крылья гауссами и отложил среднее и дисперсию:

А как определяли левые крылья? На 1200-1399 совсем не выглядит как фит левого крыла, если понимать под этим левее максимума, например.

From:

на глаз, если честно.
более формализованно - брал правый предел около верхушки, плюс сажал оффсет на ноль (это естественно).

From:

tsirel.livejournal.com

1. У меня ощущение, что более адекватным было бы какое-то асимметричное распределение, например, логнормальное.
2. Для малых сельских участков трудно разделить усиление административного нажима и прямых фальсификаций. самый надежный источник данных - КОИБы, но хватит таких участков для оценки распределений по всей стране?

From:

1. по-моему, это уже крохоборство: никакой логнорм не даст полочку.
2. сходу не скажу.

From:

tsirel.livejournal.com

1. речь не о полочке (ее происхождение, скорее всего, неестественное), а правом крыле - что-то такое в нем проглядывает

From:

в правом крыле, кроме полочки, ничего не проглядывает!

но я понимаю, о чем вы: левый распределений немного круче, чем гаусс.

upd сделал некоторые фиты логнормом -- так, конечно, гораздо круче.

Edited Date: 2013-03-17 09:26 pm (UTC)

From:

seyachaspomru.livejournal.com

Ничего не понял.

From:

Не понял фразу про рост разброса максимума с 10% до 32%. Можете пояснить для непонятливых?

From:

на нижнем графике разброс между маленькими и большими участками получается в 10% в 2003 и 32% в 2011.

From:

А, ну это на мой взгляд неудивительно. Влияние разной скорости или разных фаз изменений электоральных настроений. В городах: относительно высокая поддержка Ельцина -> вакуум в настроениях в конце 90-х -> быстрое принятие Путина -> нарастающее разочарование Путиным. На селе: поддержка коммунистов -> постепенное принятие Путина под воздействием зомбоящика и естественного вымирания старших поколений, и следующий этап еще практически не начался

Иными словами, для Ельцина этот график шел бы по нарастающей. Для раннего Путина и ранней ЕР он был почти плоским. Теперь он сильно просел в правой части

From:

все бы ничего, но график НЕ просел в правой части (он изменился, согласно вашему объяснению, только на 2-3%), а возвысился в левой на 20%.

From:

В правой части график тоже менялся - в том смысле, что в 2007-м он вырос, а потом обратно просел и по совпадению оказался на том же уровне, что и в 2003-м (на самом деле ниже, чем в 2003-м - но фальсификации "подправили" картинку)

А в левой части и в 2007-м рост мог быть больше, и в 2011-м не было спада. Если помнить, что правая часть графика у нас гуляет вверх-вниз, то рост левой части и рост наклона уже не так удивляют

From:

С одной стороны, если тут количество голосов, то опять распределение будет всегда перекошено (на нуле процентов за ЕР по определению всегда ноль, а на 100 — нет) и это считать чем-то неестественным, наверное, неправильно.
С другой стороны, если предполагается, что правое плечо имеет какое-то неестественное происхождение, то это должно было отразиться на левом (оно должно было просесть и/или сдвинуться вправо, наверное)? Тогда надо оценку «истинного результата» ЕР еще занизить?

From:

Какие люди!

"Результат ЕР достиг дна и продолжил движение вниз"

From:

Но правда, и то и то должно, по идее, влиять на положение максимума распределения.
А вообще вся эта история с докладом какая-то совсем неизящная.
Немного оффтопик: а Вы не знаете, где-нибудь существуют данные по переписанным протоколам с руэлект последние или канули?

From:

> если предполагается, что правое плечо имеет какое-то неестественное происхождение, то это должно было отразиться на левом (оно должно было просесть и/или сдвинуться вправо, наверное)?

Если не предполагать заранее, что на участках с низким честным результатом ЕР больше фальсифицируют, такой вывод сделать нельзя. Потому что в противоположном случае (когда на участках с разными честными результатами ЕР фальсифицируют одинаково часто) левое плечо просядет везде одинаково, его форма при этом не изменится. Это если не учитывать те участки, которые после фальсификации опять попали на левое плечо -- для достаточно крупных фальсификаций этот эффект не должен быть сильным.

Т.е. я хочу сказать, что из того, что появилось правое плечо не следует, что левое должно исказить форму. Независимо от протяжённости правого плеча. Искажение формы левого плеча может возникнуть из-за того, что на участках с низким % за ЕР чаще фальсифицируют. Так ли это в реальности я не знаю, но пока склоняюсь, что скорее нет. Если бы это было так, я бы ожидал ступеней на круглых процентах на левом плече, а их не видно.

Или если на это посмотреть со стороны организации фальсификаций, то сложно представить, что желание УИК фальсифицировать может зависеть от результата ЕР в области левого плеча. Если уж решили фальсифицировать, натягивали бы независимо от того, 20% или 30% у ЕР.

From:

Согласен, вероятность вмешательства в результат по идее может и не быть связана с результатом, но просядет-то плечо уж наверняка (пусть и равномерно). Но неизменность формы левого плеча, тем не менее, может быть обеспечена только если участки, куда что-то приписали всегда оказываются справа от максимума распределения, что совсем не обязательно так (вот, скажем, распределение объемов приписок за ЕР по протоколам с почившего руэлект http://jemmybutton.livejournal.com/pics/catalog/497/26642 , там видно что приписывают иногда даже совсем чуть-чуть). Ну и плюс, это в любом случае оказывает влияние на максимум распределения.

From:

С этим со всем я согласен. Я хотел привести аргументы, что изменение формы левого плеча, если оно есть, должно возникать не от выедания, а наоборот от добавления.

Для сдвига максимума от добавления широкого гаусса к исходному узкому я недавно получал выражение и оценивал: podmoskovnik.livejournal.com/163459.html?thread=1572739#t1572739 . Выражение работает, когда сдвиг оказывается меньше, чем ~0.7w -- потому что основано за замене x*exp(-x^2/2) на x, где x -- сдвиг в единицах w.

Про поводу распределения приписок за ЕР -- подозреваю, они должны неплохо коррелировать с результатом ЕР до приписок. Т.е. для низких сырых результатов ЕР эта гистограмма может оказаться сдвинутой дальше вправо.

From:

Да, правда. При условии что выедают равномерно.
Я не очень понял откуда заранее известна доля участков, где какие-то чудеса происходили? Ну и вообще получается многовато допущений для точной оценки в любом случае.
Действительно, где меньше был исходный результат приписывали в среднем, кажется, больше (сейчас данные не под рукой, а готовой картинки нет, к сожалению). Но при этом все равно были участки где приписывали мало даже при маленьком результате (особенно с учетом того, что все регионы скопом взяты).

From:

При обсуждении зависимости уровня фальсификаций от реального уровня поддержки партии власти надо учитывать, что уровень фальсификаций выражается двумя отдельными параметрами: долей фальсифицированных участков и масштабом фальсификаций

Для масштаба фальсификаций в пределах одного города или одного ТИКа действительно скорее всего можно ожидать обратной зависимости от исходного результата: если партия вытягивается на определенный результат или просто результаты пишутся "с потолка", разница с реальными результатами окажется больше там, где партия власти менее популярна

Что же касается доли фальсифицируемых участков, то я не вижу оснований ожидать здесь обратную зависимость (и вообще какую-то явную зависимость) от электоральных предпочтений

From: