Про метод Сулакшина
Mar. 17th, 2013 02:38 pmЯ решил повторить выкладки Сулашкина, только откладывая по оси Y количество голосов за ЕР.Получился вот такой мегаграфик:

Потом я тупо сфитил левые крылья гауссами и отложил среднее и дисперсию:

Точки произвольно сфитил еще одним гауссом с максимумом в нуле. Как и следовало ожидать, на маленьких участках за ЕР голосуют более, на больших - менее.
Но вот сами распределения довольно интересные. Вроде бы, если брать большие участки с количеством избирателей в пределах плюс-минус 100, то они расположены в основном в городах с относительно ровными пристрастиями, то есть ожидаемо иметь квази-гаусс, но никак не плато, а то и второй максимум. Тем не менее, имеем что имеем, с пиками на красивых процентах (как же без них).
Для сравнения нарисовал пару распределений для 2003 (точечки). На маленьких участках распределение попрежнему широкое, хотя его максимум сдвинулся с 57% на 41%, и почти пропало возрастание на высоких процентах. А вот на больших участках распределение стало гораздо более вменяемо. Нет, не Гаусс, но довольно близко -- и горизонтальная часть пропала.
Ну и вопрос: каким же образом разброс максимума распределения результатов голосования по участкам разного размера изменился с 2003 по 2011 год с 10% до 32%, т.е. втрое?
Так что может в подходе Сулакшина что-то и есть. Что никакими 22% за ЕР здесь и не пахнет, это и так было понятно, и обсуждать тут нечего.

Потом я тупо сфитил левые крылья гауссами и отложил среднее и дисперсию:

Точки произвольно сфитил еще одним гауссом с максимумом в нуле. Как и следовало ожидать, на маленьких участках за ЕР голосуют более, на больших - менее.
Но вот сами распределения довольно интересные. Вроде бы, если брать большие участки с количеством избирателей в пределах плюс-минус 100, то они расположены в основном в городах с относительно ровными пристрастиями, то есть ожидаемо иметь квази-гаусс, но никак не плато, а то и второй максимум. Тем не менее, имеем что имеем, с пиками на красивых процентах (как же без них).
Для сравнения нарисовал пару распределений для 2003 (точечки). На маленьких участках распределение попрежнему широкое, хотя его максимум сдвинулся с 57% на 41%, и почти пропало возрастание на высоких процентах. А вот на больших участках распределение стало гораздо более вменяемо. Нет, не Гаусс, но довольно близко -- и горизонтальная часть пропала.
Ну и вопрос: каким же образом разброс максимума распределения результатов голосования по участкам разного размера изменился с 2003 по 2011 год с 10% до 32%, т.е. втрое?
Так что может в подходе Сулакшина что-то и есть. Что никакими 22% за ЕР здесь и не пахнет, это и так было понятно, и обсуждать тут нечего.
no subject
Date: 2013-03-17 05:27 pm (UTC)Я понял метод Слукашина так. Он неявно, в том числе и для себя, предполагает, что наброс явки и за ЕР в виде числа голосов статичтически независим от рамера участка. Т.е. что на всех участках наброс в виде числа голосов был одинаковый. И ещё предполагает, что проценты партий не зависят от размера участка. Из этого получается, что данные надо фитить именно гиперболами, и честные проценты партий будут асимптотами гипербол.
Его модель, конечно, неправильная, потому что нет оснований считать, что на больших участках наброс в виде числа голосов такой же, как на мелких. Зато есть основания считать, что они будут разные. Я уж не говорю о том, что он фитит не матожидания, а наиболее вероятные (частые) значения, которые не аддитивны при сложении случайных величин. Ещё непонятно зачем он дублирует борьбу в набросами, сначала беря максимум распределения вместо среднего (т.е. отбрасывая правое крыло), а потом ещё своими гиперболами. Если действовать последовательно, надо было выбрать что-то одно.
no subject
Date: 2013-03-17 07:18 pm (UTC)1. голосование независимо от размера участка
2. на больших участках голосование честнее, поскольку закон больших чисел.
фитит он не гиперболами, а "степенными" функциями, причем параметры - чтобы определить, гипербола ли это - он не приводит. А когда гипербола не нравится, фитится полиномом.
no subject
Date: 2013-03-17 05:32 pm (UTC)А как определяли левые крылья? На 1200-1399 совсем не выглядит как фит левого крыла, если понимать под этим левее максимума, например.
no subject
Date: 2013-03-17 07:19 pm (UTC)более формализованно - брал правый предел около верхушки, плюс сажал оффсет на ноль (это естественно).
no subject
Date: 2013-03-17 07:56 pm (UTC)2. Для малых сельских участков трудно разделить усиление административного нажима и прямых фальсификаций. самый надежный источник данных - КОИБы, но хватит таких участков для оценки распределений по всей стране?
no subject
Date: 2013-03-17 08:16 pm (UTC)2. сходу не скажу.
no subject
Date: 2013-03-17 08:38 pm (UTC)no subject
Date: 2013-03-17 08:57 pm (UTC)но я понимаю, о чем вы: левый распределений немного круче, чем гаусс.
upd сделал некоторые фиты логнормом -- так, конечно, гораздо круче.
no subject
Date: 2013-03-18 06:55 am (UTC)no subject
Date: 2013-03-18 07:31 am (UTC)no subject
Date: 2013-03-18 08:04 am (UTC)no subject
Date: 2013-03-18 08:29 am (UTC)Иными словами, для Ельцина этот график шел бы по нарастающей. Для раннего Путина и ранней ЕР он был почти плоским. Теперь он сильно просел в правой части
no subject
Date: 2013-03-18 08:39 am (UTC)no subject
Date: 2013-03-18 09:19 am (UTC)А в левой части и в 2007-м рост мог быть больше, и в 2011-м не было спада. Если помнить, что правая часть графика у нас гуляет вверх-вниз, то рост левой части и рост наклона уже не так удивляют
no subject
Date: 2013-03-18 01:07 pm (UTC)С другой стороны, если предполагается, что правое плечо имеет какое-то неестественное происхождение, то это должно было отразиться на левом (оно должно было просесть и/или сдвинуться вправо, наверное)? Тогда надо оценку «истинного результата» ЕР еще занизить?
no subject
Date: 2013-03-18 01:23 pm (UTC)"Результат ЕР достиг дна и продолжил движение вниз"
no subject
Date: 2013-03-18 01:58 pm (UTC)А вообще вся эта история с докладом какая-то совсем неизящная.
Немного оффтопик: а Вы не знаете, где-нибудь существуют данные по переписанным протоколам с руэлект последние или канули?
no subject
Date: 2013-03-18 08:24 pm (UTC)Если не предполагать заранее, что на участках с низким честным результатом ЕР больше фальсифицируют, такой вывод сделать нельзя. Потому что в противоположном случае (когда на участках с разными честными результатами ЕР фальсифицируют одинаково часто) левое плечо просядет везде одинаково, его форма при этом не изменится. Это если не учитывать те участки, которые после фальсификации опять попали на левое плечо -- для достаточно крупных фальсификаций этот эффект не должен быть сильным.
Т.е. я хочу сказать, что из того, что появилось правое плечо не следует, что левое должно исказить форму. Независимо от протяжённости правого плеча. Искажение формы левого плеча может возникнуть из-за того, что на участках с низким % за ЕР чаще фальсифицируют. Так ли это в реальности я не знаю, но пока склоняюсь, что скорее нет. Если бы это было так, я бы ожидал ступеней на круглых процентах на левом плече, а их не видно.
Или если на это посмотреть со стороны организации фальсификаций, то сложно представить, что желание УИК фальсифицировать может зависеть от результата ЕР в области левого плеча. Если уж решили фальсифицировать, натягивали бы независимо от того, 20% или 30% у ЕР.
no subject
Date: 2013-03-19 06:47 am (UTC)no subject
Date: 2013-03-19 07:57 am (UTC)Для сдвига максимума от добавления широкого гаусса к исходному узкому я недавно получал выражение и оценивал: podmoskovnik.livejournal.com/163459.html?thread=1572739#t1572739 . Выражение работает, когда сдвиг оказывается меньше, чем ~0.7w -- потому что основано за замене x*exp(-x^2/2) на x, где x -- сдвиг в единицах w.
Про поводу распределения приписок за ЕР -- подозреваю, они должны неплохо коррелировать с результатом ЕР до приписок. Т.е. для низких сырых результатов ЕР эта гистограмма может оказаться сдвинутой дальше вправо.
no subject
Date: 2013-03-19 08:14 am (UTC)Я не очень понял откуда заранее известна доля участков, где какие-то чудеса происходили? Ну и вообще получается многовато допущений для точной оценки в любом случае.
Действительно, где меньше был исходный результат приписывали в среднем, кажется, больше (сейчас данные не под рукой, а готовой картинки нет, к сожалению). Но при этом все равно были участки где приписывали мало даже при маленьком результате (особенно с учетом того, что все регионы скопом взяты).
no subject
Date: 2013-03-19 08:45 am (UTC)Для масштаба фальсификаций в пределах одного города или одного ТИКа действительно скорее всего можно ожидать обратной зависимости от исходного результата: если партия вытягивается на определенный результат или просто результаты пишутся "с потолка", разница с реальными результатами окажется больше там, где партия власти менее популярна
Что же касается доли фальсифицируемых участков, то я не вижу оснований ожидать здесь обратную зависимость (и вообще какую-то явную зависимость) от электоральных предпочтений
no subject
Date: 2013-03-19 09:12 am (UTC)Доля фальсифицируемых участков в этом контексте нужна на входе для оценки смещения максимума распределения. А зависимость доли от электроальных предпочтений — это вообще непонятно как оценивать. По ТИКам? Или по регионам? Наверное, вообще особого смысла нет.
Level cheap tadalafil-tablets
Date: 2013-03-19 10:01 am (UTC)- [url=http://genericcialis-usa.com/#xoude-rus.livejournal.com]buy generic cialis online
[/url] canadian pharmacy cialis
http://genericcialis-usa.com/#62655 theodore roosevelts cialis
Это уже перебор 1
Date: 2013-03-23 04:22 am (UTC)