January 2019

M T W T F S S
 123456
78 910111213
14 151617181920
21222324252627
28293031   

За стиль благодарить

Развернуть метки

No cut tags
Tuesday, September 10th, 2013 11:57 am
Оригинал взят у [livejournal.com profile] podmoskovnik в А вот кому гауссов? (комментировать лучше у автора)
Originally posted by [livejournal.com profile] eugenyboger at Традиционные графики по выборам мэра Москвы 8 сентября 2013 г.
Последние данные ЦИК по 3595 участкам.


  1. Самая интересная картинка: гистограмма распределения процента за Собянина, взвешенная на размер участка (графа 1 в протоколе). Если совсем просто, то для каждого значения процента за Собянина (ось X) по оси Y отложена общее списочное количество избирателей на участках, на которых получился соответствующий результат. Такое взвешивание позволяет корректно учитывать абсолютное влияние возможных фальсификаций, а так же исключить артефакты деления от маленьких чисел.
    Процент здесь и далее посчитан стандартным способом, используя общее количество найденных в урнах бюллетеней.

    Фит распределением гаусса.



    Выводы: гистограмма процента за Собянина просто прекрасно описывается нормальным распределением. Исключение составляет участок у правого хвоста распределения, где можно заметить превышение уровня над ожидаемым распределением. Т.к. гаусс - распределение симметричное и данные им неплохо описываются, то наиболее вероятное значение процента за Собянина приблизительно соответствует искомому среднему.

    Среднее значение модели в правом верхнем углу графика, находится в районе 51.0%. Значение очень незначительно меняется (сотые процента), если выкидывать из рассмотрения данные в районе подозрительного выброса справа (напомню, что это не означает исключения комиссий с большим процентом за Собянина из подсчёта результатов, они лишь не участвуют в построении модели, которая неплохо строится и по остальным данным).

    Объём фальсификаций в подсчёте итогов голосования, если они встречались локально, не превышает 0.5% по предварительной оценке.


  2. Взвешенное распределение явки, фит гауссом.


    Почти то же самое: незначительно превышение справа на хвосте.


  3. Двумерная взвешенная гисторамма: процент за Собянина от явки.



    Выводы: выглядит прилично, видна отрицательная корреляция процента за Собянина и явки. Чем больше приходило людей на участки, тем хуже был результат Собянина . Что подтверждает печальный факт: не все противники действующей власти были мобилизованы на выборы.
    Коэффициент корреляции в центральном регионе: -0.28.


  4. Фит слайсов (оно же profile) предыдущей картинки. Простыми словами: для каждого значения явки была построена гистограмма распределения процента голосов за Собянина. Эта гисторамма была зафитирована распределением гаусса. Среднее значение, получившееся в такого фита, отложено по оси Y.

    Красная линия - фит центрального региона прямой. Коэффициенты справа.

    Выводы: Угловой коэффициент -0.8 как бы намекает на масштаб эффекта.



Все данные, скрипты и картинки в репозитории https://github.com/evgeny-boger/rus-elections-stats/

Важный вывод из всего этого: товарищи эксперты, утверждавшие, что нормальное распределение не применимо для описания выборов вообще, российских выборов, московских выборов и т.д. очевидно окончательно оказались неправы. Именно так должны выглядеть графики для честных результатов голосования, хотя бы в масштабе одного региона. Стоит ли говорить, что на президентских и думских выборах всё выглядело немного не так.

Tuesday, September 10th, 2013 09:13 am (UTC)
конечно, просто сложней фальсифицировать, чтобы выглядело чисто.
Нужно вбрасывать с умом и максимально равномерно по участкам.
Tuesday, September 10th, 2013 09:27 am (UTC)
Не так уж и сложней.
Можно, например, вбрасывать не равномерно, просто неорганизованно.
Гауссиана плюс гауссиана равно почти гауссиана.
Tuesday, September 10th, 2013 09:33 am (UTC)
чтобы вбрасывать неравномерно по гауссиане требуется строгая организация, что не просто.
Tuesday, September 10th, 2013 09:50 am (UTC)
нет, отсутствие организации сделает вбросы видными, вбрасывать случайно человек не может ,не применяя рандомизатор типа хотя бы игральных костей.
Tuesday, September 10th, 2013 10:17 am (UTC)
Голосуют люди тоже неслучайно, без всякого рандомизатора.
Но в сумме получается гауссиана.
Tuesday, September 10th, 2013 10:37 am (UTC)
если число твоих сторонников достаточно велико, то ты получишь гауссиану, да.
но тогда ты выиграешь и честным путем.
Tuesday, September 10th, 2013 10:43 am (UTC)
это разумно, но все равно
дать приказ вмешаться, но при этом сделать это случайно очень сложно, каким образом задать дисперсию фальсификаций?
все равно будут ретивые, которые впишут сто?
а если сделать отсечку, то будет пик на ней.
Tuesday, September 10th, 2013 10:03 am (UTC)
т.е. гаусс может и будет (если еще удастся вбрасывать при бдительных наблюдателей),
но вбрасывать мало нельзя не будет эффекта, а много сложно и надо еще подделывать явку, а если разрешить вольницу, то разброс станет очень большим - появятся странный хвост
Если просто заниматься приписками, то все равно будут проблем с протоколами и последними и предпоследними цифрами, которые тоже ловятся.
Edited 2013-09-10 10:04 am (UTC)
Tuesday, September 10th, 2013 10:18 am (UTC)
Ну проколы с последними цифрами - это совсем топорная халтура.
Tuesday, September 10th, 2013 12:56 pm (UTC)
Именно плюс.
Но здесь ведь речь про горизонтальный плюс.
Если мы вбрасываем - то меняется количество голосов на каждом участке, а не появляются новые участки, на которых виден только вброс.
Tuesday, September 10th, 2013 01:18 pm (UTC)
Обычный, вертикальный плюс - это f(x) = f1(x) + f2(x). Он нам здесь ни к чему.
Здесь нужно сделать другое: взять случайную величину, распределенную по первому графику, добавить величину, распределенную по второму графику, и нарисовать график получившейся случайной величины.
Edited 2013-09-10 01:27 pm (UTC)
[identity profile] fortness90.myopenid.com (from livejournal.com)
Tuesday, September 10th, 2013 12:21 pm (UTC)
>Гауссиана плюс гауссиана равно почти гауссиана.

Какой шикарный бред ...
Tuesday, September 10th, 2013 12:57 pm (UTC)
Да, я наврал, получается ровно гауссиана.
Если сложить два гауссовых распределения - получается гауссово распределение со средним - суммой средних, и дисперсией - суммой дисперсий.
Tuesday, September 10th, 2013 01:13 pm (UTC)
Это верно для независимых случайных величин, а не для распределений.
Tuesday, September 10th, 2013 01:19 pm (UTC)
Мы же и складываем независимые случайные величины и получаем распределение их суммы.