А вот кому гауссов? (комментировать лучше у автора)
Оригинал взят у
podmoskovnik в А вот кому гауссов? (комментировать лучше у автора)
![[livejournal.com profile]](https://www.dreamwidth.org/img/external/lj-userinfo.gif)
Originally posted by
eugenyboger at Традиционные графики по выборам мэра Москвы 8 сентября 2013 г.
![[livejournal.com profile]](https://www.dreamwidth.org/img/external/lj-userinfo.gif)
Последние данные ЦИК по 3595 участкам.
Все данные, скрипты и картинки в репозитории https://github.com/evgeny-boger/rus-elections-stats/
Важный вывод из всего этого: товарищи эксперты, утверждавшие, что нормальное распределение не применимо для описания выборов вообще, российских выборов, московских выборов и т.д. очевидно окончательно оказались неправы. Именно так должны выглядеть графики для честных результатов голосования, хотя бы в масштабе одного региона. Стоит ли говорить, что на президентских и думских выборах всё выглядело немного не так.
- Самая интересная картинка: гистограмма распределения процента за Собянина, взвешенная на размер участка (графа 1 в протоколе). Если совсем просто, то для каждого значения процента за Собянина (ось X) по оси Y отложена общее списочное количество избирателей на участках, на которых получился соответствующий результат. Такое взвешивание позволяет корректно учитывать абсолютное влияние возможных фальсификаций, а так же исключить артефакты деления от маленьких чисел.
Процент здесь и далее посчитан стандартным способом, используя общее количество найденных в урнах бюллетеней.
Фит распределением гаусса.
Выводы: гистограмма процента за Собянина просто прекрасно описывается нормальным распределением. Исключение составляет участок у правого хвоста распределения, где можно заметить превышение уровня над ожидаемым распределением. Т.к. гаусс - распределение симметричное и данные им неплохо описываются, то наиболее вероятное значение процента за Собянина приблизительно соответствует искомому среднему.
Среднее значение модели в правом верхнем углу графика, находится в районе 51.0%. Значение очень незначительно меняется (сотые процента), если выкидывать из рассмотрения данные в районе подозрительного выброса справа (напомню, что это не означает исключения комиссий с большим процентом за Собянина из подсчёта результатов, они лишь не участвуют в построении модели, которая неплохо строится и по остальным данным).
Объём фальсификаций в подсчёте итогов голосования, если они встречались локально, не превышает 0.5% по предварительной оценке. - Взвешенное распределение явки, фит гауссом.
Почти то же самое: незначительно превышение справа на хвосте. - Двумерная взвешенная гисторамма: процент за Собянина от явки.
Выводы: выглядит прилично, видна отрицательная корреляция процента за Собянина и явки. Чем больше приходило людей на участки, тем хуже был результат Собянина . Что подтверждает печальный факт: не все противники действующей власти были мобилизованы на выборы.
Коэффициент корреляции в центральном регионе: -0.28. - Фит слайсов (оно же profile) предыдущей картинки. Простыми словами: для каждого значения явки была построена гистограмма распределения процента голосов за Собянина. Эта гисторамма была зафитирована распределением гаусса. Среднее значение, получившееся в такого фита, отложено по оси Y.
Красная линия - фит центрального региона прямой. Коэффициенты справа.
Выводы: Угловой коэффициент -0.8 как бы намекает на масштаб эффекта.
Все данные, скрипты и картинки в репозитории https://github.com/evgeny-boger/rus-elections-stats/
Важный вывод из всего этого: товарищи эксперты, утверждавшие, что нормальное распределение не применимо для описания выборов вообще, российских выборов, московских выборов и т.д. очевидно окончательно оказались неправы. Именно так должны выглядеть графики для честных результатов голосования, хотя бы в масштабе одного региона. Стоит ли говорить, что на президентских и думских выборах всё выглядело немного не так.
no subject
Не может ли это означать, напротив, что "противники действующей власти" не были распределены по городу равномерно?
(no subject)
(no subject)
no subject
Зависит от того, как фальсифицировать.
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
no subject
(no subject)