[identity profile] kondybas.livejournal.com 2012-06-09 02:13 pm (UTC)(link)
Ленту порвало

[identity profile] taki-net.livejournal.com 2012-06-09 09:05 pm (UTC)(link)
Странно, но уменьшил картинку.

[identity profile] svilar.livejournal.com 2012-06-10 02:08 am (UTC)(link)
Алик, раз уж Вы сделали репост, может хоть Вы ответите на вопрос, который там задают Киреев и Подмосковник, а ответа так и не получают: "Что здесь не так"?

[identity profile] taki-net.livejournal.com 2012-06-10 09:18 am (UTC)(link)
Не то чтобы не получают, а выясняется (тссс), что наши представления о том, какие "необычные" цифры говорят о фальсифкации, а какие о естественном социальном и географическом феномене - покоятся на экспертной оценке. Недавно тоже была (с похожим составом участников) дискуссия про выборы в Мексике: публикатор обнаружил невероятное значение некоего показателя, говорящее о тотальной фальсификации куда бОльшего масштаба. В ходе дискуссии показатель увял до совершенно разумных значений.

На момент публикации ссылки я полагал (неверно проинтерпретировав расположение пика на графике), что речь идет о точном сходстве картин голосования 1996 и 2011 (пики на "красивых" процентах). Последовавшая дискуссия скорее опровергла этот пункт и выявила несравненно более важную вещь, о которой я писал в начале коммента: у нас нет чисто математических критериев интерпретации "несколько необычных" данных.

Пожалуй, напишу об этом отдельно.

[identity profile] gomberg.livejournal.com 2012-06-13 12:05 am (UTC)(link)
А где было про Мексику? Я пропустил.

"Чисто математических" критериев тут быть не может, естественно. В конечном итоге, с помощью данных всегда тестируется некая модель того, откуда они взялись. Всякие странности часто имеют вполне разумное и легальное объяснение - иногда оно очевидно всем, иногда только эксперту. Такое объяснение становится частью модели - и странности перестают быть странностями.

Возмущаться мы начинаем тогда, когда разумных объяснений не остается.

[identity profile] gomberg.livejournal.com 2012-06-13 05:12 am (UTC)(link)
Там, кстати, оказалась почти "чисто-математическая" ошибка: почему ее и обнаружили. Автор смотрел на последние две цифры в разных колонках. Одной из этих колонок было число избирателей в списке. Число это было ограничено чем-то вроде 750 - не случайно, естественно, а по закону. Сделано это специально, чтобы не было участков, на которых может быть много избирателей - чтоб уменьшить соблазн мухлевать на каждом конкретном участке (много не намухлюешь). Если избирателей больше, в одном помещении устанавливаются множественные участки, с разными комиссиями (у нас обычно два таких участка, плюс два для городских выборов - все четыре комиссии за соседними столами). Они этого всего не знали, но заметить, что в одной из колонок провал объясняется потолком смогли. Поскольку такой потолок очевидно неслучаен, колонку эту нужно было исключить, после чего все стало нормально.

Интересно тут другое. Модель у автора была: в Мексике все еще правит та старая партия, о которой когда-то он слышал. В эту модель неправдоподобные результаты встраивались идеально - проверять не пришло в голову. Полагаю, остальные участники беседы чего-то слышали об изменениях последних десятилетий - вот и проверили :))

А когда оно было так, так говорят, можно было много проще проверить. Был случай, когда в избирательных списках в штате Чиуауа оппозиционеры обнаружили массу фамилий вроде Чан, Кан и т.п. Это майяские фамилии. Обнаружить их массово в Чиуауа, это как обнаружить, что в Ивановской области у нас, вдруг, миллион корейцев. При проверке оказалось, что к избирательному списку Чиуауа приписали избирательный список Кампече - и раздали соответствующие удостоверения избирателей (они тогда были без фотографий) по парткомам. При такой свободе действий можно и не переписывать ничего особо централизовано, если заранее позаботиться. Тут статистические методы не требовались :))