January 2019

M T W T F S S
 123456
78 910111213
14 151617181920
21222324252627
28293031   

За стиль благодарить

Развернуть метки

No cut tags
Sunday, June 10th, 2012 02:08 am (UTC)
Алик, раз уж Вы сделали репост, может хоть Вы ответите на вопрос, который там задают Киреев и Подмосковник, а ответа так и не получают: "Что здесь не так"?
Sunday, June 10th, 2012 09:18 am (UTC)
Не то чтобы не получают, а выясняется (тссс), что наши представления о том, какие "необычные" цифры говорят о фальсифкации, а какие о естественном социальном и географическом феномене - покоятся на экспертной оценке. Недавно тоже была (с похожим составом участников) дискуссия про выборы в Мексике: публикатор обнаружил невероятное значение некоего показателя, говорящее о тотальной фальсификации куда бОльшего масштаба. В ходе дискуссии показатель увял до совершенно разумных значений.

На момент публикации ссылки я полагал (неверно проинтерпретировав расположение пика на графике), что речь идет о точном сходстве картин голосования 1996 и 2011 (пики на "красивых" процентах). Последовавшая дискуссия скорее опровергла этот пункт и выявила несравненно более важную вещь, о которой я писал в начале коммента: у нас нет чисто математических критериев интерпретации "несколько необычных" данных.

Пожалуй, напишу об этом отдельно.
Wednesday, June 13th, 2012 12:05 am (UTC)
А где было про Мексику? Я пропустил.

"Чисто математических" критериев тут быть не может, естественно. В конечном итоге, с помощью данных всегда тестируется некая модель того, откуда они взялись. Всякие странности часто имеют вполне разумное и легальное объяснение - иногда оно очевидно всем, иногда только эксперту. Такое объяснение становится частью модели - и странности перестают быть странностями.

Возмущаться мы начинаем тогда, когда разумных объяснений не остается.
Wednesday, June 13th, 2012 05:12 am (UTC)
Там, кстати, оказалась почти "чисто-математическая" ошибка: почему ее и обнаружили. Автор смотрел на последние две цифры в разных колонках. Одной из этих колонок было число избирателей в списке. Число это было ограничено чем-то вроде 750 - не случайно, естественно, а по закону. Сделано это специально, чтобы не было участков, на которых может быть много избирателей - чтоб уменьшить соблазн мухлевать на каждом конкретном участке (много не намухлюешь). Если избирателей больше, в одном помещении устанавливаются множественные участки, с разными комиссиями (у нас обычно два таких участка, плюс два для городских выборов - все четыре комиссии за соседними столами). Они этого всего не знали, но заметить, что в одной из колонок провал объясняется потолком смогли. Поскольку такой потолок очевидно неслучаен, колонку эту нужно было исключить, после чего все стало нормально.

Интересно тут другое. Модель у автора была: в Мексике все еще правит та старая партия, о которой когда-то он слышал. В эту модель неправдоподобные результаты встраивались идеально - проверять не пришло в голову. Полагаю, остальные участники беседы чего-то слышали об изменениях последних десятилетий - вот и проверили :))

А когда оно было так, так говорят, можно было много проще проверить. Был случай, когда в избирательных списках в штате Чиуауа оппозиционеры обнаружили массу фамилий вроде Чан, Кан и т.п. Это майяские фамилии. Обнаружить их массово в Чиуауа, это как обнаружить, что в Ивановской области у нас, вдруг, миллион корейцев. При проверке оказалось, что к избирательному списку Чиуауа приписали избирательный список Кампече - и раздали соответствующие удостоверения избирателей (они тогда были без фотографий) по парткомам. При такой свободе действий можно и не переписывать ничего особо централизовано, если заранее позаботиться. Тут статистические методы не требовались :))