Как оппозиционеры пытались доказать фальсификации выборов, а доказали их честность

Эксклюзив Авантюры

Это просто чудо, сколько за последние два месяца у нас в стране появилось фанатов хоккея и футбола матстатистики и теорвера. Ни одному популяризатору науки никогда не удавалось добиться такого успеха в такие короткие сроки, как председателю ЦИК Чурову. Это ничего, что многие из них не объяснят разницу между распределениями Гаусса и Пуассона, зато какая тяга к знаниям! За мной, мои маленькие любители прикладной математики, к новым вершинам знания!

 

Для тех, кому не нужны подробности

Так называемая «гребенка Чурова» — пики на графике распределения процента голосов — не является доказательством подтасовок, так как такие пики присутствуют:

  • На аналогичных графиках по выборам в других странах, включая оплоты демократуры (США, Германия).
  • На графиках процента голосов, отданных на декабрьских выборах за оппозиционные партии — что, Чуров подыгрывал КПРФ?

Более того «гребенка» доказывает отсутствие подтасовок!

  • Как убедительно показывают графики, которые приводят оппозиционные обличители фальсификаций, если искусственно смоделировать «вбросы» на выборах, то «гребенка» исчезает.

Вывод: наша оппозиция со своим враньем в очередной раз села в лужу: хотели доказать что выборы фальсифицированы, а доказали обратное.

Теперь обо всем по порядку.

Для тех, кто хочет подробностей

Начну с предыстории для тех, кто не следил за приключениями «гауссинианы». Остальные могут сразу перейти к самому интересному.

Сразу после выборов стали появляться люди, у которых были «математические доказательства фальсификаций».

Претензий озвучено было две:

  1. Все графики похожи на гауссово распределение, а график «Единой России» — нет. Следовательно, результаты ЕР подтасованы.
  2. На «красивых» процентах ,кратных пяти, на графике видны пики, следовательно результаты ЕР подтасованы.

Так как набросов было два, то и разбор делится на две части.

Первая – разбор «гауссинианы». Обязательность похожести на гауссово распределение для всех партий доказана никем не была, это была ни на чем не основанная аксиома протестующих.

Поэтому самое эффективное опровержение в данном случае — доказательство ложности самой аксиомы, т.е. нахождение не-гауссовых выборов. И такие выборы были найдены:

Таким образом вопрос с «похожестью на гауссиниану» был закрыт

С пиками на «красивых» числах история более интересная.

Для начала заметим в скобках, что на плакате «Верим Гауссу» наличествуют пики на 20% и 25% у КПРФ. Очевидно сурковскаяпропагандаTM решила немного пофальсифицировать и в пользу коммунистов.

После предъявления «математического доказательства фальсификаций» было высказано мнение, что как минимум часть пиков не имеет никакого отношения к подтасовкам, а имеет естественное происхождение. Самая убедительная статья на эту тему — «Математические распределения и выборы в ГосДуму 2011 (ОПРОВЕРЖЕНИЕ популярного заблуждения)» С.Г.Кузнецова. Вот вывод о пиках из нее:

В районе 50% обязан быть скачок, обусловленный тем, что дробь 1/2 среди других дробей n/m встречается чаще остальных. Но этот скачок легко сгладить, взяв слишком широкий шаг диаграммы. То же самое относится и к другим «красивым» дробям — 1/3, 2/3, 3/4, 4/5 и т.д. Чем «красивее» дробь, тем более резким в её окрестности будет пик. Ну а теперь давайте посмотрим на настоящий график распределения числа участков по проценту голосов, без сглаживания и просчитанный с высокой детализацией.

Более внимательное рассмотрение показало, что данный целочисленный эффект полностью объясняет якобы аномальный, а на самом деле совершенно естественный пик на значении 50% = 1/2, полностью или частично объясняет пики на 20%, 25% и 75%, но НЕ объясняет некоторые другие пики на круглых значениях процентов (65%, 70%, 85%, 90%, 95%) в правой части графика.

Итак, часть пиков объясняется тем, что данная «красивая» дробь встречается чаще, чем остальные, для других данное объяснение не подходит.

Сторонникам теории фальсификации пришлось на эту критику реагировать. В статье Дмитрия Кобака «ПЖиВ: о пиках на дробях с малыми знаменателями» не признаются естественными пики 65, 70, 80, 85, 95% плюс, почему-то, 75%. Более того, они прямо называются вбросами, и делается попытка это доказать:

Слева — всем известный график, бин 0.25%. Видны пики на 50%, 60%, 65% и т.п. Справа — тот же график с бином 0.001%. Та-та! Мы ясно видим те самые артефакты, о которых шла речь выше. Красивые пики на 1/2, 2/3… и нули между пиками. Достаточно сравнить эти две картинки, чтобы понять, что пики слева, по крайней мере некоторые, и пики справа имеют совершенно разную природу. Пики справа (а) расположены на дробях с малыми знаменателями, (б) поэтому непериодичны, (в) уменьшаются с увеличением знаменателя дроби, (г) окружены нулями с обеих сторон, (д) видны только на хорошем разрешении. Пики слева расположены на числах, кратных 5% (ясно видны пики на 60%, 65%, 70%, 75%, 80%, 85%, 95%), имеют примерно одинаковый размер (кроме 50%), не окружены нулями и видны на нормальном разрешении. Можно посчитать спектр и увидеть пик на гармонике 1/5, у меня это сделано в основной записи. У пиков справа такого нет. Вывод: слева видны фальсификации, справа — артефакты.

Во-первых, пики и их периодичность сильно зависят от шага дискретизации. Дмитрий просто выбирает наиболее выгодные себе. При увеличении шага пики вообще исчезают. Если 0,25 несколько уменьшить, пик на 65% распадется на два – 65% и 66,6%, что несколько испортит периодичность, и так далее. При чем тут фальсификации непонятно. Вообще, главное в этих двух графиках — это два разных представления одних и тех же данных.

Приведу пример. Представим, что некто Дмитрий брился и немного порезался, после чего его сфотографировали с двух сторон – на одной фотографии виден порез, на другой нет. Это два образа одного и того Дмитрия. Сравнив две эти фотографии, вы бы сделали неизбежно вывод, что на Дмитрия напали бандиты и исполосовали лицо?

Поэтому если кто-то усматривает связь между периодичностью или непериодичностью пиков с фальсификациями, хотелось бы увидеть от кого-то разъяснения этой самой связи.

Во-вторых, также непонятно какие знаменатели малые, а какие нет, и что из этого следует (по мне так 20 тоже не великий знаменатель), что следует из «примерно одинакового размера», уменьшения при увеличении знаменателя, а главное, как это связано с выводом в конце.

В-третьих, «нули с обеих сторон» абсолютно точно никак с доказываемыми фальсификациями не связаны, это артефакт дискретизации. Зачем на них дважды заострять внимание? Для объема?

В-четвертых, даже на нормальном разрешении я вижу справа пики и на 60%, и на 70%, и на 75%, и на 80%:

Почему их Дмитрий также вносит в ряд фальсификаций?

Ну и в-пятых, положим на каком-то значении у нас есть пик при шаге 0,25, и нет при 0,001, что это значит? Учитывая, что данные одни и те же, это значит лишь то, что «плотность пиков» рядом с этим значением выше, чем в соседних областях, поэтому при увеличении бина, когда соседние пики начинают сливаться, вырастает «артефакт». А вот является ли эта повышенная плотность естественной или нет, заслуживает отдельного внимательного рассмотрения.

Но нам же нужно побыстрее разоблачить фальсификации, а не разобраться, так ведь?

Но вернемся к статье:

Единственное остающееся подозрение на артефакт — пик на 50%, он есть и справа, и слева. Что делать? А вот что: гениальный [info]jemmybutton растолковал мне (спасибо ему за очень полезную дискуссию!), как одним махом избавиться от всех артефактов. Нужно к количеству бюллетеней за каждую партию на каждом участке добавить случайное число равномерно распределенное на (-0.5, 0.5). Понятно, что такая маленькая добавка результатов не изменит, но наши числа станут дробными и все артефакты сразу исчезнут. Три тонкости: (1) амплитуда шума должна быть именно 1, чтобы целиком покрыть значения между целыми числами, (2) я считаю результат 100 раз с разным шумом и усредняю, (3) на участках, где ЕР набрало ровно 100% голосов, я не добавляю шум, чтобы не размывать самое правое значение на графике (это всё равно не бин, а значение на границе бина). Для сравнения: прежняя кривая (черным) и исправленная кривая (красным):

Пик на 50% исчез бесследно, остальные остались. Мораль: при вычислении любых таких гистограмм, нужно добавлять к количеству голосов шум с амплитудой в 1 голос и средним 0.

Вот это действительно интересно. Правда исчез, судя по графику, не только 50% пик, но и 35%, 40% и 60% пики тоже пропали. Но не будем сильно придираться — если бы Дмитрий заметил их исчезновение, пришлось бы признавать естественными не один пик, а целых четыре. Впрочем, интересно не это, а то, что часть пиков исчезает при неизменности остальных.

Чтобы разобраться почему так получается, вспомним как строятся эти графики. Что означает бин 0,25%? Это значит, что ордината точки с абсциссой, например, 50% есть сумма всех УИКов с процентами за «Единую Россию», попадающими в промежуток от (50%-0,25%/2) до (50%+0,25%/2). А теперь представим два участка. На одном пришло проголосовать 10 человек, из которых за ЕР отдали голос 5. На другом из 1000 пришедших – 800. На первом за ЕР – 50% избирателей, на втором -80%. Добавим на участках по полголоса. Процент за ЕР на первом участке станет 52,38, а на втором – 80,01. Т.е. на первом участке процент сместился на 2,38%, а на втором – 0,01%. Если шаг 0,25%, то в первом случае смещение больше 9-ти шагов, а во втором лишь 1/25-ая шага.

То есть описанные Дмитрием Кобаком действия размывают пики, обусловленные участками с малым количеством проголосовавших, и не изменяют обусловленные участками с большим. К фальсификациям это снова никакого отношения не имеет. Применение этого метода уберет фальсифицированные пики на малых УИК и оставит естественные пики на больших.

Напоследок хочется ещё немного процитировать эту статью.

Природа пиков у других партий (кроме ЕР) ясно видна на графике Северной Осетии. Видите пик у коммунистов на 20%? Естественно, если почти на всех участках для ЕР рисуют 75%, то что-то нужно и для всех остальных нарисовать, не правда ли? Кстати, в Северной Осетии эти пики возникают только во Владикавказе, в деревне всё в порядке (интересно, почему). Но во Владикавказе — беспредел.

Если имеется пик у ЕР – это безусловно доказательство фальсификаций злобной власти. Если же пик у её соперника … барабанная дробь .. это всё равно доказательство фальсификаций злобной власти. Не правда ли, превосходный пример двоемыслия? Рукопожатые блоггеры, демократические журналисты и геи аплодируют стоя.

Критерий естественности пиков

Критиковать других это конечно хорошо, но знаю ли я сам, как отличить естественные пики от результатов фальсификаций? Думаю, да. Предлагаю для проверки пользоваться следующим критерием:

Все естественные пики, вызванные неравномерностью распределения дробей, будут симметричны относительно 50% и будут проявляться у всех партий.

Обоснование простое: любая дробь n/m имеет «симметричную» (m-n)/m, значит, если n/m встречается чаще, чем (n-1)/m и (n+1)/m, то и (m-n)/m будет встречаться чаще, чем (m-n-1)/m и (m-n+1)/m. Также очевидно, что математика одинакова для всех партий, потому и проявляться будут закономерности у всех.

Потому, чтобы проверить на фальсификации Единую Россию, обратим взор на графики остальных партий. Ещё раз посмотрим на график С.Г.Кузнецова:

То, что пики есть и у остальных партий, видно невооруженным глазом. Чтобы проверить естественность пиков на «красивых значениях», построим те же для ЛДПР (обозначено синим цветом) и КПРФ (обозначено красным). Данные для графиков взяты тут.

Обратим внимание на графики КПРФ и ЛДПР:

Мы видим, что удивительным образом на 5, 10 и 15% у этих партий находятся «аномальные пики». Особенно интересен пик на 5% у КПРФ. Он имеет такой же характер, как собратья на 90% и 95% у ЕР. Вместо узкого пика вверх мы видим небольшую «горку». Может быть кто-то фальсифицировал результаты КПРФ на 5%?

Кроме того, хотя у ЛДПР я не отметил пиков на 5% и 10%, мне кажется они там есть. Просто их не видно. Да-да, я не шучу.

На 10% он «спрятался» из-за того, что в этом месте график резко идет вверх, но, увеличив масштаб, мы увидим на графике и резкий «скачок» вверх перед этой точкой, и «отскок» сразу после. Что касается 5%, то тут много зависит от того, где проводить кривую «без пиков» в районе 3-5%. Если по нижним точкам, получим несколько пиков с максимальным на 5%. Если по высшим, пиков не будет, зато появится аномальный провал сразу за 5%-ми.

То есть пики 5, 10% у ЛДПР можно видеть или можно не видеть. Единственное место, где не видно пика – 15% у КПРФ.

Дабы меня не заподозрили в подтасовках, давайте посмотрим, не видны ли «симметричные пики» на графике Кузнецова, тем более детализация там выше.

Оказывается, пики видны как у оппозиции, так и самой «Единой России».

Таким образом, мы видим, что пики на высоких процентах, кратных пяти, имеют своих симметричных собратьев, как это и должно быть из предложенного «критерия естественности». Откуда следует, что либо нужно признать верным этот критерий, и автоматически признать естественными все эти пики, либо объяснить кто, и главное, зачем фальсифицировал результаты оппозиции (да и самой ЕР) на «красивых» числах в левой части графика.

Но это все была предыстория, теперь обещанное самое интересное —

Доказательство честности прошедших выборов

Вернемся к заметке Дмитрия Кобака. Итак, он добавляет на каждом участке плюс-минус полголоса, проводит эксперимент 100 раз и усредняет, в итоге получаются вот такие графики:

Часть пиков при этом исчезает. Что сделал Дмитрий Кобак? Он фальсифицировал результаты выборов всего лишь. Да, размер «вброса» ничтожен, но даже он уничтожает часть пиков (почему часть, а не все, мы рассмотрели выше).

Вы еще не догадались, что на самом деле доказывает этот график?

Прежде чем я покажу, какой вывод и почему следует отсюда, построим еще несколько графиков.

Мы будем фальсифицировать выборы. А если быть совсем точным, будем вбрасывать голоса избирателей за «Единую Россию». Делать будем это следующим образом: на каждом участке увеличим количество проголосовавших за ЕР на некоторое количество от общего количества избирателей. Например, добавим на каждом участке процент избирателей из промежутка [0;20] процентов. Конкретное значение из промежутка будем выбирать случайным образом.

Итак, первый график:

Графики с вбросами опущены по оси ординат, чтобы удобней было сравнивать.

Итак, мы видим, что вбросы приводят к смещению максимальных значений графика вправо (что естественно) и исчезновению пиков.

Уменьшим процент вбросов:

Пики по-прежнему исчезают.

Ещё уменьшим вбросы:

Только теперь угадываются пики, но привычного своего характера они всё ещё не носят:

Наконец, на уровне средних вбросов около 0,1% появляются знакомые пики.
Чтобы убедится в неслучайности результатов, ещё несколько графиков с теми же уровнями:

Результаты аналогичны предыдущему: при случайных вбросах в промежутке [0; 0,25%] видны пики на ½ и ¾ ; увеличение вбросов до промежутка [0; 0,25%] пики в привычном виде убирает.

Для полноты картины построим ещё пару графиков, где вбросы добавим не на всех участках, а лишь на которых процент проголосовавших за ЕР попадает в определенный промежуток:

Первый график для промежутка избирателей [35%; 55%], а второй для [42%; 92%]. Уровень вбросов 0-0,25 %. Что можно сказать, глядя на графики: внутри промежутков исчезли все пики, кроме двух самых больших, вне промежутков графики не изменились, на границах появились новые пики – пик вниз слева и вверх справа.

Вернемся к тому, какие выводы следуют из всех этих графиков. Итак, что нам известно:

  1. На графиках при достаточном количестве участков появляются пики. Они есть у всех партий — и у партии власти, и у оппозиции.
  2. Пики (или их часть) имеют естественное происхождение. Это никем не оспаривается, разные мнения лишь говорят о разном соотношении «естественных» и «неестественных» пиков.
  3. Фальсификации (добавление случайной величины) даже в незначительных количествах естественные пики убирает. Это следует из графиков Дмитрия Кобака.

И, как я надеюсь, это показал ваш покорный слуга.

Что следует из вышеперечисленного? Вывод из всего этого – декабрьские выборы были честными. Ну, или, чтобы быть совсем точным, возможные фальсификации не превышали десятой процента от общего количества голосов.

Если фальсификации стирают пики и вбросы имели место, то пиков бы мы не увидели, так? Но мы их видим, причем у всех партий. А значит, выборы были честными. Что и требовалось доказать.

Спасибо господам оппозиционерам, что своим упорством заставили разбираться с графиками. Так называемая «гребенка Чурова», которую наши оппозиционеры приводили в качестве доказательства фальсификации выборов, на самом деле доказывает отсутствие массовых вбросов. Я конечно понимаю, что этот вывод может разорвать хомячка похлеще капли никотина, но что поделать, истина дороже.

Artem_R, форум Глобальной Авантюры

Поделиться в соц. сетях

Опубликовать в Мой Мир
Опубликовать в Google Plus
Опубликовать в LiveJournal
Опубликовать в Одноклассники
Метки: , ,

Комментарии запрещены.