Новости недели

вторник, 20 ноября 2012 г.

Гаусс против фальсификаций



Гаусс против фальсификаций: аномалии на выборах-2012Редакция ЛІГАБізнесІнформ применила теорию вероятности к анализу результатов выборов в Верховную Раду Украины 2012 года по партийным спискам. Оказалось, что фальсификации составили более 3%



Гаусс против фальсификаций: аномалии на выборах-2012

Гаусс против фальсификаций: аномалии на выборах-2012
Карл Фридрих Гаусс очень удивился бы, увидев распределение результатов голосования в Донецкой области
Гауссово распределение: как это работает на выборах 

Меру фальсификаций на выборах можно выявить с помощью теории вероятностей, а именно - закона нормального распределения. Основная сфера его применения - физика и статистика. Знаменитый немецкий математик, физик и астроном Иоганн Карл Фридрих Гаусс (1777-1855) настолько тщательно его исследовал и описал, что само нормальное распределение стали называть Гауссовым, а график нормального распределения - гауссианой.
Справка
Суть гауссового распределения заключается в том, что последовательность величин, на которую влияет множество независимых факторов, имеет распределение, стремящееся к нормальному. Графически нормальное распределение некой последовательности величин изображают в виде симметричного колокола.
01.jpg

(см. ниже график Выборы президента Польши, 2005 год - почти идеальная гауссиана)
Самый популярный пример того, как "работает" гауссиана - исследование роста людей в соотношении с их количеством. Например, если посчитать, сколько мужчин в Украине имеют рост 140 см, сколько 150, 160, 170, 180, 190, 200 см и так далее, то на пике колокола окажется наиболее типичное для страны значение, а рост ниже и выше встречается гораздо реже - это и будут симметрично уходящие вниз хвосты гауссианы. Зато если завезти в Украину перед исследованием один-два миллиона низкорослых (или высокорослых) мужчин, то это испортит всю статистику: колокол может потерять симметричность, слева (или справа) появятся аномальные, скачкообразные хвосты. Распределение (в нашем примере - зависимость роста от количества мужчин) перестанет быть нормальным, а график потеряет симметричность. 
Гауссово распределение давно доказало свою состоятельность в естественных науках. Для анализа аномалий в результатах голосования на выборах его стали применять относительно недавно. Предметом изучения в данном случае является два типа графиков: зависимость уровня явки от числа участков и зависимость процента поддержки политика/партии от явки. Рабочая гипотеза состоит в том, что графики этих зависимостей должны иметь форму гауссианы - максимально походить на форму колокола. Наиболее показательные результаты были получены в России. После того как вопрос определения победителей общенациональных выборов в этой стране уже много лет является риторическим, единственное, что представляет интерес -размер фальсификаций. Если в большинстве демократических государств  график зависимости результатов голосования от явки и явки от количества участков имеет вид нормального распределения, то в России и некоторых других странах эти графики аномальны. В Рунете даже появился мем"борода Чурова" - название аномального хвоста распределения явки по имени тамошнего бородатого главы ЦИК. А демонстранты на Болотной площади держали в руках плакаты "Верим Гауссу", протестуя против фальсификации результатов выборов в госдуму в 2011 году. Главные аргументы противников применения Гауссового распределения в социальной статистике и политической социологии - слишком много неконтролируемых факторов, разные социальные группы голосуют по-разному, предпочтения электората разнятся по регионам. Однако, сторонников этой теории тоже немало, и в своих доказательствах они оперируют почти идеальными графиками выборов в странах с развитой демократией. Для наглядности приведем два графика. 
График 1. Как должно быть: Польша, 2-й тур выборов президента, 2005 год 
 Польша
Распределение избирательных участков по явке 
( источник:
http://www.warandpeace.ru/ru/analysis/view/64401)
Классический пример нормального распределения с четким центральным пиком и аккуратными равномерными хвостами справа и слева. По оси X обозначены данные по явке избирателей, по оси Y - количество избирательных участков. Судя по графику, наиболее типичной для страны была явка в 50% - на тысяче участков. Большие и меньшие значения по явке аккуратно распределились справа и слева от пика: 20% и 75% зафиксированы всего на нескольких десятках участков.
По мнению социологов, отсутствие аномалий на гауссиане говорит об отсутствии внешних вмешательств в выборы (вброс бюллетеней, порча их при подсчете и т.д.).
График 2. Гаусс в шоке: Россия, выборы в Госдуму, 2007 год
 Россия
Распределение избирательных участков по явке
Это голосование подозрительно: есть только намек на классический колокол (относительно нормальное распределение в начале), а правый хвост, резко поднимающийся вверх на явке в 100%, аномален. По мнению российских специалистов, доля участков с максимальной явкой аномально повышена, что означает либо вброс бюллетеней с "правильной " галочкой, либо массированные "карусели" и подвоз избирателей на участки. У этого графика есть еще одна аномальная особенность: пики на круглых данных по явке - 60%, 65% и так до 95%. Это тоже может говорить об искусственном завышении явки на участках.
Как это выглядит в Украине  на выборах-2012 
Программист ЛІГАБізнесІнформ  написал парсер (минипрограмму для импорта, обработки и сортировки информации), с помощью которого с официального сайта Центральной избирательной комиссии данные из всех окружкомов, во всех регионах, были импортированы в формат Excel. Затем по этим данным были построены графики: количество участков/явка в процентах  и явка/уровень поддержки партий в процентах. (Аналогичный подход был применен российскими специалистами,  данные опубликованы в  Эсквайре.)  Графики распределения построены в целом по Украине, а также  по трем знаковым регионам - Донецкой области, городу Киеву и Львовской области. И вот что у нас получилось.
График 3. Распределение избирательных участков в зависимости от явки в целом по Украине
 
Явка в Украине на парламентских выборах-2012, по данным официального сайта ЦИК, составила 57,99%. Это значение хорошо видно на пике гауссианы: примерно на 1200 участках проголосовал именно такой процент избирателей. А вот приподнятый хвост справа подозрителен - он означает, что в стране было больше сотни участков, на которых явка составила около 100%. Вброс бюллетеней или применение административного давления  на спецучастках (военные части, тюрьмы) выглядит вполне вероятным. Конечно,  этому хвосту далеко до российской бороды Чурова, да и график не показывает организаторов этой аномалии. Что это - усы Шаповала, террикон Клюева или "щупальце Турчинова - каждый может решить в зависимости от своих предпочтений. Правда, на следующем графике четко видно, какая партия возьмет себе этот хвост в виде голосов "за". 
График 4. Зависимость уровня поддержки партий (в %) от явки в целом по Украине
Аномальный хвост с предыдущего графика почти целиком принадлежит Партии регионов. Это означает, что на избирательных участках с повышенной явкой, стремящейся к 100%, повышенное количество голосов отошло именно провластной политической силе. Гаусс наверняка очень удивился бы. 
Теперь проследим зависимость результатов голосования по Украине от явки для основных шести политических сил отдельно. Каждая точка на графике соответствует результатам партии на одном участке. То есть по оси Х отложена явка на участке, по оси Y - процент избирателей, которые отдали свои голоса за конкретную партию на этом участке (все процентные показатели - от количества зарегистрированных на всех участках избирателей) 
Там, где избиратели голосовали (или их голоса считались) без внешнего вмешательства, уровень голосов остается относительно постоянным - точки образуют равномерные облака. Если явку и количество голосов за партию завышали/занижали, точки складываются в растянутое наклонное облако, которое стремится в верхнюю часть графика. 
График 5. Соотношение голосов, отданных за каждую из партий, к явке по Украине
Этот график подтвердил аномальное распределение голосов в зависимости от явки для Партии регионов иБатькивщины: при увеличении явки растет и уровень их поддержки, хотя этот показатель должен оставаться более-менее стабильным. У какой партии искажение прошло вследствие завышения, а у какой - вследствие занижения итогов голосования, по этим графикам утверждать сложно. Возможно, кто-то скажет, что в масштабах страны голоса Партии регионов перераспределялись в пользу оппозиции. 
Чтобы детальнее разобраться в этом, мы построили распределения по регионам-маркерам: Донецкой и Львовской областям, а также контрольный график - по Киеву. Предположительно, количество наблюдателей, журналистов, уровень средств массовой коммуникации в столице - все это снижает риск фальсификаций. 
График 6. Донецкая аномалия 
Распределение избирательных участков по явке в Донецкой области
Правый хвост на графике показывает, что в Донецкой области неравномерно большое количество избирательных участков, явка на которых составила 100%. Это может означать как применение административного ресурса (например, массовое голосование в военных частях, учреждениях пенитенциарной системы, больницах и так далее), так и вброс избирательных бюллетеней. Показателен пик на "красивой "явке в 70%.
График 7. Распределение по параметрам явка/уровень поддержки партий в Донецкой области

Все правое плечо, которое было заметно на предыдущем графике, отходит Партии регионов. То есть чем выше явка, тем выше поддержка Партии регионов. Кроме того, на обоих графиках по Донецкой области при явке свыше 75% кривая должна уходить вниз (по равномерной гауссиане), а в случае с Партией регионов этого не происходит. Здесь до "бороды Чурова" уже рукой подать. Схожая картина  голосования за ПР наблюдается  в Луганской области, а также в Крыму . 
Наш анализ показывает, что если бы голосование в Донецкой области соответствовало гауссиане, то ПР получила бы на 2% голосов меньше в целом по Украине. 
Детали - в графиках партийного голосования в базовом регионе партии власти. 
График 8. Соотношение голосов, отданных за каждую из партий, к явке по Донецкой области
Обратите внимание на наклонное облако из точек (напомним, каждая точка - результат партии на одном участке) для Партии регионов. Аномальностьраспределения  не вызывает сомнений - вместе с явкой растет и поддержка провластной силы. 
График 9. Львовская область: тень оппозиции
Распределение избирательных участков по явке во Львовской области
Гауссиана более равномерная, чем в Донецкой области, но маленький хвост справа очевиден. 
Графики 10-11. Распределение по параметрам явка/уровень поддержки партий во Львовской области
Соотношение голосов, отданных за каждую из партий, к явке по Львовской области
Поведение точек у Батькивщины и Свободы является странным: они идут вверх вместе с ростом явки, хотя и не так беспредельно, как у Партии регионов в Донецкой области. Некоторые эксперты подобный  феномен в отношении оппозиционных сил объясняют тем, что активность протестного электората всегда выше, провластные избиратели ведут себя более пассивно. Так ли это - мы утверждать не беремся. Однако явка на западе Украины, действительно, выше, чем на востоке. 
Киев в норме 
Почти  гауссово распределение получилось для результатов выборов-2012 в Киеве. А минимальная аномалия справа очень показательна: это  более тридцати преимущественно  спецучастков  (больницы. СИЗО) с явкой более 90%. На восьми таких участках победил УДАР, на девяти - Батькивщина, на 14-ти - Партия регионов. Показателен успех ПР на участке по адресу Дегтяревская, 13. Это Киевский следственный изолятор, в народе - Лукьяновка. Партия регионов заняла там первое место с результатом 32%. 
Если исключить больницы и СИЗО, то Киев проголосовал в соответствии с европейской, гауссовской логикой. 
График 12. Распределение избирательных участков по явке в Киеве
 
У  колокола есть четкий пик на отметке явки в 62,11% - такое количество избирателей проголосовало более чем на сотне участков. Правая и левая кривые Гаусса постепенно опускаются вниз, к оси Х.
Графики 13-14. Распределение по параметрам явка/уровень поддержки партий в Киеве
Соотношение голосов, отданных за каждую из партий, к явке по Киеву
Для каждой политической партии  распределение имеет четкий пик и плавные кривые.
Вывод
Если верить Гауссу, искажения результатов голосования по партийным спискам в Украине не превышали 3% в случае партии власти и десятых долей процента - в случае Батькивщины. Анализ распределений показывает также, что результат партии УДАР и проекта Наталии Королевской не подвергался внешним воздействиям. Такие показатели аномалий вполне соответствуют статистической погрешности экзит-полов. Возможно, именно такой уровень фальсификаций удается спрятать от западных наблюдателей, с ним готово мириться общество, и его не готова оспаривать оппозиция: около 8-10 мандатов по партийным спискам добавлены в пользу ПР вследствие аномалий в результатах голосования. С учетом мажоритарных округов (оппозиция и гражданские активисты заявляют о фальсификации результатов, минимум, в 13 округах, власти согласны на перевыборы в 5-ти) можно утверждать, что от 13 до 23 (из 450) депутатов в новой Раде будут обладать весьма сомнительной легитмимностью . Много это или мало? Если сравнивать с соседними управляемыми демократиями и центральноазиатскими режимами, то немного. Если же посмотреть на новоизбранную Верховную Раду Украины, то 15-20 голосов - это именно тот перевес, который позволяет власти надеяться на формирование арифметического большинства. 
КОММЕНТАРИЙ ЭКСПЕРТА 
01.jpgМы показали результаты нашего небольшого исследования Владимиру Паниотто - генеральному директору Киевского международного института социологии, одному из наиболее авторитетных в Украине специалистов в области математических методов в социологии. Его комментарии - ниже. 
Владимир ПАНИОТТО: Отклонения от гауссианы вызывают подозрения 
- Обоснованно ли применение гауссового распределения для оценки масштабов фальсификаций? Может ли этот метод дополнять экзит-пол и согласуется ли он с ним?
- В случае некоторых видов фальсификаций, в частности, при вбросе бюллетеней, данные экзит-пола будут существенно отличаться от результатов выборов. При этом график зависимости числа проголосовавших за партию, в пользу которой производится фальсификация, от явки будет отклоняться от гауссовского распределения. В этом смысле экзит-пол и Гаусс согласованы. Если были вбросы - и в распределении, и в результатах опроса будут отклонения. Однако обратное не обязательно верно: не все отклонения объясняются вбросами, могут быть и другие причины. Поэтому и экзит-пол, и гауссово распределение не могут использоваться как доказательство фальсификаций в суде (хотя, надо сказать, данные нашего экзит-пола использовались в суде во время Майдана в 2004-м году как косвенный показатель фальсификации результатов второго тура президентских выборов).
Существенные отклонения от гауссового распределения и отклонения данных экзит-полов от результатов выборов в нормально функционирующем обществе должны вызвать подозрения в фальсификации у всех, кто отвечает за выборы 
Вместе с тем, существенные отклонения от гауссового распределения и отклонения данных экзит-полов от результатов выборов в нормально функционирующем обществе должны вызвать подозрения в фальсификации у всех, кто отвечает за выборы. И желание проверить, не было ли отклонений в ходе голосования. И уже эта проверка, результаты пересчета, показания свидетелей могут быть доказательствами в суде. С другой стороны, при совпадении данных экзит-полов и красивых распределений можно с уверенностью утверждать, что существенных фальсификаций в день голосования не было. Это добавляет выборам легитимности.
- График по явке в целом по Украине (графики 3-4): о чем говорит отклонение от гауссового распределения, в частности, приподнятый хвост справа, который среди партий явно выражен у Партии регионов?
- Если нет вмешательства в процесс выборов, то распределение избирательных участков по явке близко к нормальному (гауссову) - это хорошо видно по графику для второго тура выборов президента Польши в 2005 году(см.график 1. - ред.). Хвост справа на графике по Украине говорит о том, что участков с высокой явкой аномально много. Это может означать, например, что были предприняты какие-то специальные усилия для повышения явки или были вбросы. Тут есть две новости - хорошая и плохая. Плохая состоит в том, что хвост справа есть. А хорошая - что этот хвост небольшой и составляет, по всей видимости, полтора-два процента численности электората. Это несравненно лучше, чем, например, в России (см.график 2, - ред.).  Подозрительно и то, что весь этот хвост достался Партии регионов, то есть на участках с высокой явкой голосовали лишь за партию власти.
Замечу, что данные нашего экзит-пола показывают рейтинг Партии регионов на 1,6% ниже, чем в результатах выборов. Впрочем, это вписывается в ошибку выборки и может объясняться также и тем, что экзит-пол не учитывает голосование на спецучастках и на дому.
Подозрительно, что весь этот хвост достался Партии регионов, то есть на участках с высокой явкой голосовали лишь за партию власти 
- О чем говорят графики по регионам, в частности, графики явка/процент поддержки Партии регионов в Донецкой области и, в меньшей степени, Батькивщины во Львовской области?
- Графики по регионам показывают, что некие специальные усилия для повышения явки и одновременно голосования за Партию регионов особенно характерны для Донецкой области. На участках с аномально большой явкой голосование прошло преимущественно за Партию регионов, и очень мало голосовавших за коммунистов иУДАР - в отличие от всех остальных участков области. Схожая картина, хотя и в значительно меньших масштабах, характерна для голосования за Батькивщину во Львовской области: на участках с аномально большой явкой доминирует голосование именно за эту политическую силу. 
Может ли это быть связано с повышенной активностью оппозиционного западноукраинского электората?  
Нет, повышенная активность приводит к тому, что график оппозиционной партии просто смещается вправо, но продолжает оставаться гауссовым, а общий график не очень сильно изменяется (на графике - условный пример двух партий - власти и оппозиции, а также общий график - сумма голосов этих партий, при условии нормального распределения).  
01.jpg
Хвосты возникают, когда количество участков с аномально высокой явкой не уменьшается при увеличении общей явки (в нормальном распределении 95% участков должно быть в рамках 2-х стандартных отклонений от средней явки, а 99% - в рамках 2,58 стандартных отклонений). 
В целом  же общий масштаб отклонений не превышает нескольких процентов, что согласуется с результатами экзит-полов и величиной допустимой погрешности в них. Гораздо больше проблем оказалось связано с мажоритарной частью выборов.
Валерия Кондратова, Андрей Жупаненко 

Комментариев нет:

Отправить комментарий