Прошли выборы в Госдуму РФ, и сразу же появились заметки на тему статитистического анализа их официальных результатов (например, вот). Благо, наш Центризбирком эти результаты на своём сайте опубликовал с детализацией аж до участковых избирательных комиссий. Я как такую кучу интересных цифр увидел, так и не удержался и тоже проанализировал данные по Москве, на пару с товарищем nick-zanyat. При этом опустился до этих самых УИКов. Получилось крайне интересно. Как и у Уборщицы, результат ЕР практически линейно зависит от явки, в отличие от остальных партий:
Каждая точка на графике - это результаты одной партии по одному избирательному участку. По оси Х - явка избирателей на данном участке, по Y - результат соответствующей партии на этом участке, а именно, процент проголосовавших за эту партию, от общего числа зарегистрированных на участке избирателей. Именно так, а не процент от общего числа проголосовавших на участке. Почему надо делать именно так, должно быть ясно из самого графика. У всех партий, кроме ЕР, на каждом участке есть какой-то количество приверженцев, которые смогли таки в воскресенье дойти до избирательного участка, поставить в графе крестик и опустить бюллетень в урну. Это количество составляет всегда примерно одинаковую долю от общего числа избирателей на участке. Что, в общем-то, вполне логично. Но у ЕР всё не так, в их случае чем больше на участке явка - тем больше у партии приверженцев.
Таким образом, ЕР от всех других партий принципиально отличается. Это можно проиллюстрировать ещё и таким графиком:
Это частотная диаграмма результатов голосования по Москве по разным партиям. По оси Х - процент проголосовавших за партию, от общего числа зарегистрированных на участке избирателей (условно назовём эту величину "поддержкой"). А по оси Y - количество избирательных участков, по которым у данной партии именно такой результат. Всего участков здесь 3 138; те участки, по которым избирателей меньше 1000, я из анализа исключил - всего их оказалось 235. Итого 3 138 + 235 = 3 373, совпадает с общим количеством участков в Москве. На исключенных маленьких участках всего 1,25% избирателей.
Как видно, у Яблока, ЛДПР, СР и КПРФ электорат на участке более-менее предсказуемый. Например, КПРФ по большинству участков выразить поддержку пришло 10-15% избирателей. ЛДПР - 5-8%, СР - 7-10%, Яблоко - 3-7%. Это вполне естественно, учитывая что на одном избирательном участке около 2 000 избирателей в среднем. Поэтому по закону больших чисел по каждому отдельно взятому участку результат от совокупного отличается не сильно. Но вот только у ЕР поддержка колеблется в широких пределах от 8% до 50% и больше. Это статистическая нелепица и несуразица. Если б нам Д.А. Медведев по телевизору и интернету не объяснил, что выборы были честные, я бы на основе этих графиков подумал, что имела место громадная фальсификация методом вброса.
Справедливости ради отметим, что у ЕР тоже есть пиковое значение, наиболее часто встречающаяся по участкам поддержка. Только составляет она около 12%, а не 28%, как в среднем по распределению. Но распределение по ЕР - не единственная интересная вещь на графике. У Яблока тоже интересный результат - примерно по двум третям участков их пришло поддержать около 6% избирателей, а по другой трети - почти никто не пришёл. Что как бы тоже довольно странно. Я попробовал разделить все участки на две категории: те, где у Яблока больше 2,5% поддержки (первая цифра), и те, где у них поддержки меньше 2,5% (вторая цифра). Проанализировал свойства этих двух категорий, и вот что получилось:
Яблоко: 6,4% 1,2%
СР: 7,9% 5,5%
ЛДПР: 6,1% 4,6%
КПРФ: 12,3% 10,3%
ЕР: 24,6% 41,9%
Явка: 58,7% 64,5%
То есть, по всем партиям, кроме ЕР, поддержка одновременно снижается (в разной степени, у Яблока - очень сильно, у КПРФ - ненамного), а у самой ЕР - в полтора раза растёт. Кроме того, подрастает и явка. Если бы опять же не заверения Д.А. Медведева, я бы подумал, что помимо вброса была ещё и кража уже поданных голосов. Тем более что у СР, ЛДПР и КПРФ распределения на графике с левой стороны (т.е. со стороны меньших значений поддержки) тоже слегка приподнятые, по сравнению с правой стороной.
Напоследок, попробуем посчитать результаты выборов по модальным значениям распределений на графике, т.е. по наиболее часто встречающейся поддержке. Итого поддержка по партиям получается: Яблоко - 5,5%, КПРФ - 12%, ЕР - 12%, ЛДПР - 6%, СР - 8,5%, "Патриоты России" - 0,8%, "Правое Дело" - 0,5%. В сумме это будет 45,3% - это что-то вроде модальной явки.
Поделив модальную поддержку на модальную явку, получим альтернативные результаты выборов по Москве: Яблоко - 12,1%, КПРФ - 26,5%, ЕР - 26,5%, ЛДПР - 13,2%, СР - 18,8%, "Патриоты России" - 1,8%, "Правое Дело" - 1,1%. По официальным же данным получается: Яблоко - 8,7%, КПРФ - 19,7%, ЕР - 47,5%, ЛДПР - 9,6%, СР - 12,4%, "Патриоты России" - 1,4%, "Правое Дело" - 0,8%.
Но так как выборы у нас были честные и результат у них объективный, это всё, конечно же, какие-то глупости.

Наиболее вероятно, что эта статитстика основана на предположениях о доминировании вбросов, в реальности же массовым были и переписывания протоколов.
Выше 16% (от всех избирателей) у Яблока ни на одном участке нет.
Про т.н. переписывание протоколов - это тоже видно, про это в конце поста.
А если про голосовавших - то даже на моём участке и даже после вброса у "Яблока" больше 20% официальных
6% минимум для дрысни при том, что у всех минимум ~0% - это скорее всего последствия применения открепительных удостоверений. Т.е. есть участки, где карусель не сработала, балбесов мало, но функционеры по мпршруту прошли.
Остается невыясненным вопрос? Так сколько % приписано - и сколько на самом деле ЁР и СР взяли голосов.
Также никто не вспоминает, что не прошедшие рубеж голоса распределены по остальным партиям, ёр хоть и приписала себе 49% на самом деле получила 52%!!!!!
Блин, начерта вы эти графики строите? Просто узнайте на каких УИК были наблюдатели и члены комиссий от Яблоко и КПРФ числом не менее 3-4 и увидите, что там реальные результаты, а там где одни педагоги - фальшивые.
Для Едресни план был 50%. На участках с наблюдателями было ~30%, на остальных участках план выполнили и перевыполнили, чтобы в среднм по ТИК выйти на плановые проценты. Вот и всё. У Яблока разница достигает аж до 9-12 раз т.е. с наблюдателями 9-12%, а без них ~1%. И никакой высшей математики.
Спасибо, без тебя-то мы и не знали что надо делать!
У ЕдРо по Москве был план - 61%. Если вам лично всё ясно, это не значит, что у вас достоверная информация. Если вы не нуждаетесь в анализе, то это значит, что вы лично призываете к манипуляциям, а не к честной процедуре.
> только у ЕР поддержка колеблется в широких пределах от 8% до 50% и больше
Тут, скорее, другое важно. Разброс доли участков по уровню "поддержки" для всех партий, кроме ЕР, весьма хорошо аппроксимируется распределениями Гаусса — т.е. можно уверенно утверждать, что отклонения от среднего носят случайный характер. Обратно, в случае ЕР график "поддержки" не описывается вообще никакой разумной вероятностной статистикой, а значит, о случайности распределения голосов речи идти не может вообще.
Соответственно, упоминать следует не об абсолютных колебаниях, а о форме зависимости.
"Обратно, в случае ЕР график "поддержки" не описывается вообще никакой разумной вероятностной статистикой, а значит, о случайности распределения голосов речи идти не может вообще."
Если вы не знаете понятия "сложная функция" и как сложной функцией из n гауссов с вероятностью 95% описать график ЕР, то безусловно можете делать выводы о фальсификациях и реальных результатах, причем со 100% вероятностью последних (по определению)
Хе-хе. Само предложение описывать график „поддержки“ сложной функцией только для одной партии из нескольких — уже есть признание неравноценности механизма голосования для этой партии по сравнению с остальными.
Естественно, конкретные причины подобной неравноценности лежат вне рассмотрения статистики — однако согласно бритве Оккама следует принять простейшую из текущих гипотез до тех пор, пока не появится более точная либо более экономная.
2Уку-Шу
То, что вы называете "сложной функцией", на самом деле называется полимодальным распределением. Можно указать несколько причин получения полимодального распределения в экспериментальных данных
1. подделка результатов эксперимента
2. разные механизмы , отвечающие за формирование различных мод распределения (т. е. первая мода может быть, например естественная, а другие - вброс или переписка голосов)
3. неоднородность выборки.
Странно только, что распределения смежных параметров (результатов других партий) подобной неоднородности выборки не чувствуют...
ЗЫ
Только что заметил еще одну "необъяснимую" вещь - явка избирателей едра ни на одном участке не ниже 6%. Везде крылья гаусса опускаются почти до нуля - а у едра - нет! Вот вам и неоднородность выборки :)
Дайте, пожалуйста, ссылку на какой-нибудь результат по УИКу. Потому что я никак не могу их найти.
А в анализе Уборщицы используются результаты по ТИКам, их я там вижу.
УИКи Ясенево
а можно где-нибудь исходные данные по участкам скачать одним файлом? а то на сайте избиркома там только вручную можно выбирать показ каждой отдельной таблицы...
спасибо заранее.
Нет, только набирать вручную. Ну или скриптом.
Вот, например, тут приводится ссылка:
http://podmoskovnik.livejournal.com/131636.html?thread=770356#t770356
Но того, кто это собирал, я не знаю и, соответственно, гарантировать, что там всё выгружено правильно - не могу.
Спасибо, поржал.
Это ж надо такие выводы делать. Я, конечно, в статистике ни в зуб ногой, зато имею 2 грамма здравого смысла.
Вы хоть представляете себе какого обьема работа нужна для организации такого массового вброса? Десятки тысяч людей чтобы напечатать бюллетени, развести их по всех стране, проинструктировать исполнителей на местах, контролировать ход работы.
Кто все эти люди, где все эти люди? Их кто-нибудь видел?
Еще десятки тысяч собственно членов избирательных комиссий, которые собственно "вбрасывали". И среди всех этих людей не нашлось ни одного честного, который заявил бы об этом?
Это же статистическая нелепица и несуразица просто.
Но чисто поржать, повторюсь, статья хорошая.
Можно ещё просто переписать протокол.
да, это действительно очень просто. и совершенно невозможно никак проверить. /sarcasm off
Проверить - легко, наблюдатели об этом и пишут. Вот, кстати, небольшая подборка:
http://haeldar.livejournal.com/1967734.html
Доказать в суде - говорят, что нельзя, из-за намеренно неправильно оформленных копий протокола, выдаваемых на руки наблюдателям. Ну, это например.
я обожаю формулировки ОБС - вроде как и сказал что то умное, но в то же время это меня ни к чему не оьязыват, одна бабка ведь сказала, я при чем?
Вы знаете что доказать нельзя? Пробовали может? Вообще дела в суд подавались? И т.д.
Вообще, пока люди не перестанут зря глотки драть и не начнут использовать суды по их прямому назначению, ничего и не изменится.
ОБС? Ничего что несколько человек из нашей организации были наблюдателями на этих выборах?
"ОБС"......"одна бабка ведь сказала".
Вам тоже привет.
Тебе знакомо понятие "административный ресурс"? Голосовать ходил? Сам что-нибудь проверил?
Вот гражданин Навальный, к примеру, еще на взлете обьявил, что его цель - вывести людей на улицы. Он готовился не избираться в думу, не фиксировать нарушения, подавать жалобы и судиться, а именно митинговать и провоцировать конфликты с правоохранительными органами, создавать прецеденты притеснения так называемой несогласной оппозиции действующей властью. Результат деятельности Навального в этом направлении - налицо.
Партия едро готовилась любой ценой не проиграть на выборах. Поинтересуйся ради общего развития, численностью поголовья чиновников в Российской Федерации, а также уточни, какой их процент состоит в едре. Это есть одна часть административного ресурса. У чиновников есть подчиненные, многие из которых при смене власти на своем месте не усидят. Это есть другая часть административного ресурса. Кроме того, предприятия и организации, "облагодетельствованные" партией едро. Это есть еще более другая часть административного ресурса. Забегая вперед, сообщу тебе, что общая сумма будет восьмизначным числом с шестью нулями. Результат деятельности партии едро в этом направлении - в ЦИК и СМИ.
Представляешь ли ты себе, каким альтернативным административным ресурсом нужно обладать хотя бы одной из партий, кроме едра, чтобы проверить и доказать хотя бы часть нарушений, достаточную для официального признания выборов несостоявшимися? Понимаешь ли ты, что законное опротестование результатов выборов не получит должного освещения в подконтрольных действующей власти СМИ, то есть на центральных телеканалах и в основных печатных изданиях (это, кстати, тоже немаловажная часть административного ресурса едра)?
Правильно понимаю, что если ты не видел этих заявлений, то их и не было?
Западные СМИ трубят о 5 тысячной демострации в Москве с овертонами "конец кровавого режима Путина".
Было б хоть одно реальное заявление растиражировали бы широко.
А тебе западные СМИ докладывают, что бы они сделали в том или ином случае, или ты просто из пальца это высасываешь?
Ну уж не больше чем высосано в этой статье и ей подобных.
Все бюллетени для вбросов берутся непосредственно из того, что выдаётся комиссии.
Исполнители в комиссии уже отбираются по признаку готовности закрывать глаза (именно по этой причине во многих школах в комиссии очень трудно набрать народу - даже зависимые люди не хотят этого делать). Того, кто захочет "заявить об этом", никто в комиссию просто не позовёт, а если он там окажется - будут приложены усилия, чтобы его блокировать.
Ну решит член комиссии пожертвовать своей работой и благополучием, но рассказать о фальсификации - и чего? Даже если у него будут доказательства - ну и что. Роликами, где членов комиссии за руку ловят с пачками, и так полно. Конкретных председателей за это, может, даже и уволят (хотя скорее будут отмазывать всеми силами). Но их тьмы и тьмы. А тут ожидается, что член комиссии, из заранее отобранных, не только захочет рассказать, но и сумеет запротоколировать подмену или вброс (между делом, в действиях, котирующихся, как преступление, никогда не участвует вся комиссия, эту работу берёт на себя 3-5 человек, а иногда даже один), да будет бороться за её признание... и за это почти гарантированно получит разрушенную карьеру? А ради чего? Ну, появится на ютубе ещё +1 ролик. Их там и так уже полно.
Наблюдатели хоть в общем случае ничем не рискуют
Ну да, ну да, сидят там за столами посреди комнаты и сотнями галочки проставляют.
Может конечно у меня и не 2 грамма, измерить не могу, но уж точно больше, чем у Вас.
Можно ссылки на "полно роликов", где ловят за руку с пачками?
А на то, чтобы контролировать комиссии и есть наблюдатели. Если они со своей работой не справились, или не хотят передавать дела в суд, и т.д., это уж не вина власти, не так ли? Если встает вопрос "зачем", то, действительно, незачем.
А то, что вбросы в принципе были, это и ежу понятно. Это ж политика епрст, грязнее дела в мире нет, даже бизнес отдыхает.
Цитирую:
В общем, ребята. ПЕРЕПОСТИТЕ, кто может. В такую наглую кражу голосов трудно поверить, но она случилась.
У меня на руках официально и правильно оформленный протокол участковой избирательной комиссии 1701, где я работал наблюдателем. Я сам был до конца подсчета и отвечаю за результаты. Вбросы если и были то минимальные. Вот РЕАЛЬНЫЕ результаты:
1. КПРФ - 285
2. ЕдРо - 271
3. Справедливая Россия - 218
4. Яблоко - 167
5. ЛДПР - 133
6. Правое дело - 16
7. Патриоты России - 15
Вот что я увидел сегодня на сайте ЦИК:
1. Единая Россия - 662
2. КПРФ - 295
3. ЛДПР - 133
4. Справедливая Россия - 118
5. Яблоко - 67
6. Правое дело - 16
7. Патриоты России.
Еще раз. Это при том, что есть официальный итоговый протокол с печатью и всеми подписями.
Итак. Всем понятно? Карусели, шмарусели, наблюдатели - им, ворам и жуликам, просто посрать. Они нарисовали то, что захотели. Но я же ведь не забуду-не прощу, дорогие товарищи из участковой избирательной комиссии, ТИКа, шмика и всех кто, по выяснению обстоятельств, окажется виноват. Я вам обещаю, что каждый житель этих конкретных домов будет знать, кто украл его голос. С фамилиями, рабочими телефонами. Если газету мою оттуда выкините, я сам на А4 распечатаю и распространю. Это минимум, что я обещаю сделать. Ну, и там еще прокуратура, то да сё.
фото протоколов тут:
https://www.facebook.com/media/set/?set=a.10150450178274265.381702.652364264&type=3
они же вконтакте:
http://vk.com/feed?z=photo1656055_273051649%2Fwall1340463_161
подборка с аналогичным:
http://caunte.livejournal.com/15522.html
http://putin-pidor.livejournal.com/
"о я же ведь не забуду-не прощу, дорогие товарищи из участковой избирательной комиссии, ТИКа, шмика и всех кто, по выяснению обстоятельств, окажется виноват. Я вам обещаю, что каждый житель этих конкретных домов будет знать, кто украл его голос. С фамилиями, рабочими телефонами. Если газету мою оттуда выкините, я сам на А4 распечатаю и распространю. Это минимум, что я обещаю сделать. Ну, и там еще прокуратура, то да сё."
Интересные такие приоритеты.
Всем рассказать (бесполезное действие) - самое важное
Подать в суд/наказать нарушителей (полезное действие) - ну там как получится.
С нетерпением ждем результатов процесса, не забудьте сообщить.
"честных", а точнее спалившихся нашлись десятки.
Вот например:
http://www.novayagazeta.ru/inquests/49943.html
Мне очень понравился подход, спасибо!
Было бы здорово собрать такую статистику по всем регионам России, чтобы лучше представить себе реальную обстановку в стране. Если останавливают какие-то технически сложности, буду рад помочь (я математик и программист).
Вроде, методика понятна - любой может сделать аналогичный анализ и выложить его хотя бы прямо сюда в комментарии. Можно даже программку написать, чтобы она выкачала инфу с сайта и создала эксельку с диаграммами.
Разберем этот очередной развод
Итак, статья.
Она состоит как бы из трех частей, первые две которых основаны на некотором анализе, представленном на двух графиках, а заканчивается она синтезом результата, основанном на некоторой логике.
По порядку разберем все три части.
Первая часть. Здесь показать развод проще всего, так как для того, чтобы понять как автор манипулирует сознанием - даже не нужно знать всех премудростей математической статистики.
"Каждая точка на графике - это результаты одной партии по одному избирательному участку. По оси Х - явка избирателей на данном участке, по Y - результат соответствующей партии на этом участке, а именно, процент проголосовавших за эту партию, от общего числа зарегистрированных на участке избирателей. Именно так, а не процент от общего числа проголосовавших на участке. Почему надо делать именно так, должно быть ясно из самого графика. У всех партий, кроме ЕР, на каждом участке есть какой-то количество приверженцев, которые смогли таки в воскресенье дойти до избирательного участка, поставить в графе крестик и опустить бюллетень в урну. Это количество составляет всегда примерно одинаковую долю от общего числа избирателей на участке. Что, в общем-то, вполне логично. Но у ЕР всё не так, в их случае чем больше на участке явка - тем больше у партии приверженцев."
Логика автора уникальна. Допустим, ЕР тоже была бы "нормальной" партией и ее поведение совпадало бы с поведением других партий. Нормальная партия по логике автора - это у которой фиксированное количество избирателей сколько бы народу не пришло. Получается, что придет на участок 1000 человек - проголосовавших некое количество, придет 2000 - проголосовавших будет такое же количество!!! А что же эта лишняя 1000 человек делала на участке, мозг всем трахала как автор?
Более того, этим графиком автор, наоборот, все прекрасно объяснил. Этот эффект известен был еще с выборов 1996 года. Тогда по предварительным расчетам было понятно, что коммунисты выборы выигрывают (скорее всего, они выборы и выиграли). И эти расчеты показывали, что результат напрямую зависит от того, какая часть аполитичного населения придет на выборы, т.к. именно аполитичное население обычно голосует за партию власти. Это естественно, так как политикой интересуются те, кто чем-то недоволен. И тогда было беспрецендентное количество рекламы выборов, потому что главная задача демократов была вытащить всех кого можно на выборы, аполитичное население поднимало процент партии власти. Политизированное население придет на выборы в любом случае.
Эта простая логика работает и сейчас и отлично согласуется с этим графиком.
Вторая часть. Те же самые яйца, вид сбоку, да не совсем.
Конечно, график статистически несколько "некрасивый". Результаты большинства партий выглядят как нормальные кривые и по закону больших чисел вроде бы так и должно быть. Но закон больших чисел работает, только когда нет системных искажающих факторов! Вот, скажем, какая зависимость распределения голосов Справедливой россии, КПРФ и ЛДПР от территории? Есть ли корреляция распределения голосов между этими тремя партиями от социального положения человека? Я например, не могу его уловить, мне кажется, что выбор можно сделать только на основе множества факторов, которые не сильно зависят от территории, например, отношения к СССР, националистических настроений и т.д. Зато главный фактор результата партии власти - это социальное положение, которое напрямую зависит от территории. В одном районе открыли метро - на близлежащих участках результат будет высокий (на юге Москвы результат ЕР значительно выше), в другом районе затянули со строительством развязки - результат ниже. С яблоком то же самое. В Бирюлево живут сплошные чурки, им Яблоко партия неизвестная, а про Собянина они что-то слышали. В ЦАО живет маргинальная интеллигенция, засыпающая с томиком Мандельштама под подушкой, результат Яблока зашкаливает. Ни о каком нормальном распределении тут реччи уже быть не может.
Третья часть. Синтез результатов
Напоследок, попробуем посчитать результаты выборов по модальным значениям распределений на графике, т.е. по наиболее часто встречающейся поддержке. Итого поддержка по партиям получается: Яблоко - 5,5%, КПРФ - 12%, ЕР - 12%, ЛДПР - 6%, СР - 8,5%, "Патриоты России" - 0,8%, "Правое Дело" - 0,5%. В сумме это будет 45,3% - это что-то вроде модальной явки.
Поделив модальную поддержку на модальную явку, получим альтернативные результаты выборов по Москве: Яблоко - 12,1%, КПРФ - 26,5%, ЕР - 26,5%, ЛДПР - 13,2%, СР - 18,8%, "Патриоты России" - 1,8%, "Правое Дело" - 1,1%.
"Причесывать" результат по моде - это абсолютно новое слово в статистике. Похоже ряд нужно дополнять - "Ложь", "Наглая ложь", "Статистика" и "Надругание над статистикой". Чтобы понять абсурдность этого метода, пример. Бизнес у дистрибьютора состоит их складской и коммерческой частей. Зарплата работника склада зависит от выработки. так как все люди по своим способностям похожи, то зарплата у всех схожая, допустим, 20000+/- 5000, мода - 20000. Коммерческая служба - совсем другое. Там могут быть как девочки, помогающие менеджеру за 15 тысяч, так и коммерческие директора за 100 тысяч. Если отсортировать людей по ролям, квалификации, заслуженным бонусам от продаж - то похожих по своим достоинствам людей рядом стоять практически не будет. Но, например, политика компании такая, что руководители групп продаж, маркетинга и ценообразования получают практически одинаковые зарплаты в 60 т.р. И при построении гистограммы с узким шагом у нас в коммерции образуется мода 60 т.р., при том что средняя зарплата около 30 т.р., а на складе 20 т.р. Мы получаем две моды 20 и 60. Но задача у нас - получить средние зарплаты. 20 и 60 - многовато, так как статистика показывает, что средняя зарплата по компании 25 т.р. (что естественно, так как кол-во работников склада и коммерции - поровну, а средние зарплаты 20 и 30, но нам это не интересно, мы ввели новое слово в статистике и сравниваем по моде). 20 и 60 приходится пропорционально урезать до 15 и 45. И вот - ура! мы получили новый результат.Несмотря на то, что на складе 15 получает только самый плохой работник - средняя зарплата склада 15 т.р.!
> Получается, что придет на участок 1000 человек - проголосовавших некое количество, придет 2000 - проголосовавших будет такое же количество!!!
На самом деле придёт на выборы всегда примерно один и тот же процент избирателей. Советую над этим подумать и посмотреть статистику других (предположительно честных) выборов.
> В Бирюлево живут сплошные чурки, им Яблоко партия неизвестная, а про Собянина они что-то слышали. В ЦАО живет маргинальная интеллигенция, засыпающая с томиком Мандельштама под подушкой, результат Яблока зашкаливает.
При этом волшебным образом в Бирюлево по официальным данным Яблоко набирает 3,11% и 4,85% (по Восточному и Западному), а на Арбате - 1,80%.
> Ни о каком нормальном распределении тут реччи уже быть не может.
Как же оно по СР, ЛДПР и КПРФ получается нормальным?
> Похоже ряд нужно дополнять - "Ложь", "Наглая ложь", "Статистика" и "Надругание над статистикой".
"Надругание над статистикой" - это то, что ты пишешь дальше про зарплаты. Но ты забыл добавить: "Казалось бы, какая связь с выборами?"
Жги ещё.
Подозреваю, что я веду дискуссию с человеком, который не только не понимает математической статистики, но даже и не попытался вникнуть в то, что я написал.
"На самом деле придёт на выборы всегда примерно один и тот же процент избирателей. Советую над этим подумать и посмотреть статистику других (предположительно честных) выборов."
На участке 10000 избирателей. КПРФ, Яблоко, СР, ЛДПР нормальные партии и приходит всегда 10% сторонников от общего количества избирателей. ЕР тоже стала нормальной партией и тоже приходит 10%, т.е. по тысяче человек.
При 50% явке все четко. По 1000 избирателей пришли. Но вот где-то активность ЦИК была выше, где-то доступность избирательных участков лучше и пришло 5500 человек. Но все же партии нормальные, соответственно у всех должно быть по 1000 человек. А эти 500 человек должны раствориться в пространстве. Это бред.
При более высокой явке результат партии власти выше.
"При этом волшебным образом в Бирюлево по официальным данным Яблоко набирает 3,11% и 4,85% (по Восточному и Западному), а на Арбате - 1,80%."
Возможно, я заигрался с красивыми сравнениями, проверять цифры не буду.
"Как же оно по СР, ЛДПР и КПРФ получается нормальным?"
Кому я писал все про корреляцию условий территориальной расположенности и политических пристрастий? Стенке?
Прочитайте хотя бы в Википедии, что такое "центральная предельная теорема". Ключевым условием нормального распределения суммы случайных величин является "слабая зависимость случайных величин". Коэффициент корреляции причин, заставляющих голосовать за СР, ЛДПР и КПРФ (я привел такой пример как ностальгия по СССР) и территориальной расположенности близка к 0. При голосовании же за партию власти один из важнейших фактор - это удовлетворение существующим положением дел (благосостоянием, социальной защищенностью и т.д.). И коэффициент корреляции этого фактора с территориальным расположением очень высокий. Достаточно сравнить результаты ЕР в Москве и Подмосковье.
Я не знаю, как объяснить понятнее. Например, на рублевке есть сто деревень - 50 с чиновниками, 50 с интеллигентами. В одной результат ЕР около 95%, в другой 10%. Эти распределения никак "не сольются в один горб", на графике распределения так и будет два горба - один в левой части, другой в правой.
""Надругание над статистикой" - это то, что ты пишешь дальше про зарплаты. Но ты забыл добавить: "Казалось бы, какая связь с выборами?""
Я применил логику автора к ситуации в моей компании один-в-один, абсурдность подобной логики настолько очевидна, что я даже не знаю как написать понятнее. Но готов аргументированно ответить на конкретные вопросы, если они будут. Ключевое слово - "конкретные".
> Например, на рублевке есть сто деревень - 50 с чиновниками, 50 с интеллигентами. В одной результат ЕР около 95%, в другой 10%.
Ты бы что ли цифры хоть какие-нибудь посмотрел бы, прежде чем тезисы выдвигать. Давай, обоснуй корреляцию между "удовлетворённостью существующим положением дел" и голосованием за ЕР. Желательно с цифрами. Хотя бы по Москве.
> Подозреваю, что я веду дискуссию с человеком, который не только не понимает математической статистики, но даже и не попытался вникнуть в то, что я написал.
Этот человек сделал статистический анализ результатов выборов, а ты - нет.
> Но все же партии нормальные, соответственно у всех должно быть по 1000 человек. А эти 500 человек должны раствориться в пространстве.
Я тебе ещё раз повторю, а то ты, похоже, не пытаешься вникнуть в то, что я тебе пишу. Реальная явка везде примерно одинаковая. Именно поэтому у "нормальных" партий процент голосов от официальной явки не зависит. А у ЕдРа - зависит с наклоном очень близким к единице. А не с наклоном, равным проценту голосующих за ЕР, как должно быть по твоей модели.
Из положительного, что Вы сделали - это графики. Но обоснование ниже любой критики, это не статистический анализ, не буду говорить, что это.
Проверить выводы, основанные на первом графике можно - нужно действительно сравнить показатели с другими выборами. Напишите откуда брать статистику - я может быть на выходных сделаю. Про выборы 96 года я не сочинял, я смотрел документальный фильм, если не ошибаюсь, про Березовского, где описывался принцип более высокого результата партии власти в зависимости от явки, и что тогда делали люди Березовского для обеспечения нужного результата.
Для обоснования корреляции между "удовлетворённостью существующим положением дел" и голосованием за ЕР нужна некая функция "удовлетворенности" в зависимости от района. Если есть идеи как оценить ее значения - я готов рассчитать такую корреляцию. Без этого могу предложить лишь то же самое - построить график с каких-либо предыдущих выборов и тоже увидеть на нем, что никакого нормального распределения у партии власти нет и график будет "размазан".
"Я тебе ещё раз повторю, а то ты, похоже, не пытаешься вникнуть в то, что я тебе пишу. Реальная явка везде примерно одинаковая. Именно поэтому у "нормальных" партий процент голосов от официальной явки не зависит. А у ЕдРа - зависит с наклоном очень близким к единице. А не с наклоном, равным проценту голосующих за ЕР, как должно быть по твоей модели."
По моей модели у всех должен быть положительный наклон, у партии власти в области высокой явки больше показанного ей результата. До 55% мы это и видим. Хотелось бы увидеть гистограмму распределения количества участков (а лучше проголосовавших) в зависимости от явки. А то получится, что 90% как раз в диапазоне 45-55%, а остальные составляют 10%. Я тогда соглашусь, что на остальных 10% были нарушения в пользу ЕР (не буду думать, какая еще может быть общая причина высокой явки и "внезапной любви" к ЕР, вбросили так вбросили), но при этом мы придем к выводу, что "накрутили" партии власти процента 3-4, не больше.
Нет, я так не предполагаю. Я говорю лишь о том, что среди аполитичного населения сторонников партии власти больше. Из моей логики следует, что все линии должны иметь положительный наклон, наклон (производная) линии партии власти больше. Более развернутый комментарий я дал ниже. До явки в 55% первый график выглядит абсолютно естественно.
Если до сих пор не заметно — речь не об абсолютных, а о нормированных значениях.
Т.е. в приведённых примерах 500 "лишних" человек не испаряются, а распределяются между партиями по соответствующему соотношению "сторонников", а неравновесность территориального распределения сторонников ЕР должна уравновешиваться антисимметричным территориальным распределением сторонников прочих партий.
Нормированных значений на графике нет, потому что и по оси X и по оси Y отложены проценты. Процент сам по себе в некотором смысле нормированная величина. Я показал, что фиксированного процента быть не может, потому что на любом вертикальном срезе сумма процентов должна совпадать со значением по горизонтальной оси. Собственно, так на графике и есть. Поэтому признак "нормальных партий" автора абсурден, линии графика не могут быть у всех горизонтальными, чтобы увеличивать суммарный процент какая-то из партий по-любому должна быть "ненормальной".
Другое дело, что логичной все-таки является ситуация, при которой все линии графика имеют положительный наклон, при этом партия власти должна быть просто с большим наклоном. Мы это и наблюдаем на участках с явкой до 55% (а это, я так понимаю, большая часть участков), потом, конечно, наблюдается некоторая аномалия. На первый взгляд, линии графика других партий не должны быть горизонтальными, но тут тоже нужно подумать о корреляции явки и поддержки партии власти (конечно, вбросами бюллетеней это тоже можно объяснить:), здесь спорить бессмысленно).
> "приходит всегда 10% сторонников от общего количества избирателей"
давай с ног на голову не будем переворачивать и возмём по нормальному:
- есть 5 партий
- процент симпатий (популярности) у всех равный (20%)
иначе в твоем случае выходит, что 50% избирателей, если придут на выборы, то только ради того что бы испортить бюллютень.
> "И коэффициент корреляции этого фактора с территориальным расположением очень высокий"
Промашечка выходит - есть участки расположенные в одном районе (часть домов относится к одному участку, часть к другому).
Районы однородные, дома поделены между участками без учета социальных факторов (не так, что бы элитные в один, а трущобы в другой).
Разница между участками только одна - в одном были наблюдатели, в другом нет.
http://varfolomeev.livejournal.com/610339.html?thread=21512483#t21512483
http://easyneuro.livejournal.com/1206.html
http://wilhelm-tell.livejournal.com/96180.html
"давай с ног на голову не будем переворачивать и возмём по нормальному:
- есть 5 партий
- процент симпатий (популярности) у всех равный (20%)
иначе в твоем случае выходит, что 50% избирателей, если придут на выборы, то только ради того что бы испортить бюллютень.
"
Читайте внимательнее условия построения графика. Процент считается от всех избирателей вообще. Зачем так считать - я сам не знаю. В вашем примере получается, что пришли вообще все, кто мог.
"Промашечка выходит - есть участки расположенные в одном районе (часть домов относится к одному участку, часть к другому).
Районы однородные, дома поделены между участками без учета социальных факторов (не так, что бы элитные в один, а трущобы в другой).
Разница между участками только одна - в одном были наблюдатели, в другом нет."
У меня нет возможности проверить правдивость информации, особенно то, какие дома элитные, а какие нет. Ситуации всякие могут быть, я же не говорю, что выборы на всех участках были честными. Я смотрю на графики, которые отражают, скажем так, макропоказатели, и указываю на ошибки в рассуждениях автора, так работать с цифрами нельзя, это подгонка данных под заведомо нужный результат.
В принципе, если участки небольшие, то выбросы любые могут быть. Даже одинаковые с внешней точки зрения районы, в которых живут люди с примерно одинаковым достатком могут показывать стабильно разные результаты, потому что когда то при советской власти в один дом заселили партийных, а в другой работников АЗЛК. Но при этом может быть и подтасовка результатов. Однако нельзя говорить со 100% гарантией, что по-любому подтасовка.
> "В вашем примере получается, что пришли вообще все, кто мог"
Неверно.
До "пришли" я даже не дошёл.
Если в моём случае считать, что всего имеется 10000 избирателей и явка 50%, то придут 5000 избирателей, которые равномерно проголосуют (по 20% за каждую из партий).
В моём случае не возникает никаких проиворечий - придут 75% и также равномерно проголосуют (по 20% за каждую партию).
Никаких "пропавших" голосов не образуется.
> "
какие дома элитные, а какие нет"
дело же даже не в домах, а в наблюдателях.
если выходит, что на участках с нормальными наблюдателями (от оппозиции, которые бдили до конца) процент один, а на остальных другой, то подтасовка имеет место быть.
тут лишь на основе общедоступных данных это дополнительно подтверждают.
И в догонку - с машиной не договоришься:
http://corbulon.livejournal.com/77300.html
"
КОИБ (комплекс обработки избирательных бюллетеней) - сканер с компьютером, позволяющий считать бюллетени без участия человека. Участки с КОИБ существенно лучше защищены от фальсификаций.
Можно сравнить, как отличаются результаты голосований на участках, где люди не могли вмешаться (с КОИБ - зеленые кривые) и где люди считали сами, утверждая, что они честные (без КОИБ - желтые кривые).
(Данные ЦИК по Москве, где, как считается, фальсификаций как будто меньше, чем в провинции.)
Разница - целиком дело человеческих рук: никакими национальными или региональными особенностями ее не объяснить.
Смотрим внимательно.
Если нет КОИБ, то кривые становятся не колоколобразные, появляется дикая правая ветка, означающая, что туда "подбрасывали" голоса. Это видно и по голым цифрам справа от таблиц.
Не случайно на предстоящих выборах КОИБ будет применяться реже и, что тоже важно, они рассыпаны по разным территориям, чтобы было труднее сравнить.
Посмотрите и на зубцы на желтых кривых: круглые числа (65%, 70%, 75%...) явно привлекают фальсификаторов: даешь план!
ЦИК и Чуров эти результаты, основанные на их же первичных данных,
НИКОГДА НЕ КОММЕНТИРОВАЛИ и даже НЕ ПЫТАЛИСЬ ОБЪЯСНИТЬ"