Previous Entry Share Next Entry
Гауссиана - фальсификация для доказательства фальсификации
8cinq

Предыстория


В период пост-выборного срача, в интернете появились несколько видов "математического доказательства" фальсификации выборов. Например вот такой график, так называемой "гауссианы".



Впервые столкнувшись с гауссианой при анализе выборов, я впал в ступор. Я не математических наук доктор, а матанализ для меня давно законченный предмет из далекого университетского времени. Но я всегда считал, что с математикой и логикой у меня лады - мне часто приходится иметь дело с функциями по работе, приходится думать над логикой работы больших систем в веб проектах - тренировка есть. Но тут я почувствовал себя дураком - я читаю комментарии "математического доказательства", которые изобилуют уверенностью в своей правоте. Даже те, кто умом, на вид, не отличается - и те похоже все поняли. А я сижу и вижу только лишь гистограмму, которая сообщает нам бессмысленную статистику. При чем здесь гауссиана? Как вообще можно применять гауссиану в качестве социологического исследования?

Я постучался в скайп к своему знакомому, ядреному технарю, который уж точно должен был мне вправить мозги. Тем более никакой симпатии к власти он не испытывает. Он тоже напрягся, подумал, мы почитали тексты эсквайра и блогов - но смысл всего этого действа опять ускользнул от нас. Стало ясно, что дело мутное и нужно в это серьезно вникать, чтобы написать опровержение. На написание статьи ушло 2 дня. Задача представлялась сложной. Сложно объяснять бессмысленность.

Благодарю 4izh за помощь в составлении материала. Его комментарии в тексте будут отмечены вот таким цветом.


Что такое гауссиана и что она здесь делает?


Начнем с того, что гауссиана - это функция, которая предназначена для изучения отклонений в технических измерениях. К гистограмме выборов это не относится, ведь никакой функцией мы не пользуемся. Если и есть смысл применять к ней какой-то научный термин, то это Нормальное Распределение - такое распределение случайных данных, гистограмма которых напоминает колокол по своей форме.

Область применения гауссианы. Например, мы изобрели супер нанотехлологичный измеритель радиации. Оценить качество нашего изобретения можно при помощи несложных тестов: мы берем кусок урана с заведомо известным (точным) уровнем радиации и начинаем его мерить нашим прибором. Для точных показателей мы заинтересованы в большом количестве замеров (репрезентативной выборке). Замеры не будут постоянно давать одинаковый результат, а мы будем получать некий разброс. Выстроив гистограмму, мы должны получить нормальное распределение полученных величин - тот самый "колокол", где значение горизонтальной координаты пика является истинным значением уровня радиации, а из характера формы мы можем получить полезные статистические величины, как, например, погрешность измерения. Именно этот показатель и будет отвечать за качество нашего изобретения.

Но и с Нормальным Распределением существует проблема. При желании можно даже детский рисунок радуги сравнить с Нормальным Распределением по внешнему виду, но кроме как для создания "ореола научности" это не будет иметь смысла. Строго говоря, ни один анализ выборов в сети, ни одной партии, ни одной страны - не соответствует нормальному распределению. Или у вас ровный "колокол" или ваше распределение не попадает под этот термин.


Что там у других стран с гауссианой?


Чтобы доказать бессмысленность данного подхода, мы взяли на себя работу по построению нормального распределения для выборов в Польше - страны, которую часто используют как пример хорошей избирательной системы. В выборке участвовали все 25983 избирательных участка страны.

Для пытливых: таблица с данными, внутри файла ссылка на первоисточник. Благодарю Opera.Rulez за помощь в сборе данных.



Не очень колокольно, но все же напоминает нормальное распределение. Но это партия Польши не с самым большим количеством голосов, она проиграла. А как дела обстоят с ведущей партией?



Блядь, это кадр из фильма "Челюсти"!

Как видно, никаким "колоколом" здесь не пахнет, даже распределение ЕР больше похоже на Нормальное Распределение. А сколько "зубчиков" ?!

А ведь Польша маленькая страна, в сотни раз меньше России, где намного меньше раздробленность людей по национальности, достатку и среде обитания. По сему, вопрос с гауссианой считаем нужным закрыть. Если кто-то сует вам в нос данное "математическое доказательство", то можете смело раскручиваться на месте как юла, раскинув руки, громко хохоча. Эти графики не означают ничего.


График Голоса/Явка


Осталось разобраться еще с одним графиком, который можно встретить в сети. Это отношение Голоса/Явка. Выглядит он так:



С одной стороны этот график как бы намекает нам, что на некоторых участках явка невероятно высока, 90-100%, что намного реже встречается в других странах. Это нам может говорить о том, что на этих участках вбросили бюллетени.

Или нам это может говорить о том например, что это военные части, куда всех загоняют голосовать без исключения. Например, в Польше, которую мы берем за образец, такое тоже бывает - явка 100%. А представьте сколько у нас в России военных частей? Сотни их. Можно ознакомится с мнением непосредственного участника таких голосований.

Есть здесь и другой фактор - маленькие бедные области. Например Атяшевский район Мордовии, где за ЕР отдано 99% голосов. Это три десятка деревень в далеком отшибе от цивилизации. Какие вообще могут быть политические предпочтения в таких местах, как вы себе представляете? Там попросту не знают политической жизни. - Многопартийная система? - Ага, что-то слышал.

Сколько еще таких мест? Уйма - будет мало сказать. Приехали на вездеходе в деревушку, завезли полезной утвари от правящей партии и сказали - приходите обязательно, да голосуйте за нас. Людям то что? Проголосовали и забыли. В этом нет ничего хорошего, но и криминального тоже. Вот так в некоторых местах жизнь течет, среда обитания слишком бедная и жестокая, чтобы жить лучше. Тут уже скорей вопросы к демократическому устройству нашей страны, которое предполагает то, что далеко не везде возможно.

Говорят еще о том, что направляющая Голоса/Явка у ЕР отличается от других партий - она поднимается вверх. Но это говорит скорей о закономерности, чем о вмешательстве - иначе небыло бы ровной линии, а были бы скачки. Почему такая закономерность? Предыдущий абзац может быть на то подсказкой, а может быть и что-то другое.

Мы не можем говорить о какой-то единой причине повышенной явки, но даже в этом случае можно легко найти объяснение данному феномену. При высоком проценте явки среди голосовавших значительно повышается процент "случайных обывателей", людей далеких от политики и, разумеется, совершенно ничего не слыхавших о новых мейнстримовых тенденциях в интернете критиковать правительство. В рамках современной политической и информационной системы России повышенные показатели ЕР при высокой явке (если таковые наблюдаются) являются скорее нормой, чем отклонением от нее.

Так или иначе, здесь остается большое пространство для интерпретаций, с нами можно спорить, мы можем спорить в ответ - уже поэтому математическим доказательством этот график не является.


Кто это вообще придумал?


График Голоса/Явка относительно новое изобретение. Надо отметить, что, так называемый, независимый эксперт журнала Эсквайр, который придумал этот вид исследования - Сергей Шпилькин - физик. Не кандидат наук, и даже не работник своей профессии, а просто физик по образованию, работающий переводчиком - вот такой независимый исследователь социальных процессов. Уровень авторитетности мнения как бы намекает :)

Но это не самое интересное. Самое интересное с пресловутой гауссианой. Потому что впервые, в качестве исследования выборов, мы смогли ее отыскать только в январе 2005 года на Украине, во время проведения оранжевой революции. Резервная ссылка.

Хочешь не хочешь, а проведешь параллели.


Добавки?


Город высоких и низкоросликов: абсурдность гауссианы в социальном исследовании
Вбивание гвоздей в пики





Спасибо за статью! Хорошо было бы объяснить откуда взялись зубцы каждые 5%. Так же, если не ошибаюсь, в той статье были отброшены участки с количеством избирателей меньше тысячи, так что пример с маленькими областями не очень корректен. Тем не менее отличная статья!

>Хорошо было бы объяснить откуда
>взялись зубцы каждые 5%

Надо отметить, что создатели верхнего графика не могли получить пики ровно в 50%, 55% и т.д. Любой желающий может сделать поиск по результатам избиркома, убедившись, что такие круглые цифры там встречаются крайней редко.

Например попробуем найти ровно 65%:
http://yandex.ru/yandsearch?text=%2265.00%25%22+2011&clid=9582&lr=56&site=izbirkom.ru

Из сотни тысяч ИК такой процент встречается только пару десятков раз.

Другими словами пики не могут приходится ровно на те проценты, которые там подписаны. Видимо автор округлил положение пиков для наглядности, отчего и возникло мнение о том, что они идут ровно через каждые 5 процентов.

Так как ровной закономерности нет, то не сосем понятно что тут обсуждать. Чем больше данных будет для построения гистограммы, тем больше она будет покрыта зубцами - это можно проследить по выборам в Польше. У нас очень много данных, поэтому очень много зубцов.

Если вы считаете нужным, то мы можем построить свою гистограмму по России с открытыми данными. Тогда будет наглядно видно, что пиков ровно на тех круглых процентах нет. Но на это потребуется время.



> в той статье были отброшены участки с количеством
> избирателей меньше тысячи, так что пример с
> маленькими областями не очень корректен

Если это так, хотя трудно найти методологию исследования, то отброшены в данном случае только военные части. Деревенские области имеют один ИК на десятки деревень. В Атяшевском районе Мордовии, который я привел в пример, числится 9320 избирателя. И так все деревни, данные объединены в областные ИК.

Все хорошо только

На первом рисунке (статистика по России) количество участковых избирательных комиссий измеряется в тысячах,
А на последующих 2-х (статистика по Польше) в десятках, маловато будет для выборки.
Можно взять всего 2 УИК тогда распределение вообще прямое будет.

Re: Все хорошо только

В исследовании Польши принимали участие все ее 382 избирательных участка. К сведению, десятки УИК в левой шкале - это условности построения гистограммы, а не общее количество участков.

Это намного меньше, чем в России, но достаточно, чтобы выявить тенденции. Если она тут есть, то скорей в том, что чем больше голосов участвует в исследовании, тем меньше результат похож на "колокол". К тому же, график явки по Польше без тени сомнения используют журнал Эсквайр, и блоггеры, несмотря на то, что количество данных было абсолютно такое же.

К сожалению, нет такой страны, которая могла бы сравниться с Россией по размерам и могла бы стать образцом избирательной системы. Это могла бы быть Америка, но они не держит данные выборов в открытом доступе.

не факт что приведённые по польше графики не являются гауссовыми распределениями
просто может так быть что эти распределения просто не достаточно массовые
польша достаточно маленькая
а вот что касается исходного текста то фальсифицированность он таки доказывает по нескольким причинам
и прежде всего по тому что распределение голосов за ЕР не затужает в сторону 100%
потом там есть гребёночка пиков подогнаных к круглым цифрам 60,65,70,75,80 и т.д. голосов
так что

Берем мой УИК:
Число избирателей, внесенных в список избирателей: 1521
Число действительных избирательных бюллетеней: 617

Сколько голосов надо отдать за ЕР, чтобы получить круглый процент?

Если поддерживаете Путина, голосуйте за него на http://www.facebook.com/za.chestnie.vibory?sk=questions

Я когда, увидел, что используется метод нормального распределения, чуть со стула не упал.
Ибо в моем университетском образовании все перевернулось

Вот и мы тоже впали в ступор. Это как линейкой измерять речь диктора.

По Польше вы взяли не избирательные участки, а территориальные комиссии - в каждой еще куча участков. К тому же количество людей в разных территориях отличается в десятки раз, так что надо как минимум отнормировать на размер территории, как максимум - взять данные по УИК (которых там тысячи)

Сначала я неправильно понял вопрос, поэтому удалил свой комментарий. Очень затратно по времени ввести данные каждого участка, но если вы считаете, что 400 усредненных территориальных показателя не достаточно, то мы сделаем полный анализ. Но что-то мне подсказывает, что график станет еще более зубчатым, а общая тенденция не изменится.

"Говорят еще о том, что направляющая Голоса/Явка у ЕР отличается от других партий - она поднимается вверх. Но это говорит скорей о закономерности, чем о вмешательстве - иначе небыло бы ровной линии, а были бы скачки. "
Какие еще скачки? В модели "у ЕР реальный рейтинг где-то 20-25%, а все что больше - достигается вбросом бюллетеней" никаких скачков как раз не будет.

В какой такой "модели"?

400 отсчетов очень маленькое количество для подобного графика, естественно будут разрывы.

Графики обновлены, теперь там выборка из десятков тысяч. Перепадов стало меньше, но тренд остался таким же - Нормальным распределением не пахнет.

"Хочешь не хочешь, а проведешь параллели"

Параллели довольно условные. В украинском посте все заканчивается самым "смелым" отступлением от гауссианы у голосов за Ющенко.
А про гауса столько уже сказано... все решит коибизация страны и тотальный контроль за тиками и уиками и ЦИКами.

/* А ведь Польша маленькая страна, в сотни раз меньше России, где намного меньше раздробленность людей по национальности, достатку и среде обитания. */
не такая уж маленькая, населения меньше всего раза в три с копейками. откуда у вас в сто раз получилось?

Размеры территории я имел ввиду. У нас сколько автономных областей, где политика может быть успешной или не успешной? А сколько из этих областей в принципе всегда были бедными из-за условий среды обитания? Кто-то живет в вообще без связи с цивилизацией, куда можно добраться только по реке. Живут промыслом, а главное время года там - это сход льда с реки. От нас это вообще далекая жизнь. А сколько национальностей? Кавказ, который веками в войне между с собой и с соседями. Ведь все это влияет на мнение людей. Россия - это не техническое изделие.

вообще говоря сама статья расчитана (разумеется имхо) на не слишком грамотных людей.
"Распределение" это только гипотеза которая описывает данные с той или иной точностью.
Любой набор данных можно описать (интерполировать) любым видом кривых. При этом говорить, что тот или иной набор "имеет" то или иное "распределение" можно только в смысле определённой точности.
т.е. после интерполяции например методом наименьших квадратов можно сказать что данный набор данных является "нормально распределённым с такими то параметрами и таким то отклонением.
При этом применив два вида гипотез мы можем, в определённом смысле, говорить, что набор является таким то, а не другим, если отклонение существенно меньше.
Возвращаясь к топик старту - нельзя просто показать какую то картинку и сказать дескать эти данные не распределены нормально. ЛЮБЫЕ ДАННЫЕ распределены нормально. НО при этом они отклоняются от нормального распределения в большей или меньшей степени.
Для того, что бы утверждать, что данные по польше не подчиняются нормальному распределению нужно (разумеется имхо) привести ту гипотезу которая описывает это распределение существенно лучше и показать это количественно сравнив например интегральное среднеквадратичное отклонение.
НО
и этого (разумеется имхо) для целей топик старта недостаточно.
Для этого нужно ту же гипотезу применить к данным ЕР и показать (опять же количественно) что эта гипотеза адекватно описывает этот результат голосования.

так вот что именно подразумевает Гипотеза о логнормальном распределении результатов?
она в сущности говорит, что результаты не подтасованы на голосование не оказывается давления
результаты голосования не коррелируют ни с какими волевыми факторами
т.е. выборы - легитимны
а что утверждают наши оппоненты?
они утверждают что результаты выборов не подчиняются логнормальному
т.е. что они не свободные подтасованные и пр.?
ну так кто жеж спорит?

Можно вас попросить, раз уж вы собрали подробные данные по Польше, выложить их в формате, позволяющем связять участки на одной территории? Например чтобы был указан номер округа и код территории. Очень интересно составить графики по разным территориям, есть мнение что они должны быть больше похожи на гауссианы.

полностью поддерживаю
вообще желательно и те данные которые обсуждаются дать тоже в доступном формате
а не просто картинкой

Пожалуйста, прикрепите кнопку репоста в ЖЖ.

такое ощущение, что вопрос существования пиков на первоначальном графике вы упорно обходите стороной.

естественно, преобладания круглых цифр в исходных данных не будет, потому что дробное число голосов невозможно.

а вот как возможно:
к примеру, представим 6 участков, на которых нужно подогнать результат под 65%. допустим, округляют вверх и вниз с равной вероятностью.
всего_голосов 65% голосов_за_жуликов реальный_%
679 441,35 442 65,10%
135 87,75 88 65,19%
458 297,7 298 65,07%
553 359,45 359 64,92%
649 421,85 421 64,87%
644 418,6 418 64,91%

Мы не видим причин обсуждать зубчики, это слишком не серьезно в ввиду "откушенного" графика Польши. Про него вообще можно сказать, что там от ровного Распределения как будто кусок откусили - значит, мол, забрали голоса. Но это глупость будет. Тем более в гистограмме по России пики не на тех ровных процентах, которые подписаны автором.

Если этот вопрос вас действительно волнует, то мы можем заняться этом вопросом. Но, насколько я вижу, с Нормальным Распределением уже не модно возится, нынче оно слито по всем фронтам и модно искать закономерности в циферках ГАС/УИК.

Полный абсурд

Никакие математические функции немогут быть использованы для построения всяких тут "преумных" графиков.
Кем то упомянутый метод наименьших квадратов вообще изпользуется для построения градуировочных зависимостей приборов и к каким либо социологическим исследованиям непригоден. То же относится к вышеуказанным крываым.

Эдакая "наукообразность" для недалёких людей.

Я сам писал программное обеспечение для радиоизотопных измерительных приборов в течении 6 лет. Так вот, всякая функция подразумевает ПОВТОРЯЕМОСТЬ результатов, при следующих измерениях, что явно противоречит характеру данных о выборах, ведь повторяемость результатов на следующих выборах, согласно тому же закону нереально. То есть, чтобы функция имело право на жизнь, она должна повторятся от выборов к выборам на той же территории, что противоречит элементарной логике поведения избирателей.

Надо сравнивать не с другой страной, а с предыдущими несколькими выборами тут же, в России.
Безсмыслица однако...

Полная хрень

Ребята, вы полной хренью занимаетесь. Единицей учета в системе ГАС ВЫборы является не избирательный бюллютень, а протокол участковой избирательной комиссии.
ruelect.com/ru/ - тут сравнивают реальные протоколы УИК и данные, внесенные в систему ГАС Выборы. Только дураки и мерзавцы могут считать, что выборы не были сфальсифициорованы.

>>>> Сколько еще таких мест? Уйма - будет мало сказать. Приехали на вездеходе в деревушку,

Ага, Одним из наиболее фантастически отличившимся УИК на этих выборах стал участок в глухой деревне с вездеходами, находится в центре Москвы и называется АРБАТ.

Ага, не палятся однако, ради 0,1% голосов готовы в центре города устраивать вброс, а потом еще и отчитываться об этом в отрытой отчетности :D

Надо отметить, что, так называемый, независимый эксперт журнала Эсквайр, который придумал этот вид исследования - Сергей Шпилькин - физик. Не кандидат наук, и даже не работник своей профессии, а просто физик по образованию, работающий переводчиком - вот такой независимый исследователь социальных процессов. Уровень авторитетности мнения как бы намекает :)

Позвольте спросить вас о вашем уровне авторитетности?

> Блядь, это кадр из фильма "Челюсти"!
Это сумма двух гауссовых колоколов, а на первом графике у ЕР што? Сумма тыщщи колоколов? Ей-богу, не умеете пердеть в лужу - не пугайте аквалангистов.

Дружище, сумма двух гауссовых колоколов - это перл. Мы всем коллективом проплаченных путинойдов плачем и смеемся, плачем и смеемся.

Попробую вам объяснить, где и почему должна быть гауссиана. Рассмотрим случайную величину "явка избирателя на участок". Эта величина равна 0, если избиратель решил забить на выборы или по какой-то причине не смог на них прийти, и 1, если он на выборы пришёл (не важно, проголосовал, зачеркнул, порвал бюллетень или унёс его с собой). Так вот, очевидно, что явка избирателей на конкретный участок равна сумме явок всех избирателей, приписанных к этому участку (плюс открепильщики). Очевидно также, что явки разных избирателей есть величины независимые (хотя некоторая кластерная зависимость всё-таки может быть - явки членов одной семьи могут зависеть друг от друга, но при значительном числе избирателей влияние этих зависимостей ничтожно).

Итак, мы получаем, что величина явки на избирательный участок есть сумма независимых одинаково распределённых величин. Согласно классической центральной предельной теореме, эта величина сходится по распределению к нормально распределённой случайной величине. Что и требовалось доказать.

Во-первых, вы говорите о гистограмме количества участков к явке. Здесь же рассматривается гистограмма количества участков к проценту голосов отдельных партий на участках, и этот график не имеет ничего общего с явкой избирателей.

Итак, мы получаем, что величина явки на избирательный участок есть сумма независимых одинаково распределённых величин.

Во-вторых, не ясно, что вы вкладываете в понятие "одинаково распределенные величины".

(Deleted comment)
(Deleted comment)
(Deleted comment)
(Deleted comment)
(Deleted comment)
(Deleted comment)
А вот что вы на это скажете: http://lleo.me/dnevnik/2011/12/13.html ?

То, что если вы напишите функцию, рисующую нормальное распределение - она будет рисовать нормально распределение. А если нет, то не будет.

Вообще, мне жаль, что Леонид ввязался в эту грязь. Нужно иметь много мужества, чтобы признать свое поражение, особенно когда так далеко зашел. Теперь ему видимо остается упереться, как барану.

Кстати, одним из этих оплаченных путинойдов, которые ему писали, был я. Я давно слежу за творчеством Лео и мне было небезразлично его мнение. Я попытался вежливо смягчить его позицию, но в ответ получил лишь обвинение в продажности и отказ от диалога.

Спасибо за статью

Спасибо за статью, как глоток свежего воздуха среди популярного нынче псевдоматематического смрада.
Я также впал в ступор, увидев измышления о том, что распределение голосов должно быть нормальным. Мало того, что авторы демонстрируют явное непонимание, что такое нормальное распределение и где границы применимости ЦПТ, так они ещё изобилуют примерами графиков из других стран и громогласно заявляют, что вот они гаусианны истино демократических стран. При этом я, несмотря на физ-мат образование, хотя скорее из-за него, среди многих десятков подобных графиков смог увидеть от силы 2 графика, отдалённо напоминающих гаусианну. Очевидно, что результат партии на выборах похожий на гауссиану - это редчайшее отклонение, но никак не норма.
Я задумался возможно ли вообще применить к-л методы мат.статистики для моделирования распределения голосов. И единственным, что можно применить, на мой взгляд оказалась теория массового обслуживания. Каждый УИК можно рассматривать как систему массового обслуживания. При этом голосование за каждую партию является простейшим потоком событий, если принять допущение о том, что вероятность голосования за конкретную партию не зависит от времени голосования. Вероятность событий в простейшем потоке подчиняется распределению Пуассона.
Соответвенно совокупный результат партии на выборах в этом случае является суммой простейших потоков событий, другими словами обощенным Пуассоновским процессом. А распределение процентов за партию является суммой распределений Пуассона с разными λ.
Первым делом я перестроил гистограмму, которая чаще всего предъявляется в виде "математического" доказательства, только сделал это с нормировкой на кол-во голосов, принятых на участке. Очевидно, что участок с 20 голосами и участок с 3000 голосов имеют разный статистический вес, хотя те, кто строил растиражированную версию данного графика, это проигнорировали.
Получилось вот что: http://img823.imageshack.us/img823/6708/results05.png
Извиняюсь за внешний вид данной гистограммы, но сделал уж в виде графика, чтобы легко было сравнить с ненормированной версией. Видно, что большинство т.н. пиков на круглых процентов - плод чьей-то фантазии, даже при интерале 0.5% выбросы есть только в интервалах (70; 70.5) и (99; 100), в остальных местах виден только обычный шум.
Дальше я решил попробовать построить модель распределения голосов за ЕдРо, т.к. её распределение вызывает наибольшее кол-во вопросов, для этого я посчитал кол-во УИК для интервалов в 5% и для каждого значимого интервала подставил полученные коэффициенты в функцию вероятности распределения Пуассона. Получилось: http://img692.imageshack.us/img692/4743/formulav.png
Первые 3 слагаемых пришлось маленько подкорректировать, чтобы верхушка совпала, а остальные прямо по данным ЦИК. Множители - это кол-во участков, которые попали в 5% интервал, округлённое до сотен.
Потом я попробовал наложить эту функцию на гистограммы для интервалов 1% и 0.5%, и на обе она легла весьма неплохо, например: http://img266.imageshack.us/img266/1433/edro.png
Суммарное отклонение реальных данных от модельных составляет 2-3% в сторону увеличения результата ЕдРа. Хотя 100% совпадения с модельным распределением не будет ни у одной партии, однако отклонение могло бы быть и поменьше. Тут надо разбираться в первую очередь с причинами пиков в районе 75% и 100%, но это явно не математическая задача...

Re: Спасибо за статью

Спасибо вам за комментарий. Сейчас мало кто пытается без эмоций разобраться в том, что происходит. Если вы оформите свой комментарий в виде отдельного поста, то я могу сделать ссылку на ваш пост - так как вопрос с пиками актуален.

Как минимум, выдуманные пики не помешает разоблачить. На этом стоит заострить больше внимания.

На счет Пуассона - может быть в этом больше смысла, но с ходу, логически, не вижу прямой связи с выборами. Для улучшения предоставления услуг смысл виден, изучение потока событий в отрезок времени может помочь распределить рабочие силы организации. Но почему типовая гистограмма такого исследования должна быть похожа не выборы - не ясно. У нас ведь другой тип данных, без какой-либо связи со временем и с четкой зависимостью от территории.

Хотя нарушения были в любом случае - они есть в любой стране. Вопрос в масштабах. Не секрет, что во многих отраслях нашего государства и общества встречается совок. Не удивительно, что какие-нибудь главы администраций захотят накрутить голоса ЕР, чтобы потом в них не полетели тапки сверху - мол, народной поддержкой работа администрации не пользуется. С этим нужно разбираться в судебном порядке. Но раздувать из этого шум на весь интернет - это похоже то ли на массовый фанатизм, то ли на чью-то манипуляцию обществом. Потому что объективных причин поднимать революционные настроения не видно.

Распределение по Новой Зеландии

Из новенького. Распределение Гаусса по выборам в Новой Зеландии: http://marmotl.livejournal.com/209102.html

п.с. Перепостила Ваш текст у себя. Лучше поздно, чем никогда.
С уважением.

Re: Распределение по Новой Зеландии

Спасибо. Проблема графика новой Зеландии в количестве УИК, их слишком мало. Любой горе-математик сможет оспорить это исследование только по этой причине, и в этом отдельном вопросе, он будет прав.

Хотелось бы провести исследование Германии, как второй по численности страны в Европе, но я не смог найти детализированных данных, только обобщенная статистика по областям. Франция тоже интересна, тоже не смог найти, к сожалению.

Полный абсурд полного абсурда. Распределение процесса является нормальным если во время замера не происходило изменение предпочтений избирателей. Например в день выборов Медведев признается, что не спал со своей женой уже 10 лет (ну или к примеру педераст). И масса еще не проголосовавших избирателей меняют предпочтения, то есть происходит систематическое изменение результатов выборов, то есть изменение математического ожидания. В этом случае происходит смещение математического ожидания и распределение уже не является нормальным. Также если в участии принимают несколько сторон (так как например восточная и западная украина) то образуются две вершины, распределения. Однако, если таких различных сторон множество, то распределение все равно становится нормальным (средние таких сторон нормально группируются вокруг общего среднего). Если же никаких изменений предпочтений избирателей не происходило, то распределение должно быть нормальным (естественно, с шумами). В России никаких существенных различий между территориями в воззрениях нет: или вы хотите сказать, что есть существенная разница во взглядах на ЕР со стороны одной территории страны и другой (может быть вы хотите сказать, что например в городах и селах, которые начинаются на гласную все повально голосуют за ЕР, а в остальные на 40 процентов ровно). Кроме того, никаких изменений (вызванных какими-либо событиями) в течении дня выборов не было. Поэтому приходим к выводу, что существенные отклонения от нормального распределения не являются ни чем иным кроме как свидетельством фальсификаций.
И не надо из нас делать идиотов дешевыми попытками сослаться на неизвестный авторитет и опустить автора анализируемого вами первоисточника. Вы наверное забываете, что у всех нас есть мозг, и более того мы его иногда включаем. Откройте любую книгу по статистике и вы увидите, как часто в социологических службах производят анализ репрезентативности выборки на основе соответствия кривой распределения нормальному.

Re: Ну все понятно.

есть существенная разница во взглядах на ЕР со стороны одной территории страны и другой
Если вам не 16 лет, то вам должно быть известно, что территория России поделена на округа со своей самостоятельной администрацией, причем каждый такой округ поделен вплоть до районов. Очевидно, что каждая такая административная единица может работать хорошо или плохо.

Очевидно так же то, что немаловажной здесь является среда обитания. Каждый город и даже деревня основаны на каком-либо полезной жиле. Город Челябинск может быть столицей сталелитейной промышленности, у администрации города достаточно денег, чтобы и свет по всему городу был, и дороги были обновлены и расширены. А село Балашиха может жить скудным промыслом, да натуральных хозяйством - неликвидным в сравнении с южными территориями. Очевидно, что на этих двух территориях, у людей совершенно разные взгляды на жизнь, на то хорошо они живут или нет, двигается что-то в их городе или нет.

И это лишь часть примеров.

Признак не есть доказательство :)

Дело не в статистике, это уже крышка в гроб.

Понимаете, весь комплекс признаков фальсификаций настолько всеобъемлющ, что отрицать их нельзя.

Вам рассказать, как у нас работают суды или сами знаете? Так вот, суды не работают, в применении к выбором и ничего они расследовать по обращениям о нарушениях не собираются. Просто уничтожена одна из основ устойчивости страны, а именно справедливый суд, вы можете хоть сколько тут рассказывать о гауссиане, но её наличие или отсутствие никак не поможет вам, когда вас на переходе собъёт сынок чиновника.

Кто разрушил систему правосудия? Чиновники во главе с пу. Так же как ещё много чего в нашей стране. Пускай идут на хэр, если не могут ничего создать. Люди наелись уже прожектами и обещаниями.

Поймите, патриоты и либералы, левые и националисты пришли на один митинг и встали рядышком. Их не гаусс напугал и туда привёл. :)

Edited at 2011-12-29 09:28 pm (UTC)

?

Log in

No account? Create an account