Previous Entry Share Next Entry
Город высоких и низкоросликов: абсурдность гауссианы в социальном исследовании (для новичков)
8cinq
Думаю не ошибусь, если скажу, что не многие понимают о чем вообще идет спор вокруг Нормального Распределения (гауссианы) применимо к выборам. Без предварительной подготовки - это потемки. Именно поэтому я пишу эту статью, чтобы на пальцах показать в чем суть противоречий. Пример может показаться грубым, но его задача - наглядно показать суть.

Возможно вы уже видели классический пример Нормального Распределения - это исследование роста людей.



Давайте попробуем сделать подобное исследование на примере гипотетического города, чтобы узнать есть ли смысл искать Нормальное Распределение хотя бы в таком простом исследовании.

В нашем гипотетическом городке будет 17 тыс. взрослых людей из единой популяции европеоидной расы. Самый распространенный рост здесь 180 см, так что рост ниже и выше встречается все реже. В жизни не бывает настолько ровного распределения, но в нашем сферическом городке все именно так математически ровно, для наглядности. Таблица данных



Действительно похоже на колокол. Примерно такого результата ищут некоторые математически "одаренные" личности при анализе выборов. Таким они себе представляют себе выборы - как случайный набор голосов однородной массы людей.

Но подождите, ведь не бывает такого, чтобы в одном городе жили только люди одной популяции, где рост взрослого человека колеблется в узких рамках? Давайте заселим в наш гипотетический город популяцию, скажем, низкорослых людей из Азии численностью в 17 тыс. человек. Так что теперь в нашем городе стало жить в 2 раза больше людей. Теперь перед нами стоит задача обновить исследование. Средний рост низкоросликов составляет 155 см, таблица данных.

Теперь мы изучаем всех людей города целиком, можете проверить сводную таблицу данных, чтобы убедиться, что там нет подтасовок.



Да да, это "они" :) Cудя по всему, анализ среднего роста оказался фальшивкой, раз у нас не получается "колокола".

Почему же так получается? Неужели не бывает в жизни миграции, когда разные популяции оказываются в одном месте? Неужели не бывает обособление национальных групп друг от друга, так что их геном медленно смешивается между собой? Все это бывает. Имело ли смысл вообще искать нормальное распределение? Конечно нет. Это исследование может быть полезно для ознакомления с тенденциями роста в обществе, но точно не для того, чтобы доказывать фальсификацию роста людей.

Такая же ситуация имеет место быть с выборами. Ведь мнение человека напрямую зависит от его места жительства и окружения. Мы имеем дело с огромной страной, десятком автономных областей и народностей, разных достатков, разной областной и районной администрацией - именно здесь летит к чертям математический подход к исследованию. Мнение человека - не случайно, поэтому поиск Нормального Распределения здесь не имеет смысла.




  • 1
Ключевые слова - Давайте засели в наш город 17000 низкоросликов из Азии, вы вели абсурдную величину и в результате получили сиськи на графике - поделом. Да математический подход не может быть абсурдным. математика это жизнь.

Это не абсурдная величина. Даже если вселить популяцию со средним ростом в 165, то Нормальное Распределение тоже не получится, но это будет не так наглядно. Я думаю, что любой человек с головой на плечах понял о чем речь.

Конечно, вы сломали колокол введя вторую популяцию такой же численности.
А вы введите сто популяций разной численности, и посмотрите, что получится.

Я знаю что получится. Каждая популяция будет иметь свой отдельный пик, потому как каждой из них будет свойственно свое среднее значение роста.

Если средние значения будут-более-менее близки, то в результате переналожения сто отдельных пиков сгладятся, и получится новое распределение, в целом приближающееся к гауссову.

Давайте заселим 17000 низкорослых азиатов - это синоним давайте вбросим 17000 бюллетеней за Единую России с низким рейтингом.
Фокус не удался.


Да вы, батенька, тупой.

У вас хорошо развита самокритика. Продолжайте в том же духе. Ваш пример прекрасно иллюстрирует правильность распределения Гаусса, которое нормально работает без посторонних вмешательств.

Как вам будет угодно. Я уверен, что любой человек с головой на плечах понял суть этого примера. Не понять ее могут только фанатики вроде вас, потому как голова уже не пашет, а присутствуют только эмоции. Вам, видимо, обратного пути уже нет. Сожалею.

Разумеется люди с головой прекрасно поняли, что вы пытаетесь опровергнуть законы статистики и при этом сели в лужу. Такие кривые как у Единой России и можно объяснить внезапным появлением на участке группы карликов, проголосовавших на Единую Россию. Вы бы еще привели в пример Чечню, где 99% проголосовало за Единую Россию.
Жаль таких изобретателей.

Вы окончили ВУЗ?
Вы понимаете область применения Гауссианы ?

ПС. Я так понимаю, что про тейповое голосование Вы слышите впервые?

Разделяю вашу точку зрения!

Что-то критики у вас в комментах какие-то несерьезные :)

Итак, двайте предположим, что ваши эльфы и гномы живут в одном городе и перемешаны по территориям проживания.

Рост людей не случаен - он определен принадлежностью к той или иной расе, а вот распределение рас по территории (хотя бы в Москве) - случайно. И разбиение территории на участки случайно по отношению к росту людей. Необходимо также сделать предположение, что в пределах одного города расы перемешаны более-менее однородно, что довольно-таки согласуется со здравым смыслом.

И вот эльфы и гномы приходят на участки измерять свой рост.
На каждом участке этот рост усредняется.
Усреднение таких случайных величин по центральной предельной теореме являет собой гауссово нормальное распределение.
Поэтому когда вы построите кривую среднего роста по участкам то получите Гауссиану.
Можете проверить моделированием на достаточно большом количестве популяции и участков.

Ваша же модель как иллюстрация возможно подходит под случай избирательного рассмотрения данных, скажем, какой-нибудь костромской области вместе с кавказскими республиками - да, население различно и сгруппировано по территориям.
Но по Москве-то должна выходить Гауссиана, а не выходит :)

Ну и конечно совершенно замечательно, что только ЕР не показывает Гаусса.

Ах да, про необъяснимые пики на "красивых цифрах".
Было красивое опровержение, показывающее объективное появление пиков на круглых цифрах из-за округления случайных величин. Правда пики были только на рациональных дробях 1/3, 2/3, 3/4 и т.п. А не на каждых 5% как у кривой.
Но и авторы кривой очень красиво ответили. Действительно признали наличие пиков. А затем добавили случайный шум, который устраняет влияние округления - многие пики исчезли, но самое интересное - многие, как раз на 5% интервалах остались! Ищите по ссылкам, все есть!

Я к тому, что слабое у вас "опровержение", совсем не интересное. Встречаются гораздо интереснее :)

Все в норме, братуха, как раз про пики готовлю материал.

а вы как для себя объясняете эти пики?

Гаусово распределение

Как не верти, не бывает так, чтобы для всех партий закон нормального распределения работал, а для одной партии - нет.
http://golosovanie.land.ru/images/raspr_uik_msk.PNG
http://golosovanie.land.ru/images/raspr_kol_uik_msk.PNG
http://golosovanie.land.ru/images/Ros_ER_abs_med.PNG

Re: Гаусово распределение

Начнем с того, что ваши графики, строго говоря, - ложь. Самое главную то проблему всех гистограмм партий и забыли - это пики на нулях. Для сторонников теории Гаусса в отношении к выборам - это очень неудобная информация - потому как с нулями вы делаете допущение, а с формой графика ЕР, хвостом ЕР, - не делаете.

Во-вторых - один город - это не репрезентативный результат. Вы же сами, сторонники Гаусса говорите, что чем больше данных тем больше должен проявляться колокол. А здесь выводите 1/15 от общего числа УИК и что-то хотите доказать.

Анализ "гауссианы" Единой Британии

http://pivopotam.livejournal.com/45842.html

не иначе как в старой доброй англии заносят бюллетени ящиками

читать до полного просветления

  • 1
?

Log in

No account? Create an account