Статистика, или как она может искажать реальную картину

Bakytzhan Bolatuly 2014 M03 4
1543
13
0
0

В своей жизни мы часто сталкиваемся с цифрами - в новостях, статьях, социальных сетях, практически везде. Иногда задумываешься стоит ли верить им? В большинстве случаев для...

Доброго времени суток. В своей жизни мы часто сталкиваемся с цифрами - в новостях, статьях, социальных сетях, практически везде. Иногда задумываешься стоит ли верить им?

В большинстве случаев для составления статистики проводят социальные опросы. Ведь, в паспорте не напишут ваш музыкальный вкус или политический взгляд. Это невозможно, провести опрос такого масштаба, чтобы узнать точный процент населения, который верит в Бога, слушает рэп музыку или болеет за Манчестер Юнайтед. Таким образом, берут долю населения от 0.1% до 1% и проводят опрос. Получается, что на основе данных 0.1% населения составляется статистика всего населения, всех 100%. Если опрос проведут, после состоявшегося рэп концерта, то получится, что в Казахстане, все (ну или большинство) слушает рэп. Если опрос проведут в пивном баре, то получится, что все у нас в стране пьют пиво. Ну конечно, люди, занимающиеся статистикой, не так глупы, поэтому они берут разные слои населения для того, чтобы составить наиболее точную картинку.

 

Для того, чтобы понять, как статистика искажает изображение современного общества, я попытаюсь вам объяснить все на пальцах. Я учусь в университете, где обучается около 5000 студентов. Возьмем 0.2% студентов от общего числа. Таким образом, я выбрал 10 случайных студентов от 1 до 4 курса. Я поинтересовался занимаются они ли спортом. 7 из 10 ответили положительно. Получается, что 70% студентов моего ВУЗа занимаются спортом. Все было бы нормально, если бы я был студентом Академии спорта и туризма, однако это не так. Также, я спросил сидят ли они в Twitter, в этот раз 5 из 10 ответили положительно. Теперь получается, что 50% студентов всего университета сидят в Twitter, когда в Казахстане всего лишь 0.3% населения зарегистрировано в Twitter. Удивительно, что 0.3% населения собрались и составляют 50% в моем университете. Тоже самое происходит на уровне государства.

В итоге получается, что статистика искажает изображение. Это невозможно (точнее слишком затратно) узнать информацию всего населения, чтобы составить наиболее точную статистику. На основе статистике составляются программы такие как по улучшению социального положения и другие. А если статистика не точна, верны ли будут эти программы?

P.S я не осуждаю статистику, не говорю, что она не верна и так далее. Моя идея в том, что реальная картина может исказиться из-за нехватки данных, так как это неправильно судить по 1% населения о всех 100%.

Оцените пост

0

Комментарии

0
во-первых,изначально проводится выборка опрашиваемых, в которую должны входить представители разных соц. слоёв населения, возрастов и т.п,а так же не проводятся никогда опросы по такому смешному количеству людей;
во-вторых, почитайте о таких понятиях, используемых в статистике, там для Вас, наверняка, будет открытием многое) в т.ч, что используется не только процентное соотношение и средняя арифметическая отметка,хаха)
в третьих, разумеется, факты все можно преподнести в зависимости от цели.Как говорил кто-то из великих, есть три разновидности лжи: ложь, гнусная ложь и статистика, однако аргументы у Вас провальные для доказательства этого факта
0
1) смешное количество людей? Редко проводят опросы, где участвует больше одного 1% населения
2) я тут объясняю всем, что мне теперь различные hypogeometrical distribution и Poisson distribution использовать? Я пытался, как можно проще донести всю мысль
3) я не говорил о лжи, я толковал о искажении
0
Вот тебе пример.
Ты приходишь на стадион и спрашиваешь у 10 человек, любят ли они бегать. 8 отвечают, что обожают бег, а двое - просто пришли поразмяться.

Получается, 80% жителей города любят бег? Нет, просто это крайне biased sample.
То что ты написал, это вообще не статистика.

Чтобы вывести более-менее осмысленную статистику про спорт по твоему ВУЗу, нужно не 0.2%, а хотя бы 2 (хотя вроде и этого мало, зависит от того, насколько разношерстны данные, normal distribution или right/left skewed). При этом выборку нужно делать у как можно разного количества людей. А вдруг ты просто сделал опрос среди ребят, которые возвращались с физры, а не прогуливали ее, играя в доту в общаге?? Думаю, суть понятна.

То же самое с твиттером. Если хочешь сделать statistical inference о всем населении вместе с апашками, гопниками, бомжами, челноками на базаре - придется делать опрос в том числе в аулах, вокзалах, депо, темных переулках и барахолках)

А еще лучше изучить азы теории вероятности и статистики.

Наверно, примерно так же ошибаются лудоманы, которые верят, что если автомат 20 раз ничего не выдал, то в течение следующих 20 раз он точно должен выдать выигрыш. Мол, статистика же, полюбасу ща отобьюсь. Чуваки просто не знали про закон больших чисел.
0
я с тобой не спорю, идея моего поста не в том, что статистика не верна и так далее, а в том, что она может искажаться из-за недостаточной информации, 0.2% которые я взял из моего универа, это те же самые 34 000 от 17 000 000 населения нашей страны. Мой пример, хоть и грубо, но показал, как может искажаться реальная картина
0
Тебе все и говорят, что то что ты показал - суть и есть намеренно искаженная картина, вовсе не статистика. Можно как угодно искажать данные, но это не значит, что их искажает статистика.
Показать комментарии