Прийоми статистики

Статистика збирає, обробляє і аналізує дані (числа, тексти та інші типи даних). Зараз ви побачите, як знання основ статистики допомагає в різних реальних задачах.

Найчастіше в житті доводиться шукати щось середнє в наборі (або ряді) чисел. Припустимо, ви хочете дізнатися, скільки в середньому витратили за кожен місяць в році. Або навпаки заробили, якщо у вас різний щомісячний дохід. Тоді ви просто шукайте середнє арифметичне або просто середнє. Тобто складаєте все числа і ділите на їх кількість:

приклад:

(25 + 28 + 23 + 16) / 4 = 23

Іноді числа спеціально впорядковують за зростанням або спаданням: 28; 25; 23; 16, для знаходження найбільшого і найменшого чисел.

Додамо інший сенс цих чотирьох числах і припустимо, що це окуляри, зароблені улюбленою командою в чотирьох іграх. І тоді нам вже важливо, в якій грі вони отримали більше, а в який менше.

Знаючи найбільше і найменше, ми можемо порахувати розмах чисел, віднімаючи з більшого числа менше: 28 – 16 = 12 (розмах дорівнює 12). Наприклад, тут, розмах результатів істотний, значить, гра ведеться не дуже стабільно, або були обрані занадто сильні суперники.

Можна шукати не тільки середнє арифметичне, а й медіану, тобто середнє число. Адже якщо ви вважаєте зарплати всіх людей в країні, то середньо арифметично вони виходять досить хороші:

(15 + 18 + 25 + 28 + 36 + 47 + 160) / 7 = 329/7 = 47

Але це число дещо спотворює реальність, показуючи швидше середньо-високий рівень доходу.

Тому, якщо якісь поодинокі величини сильно завищені, з середнє вважати марно. Тут береться медіана (упорядкованого набору) – середнє число з упорядкованого ряду (в даному випадку 28) і воно буде практично однаково близько і до 47 і до 15, і значно точніше охарактеризує реальну ситуацію.

Якщо ж чисел в ряду парна кількість, як було в нашому прикладі з перемогами в іграх, то для розрахунку медіани беруться два середніх числа і вважається їх середнє арифметичне: (23 + 25) / 2 = 24. Тут практично збіглося з нашим середнім арифметичним.

Іноді правильніше взяти медіану (довільного набору), коли ми все одно не маємо на руках всієї статистики. Припустимо, ми тільки що підключили лічильник відвідувань на сайті і хочемо зрозуміти, скільки часу у нас проводить середній відвідувач. Для цього ми можемо взяти статистику хоча б за тиждень відвідувань і всі ці числа прийняти за медіану. Адже, по суті, нам невідомо, що було до цього тижня або стане після, ми спираємося на зріз сьогодення.

Мода числа (або наймодніше число) – це найбільш часто зустрічається в наборі число. Теж можливо як варіант визначення середнього. Якщо числа різні, то моди, звичайно, немає. Але, припустимо, за допомогою моди, ми легко можемо подивитися, які розміри одягу купують у нас в магазині найчастіше, відповідно, замовляти цього товару більше.

ПОДІЛИТИСЯ: