Вступ
до статистики
Про статистику та її методи
Термін «статистика» походить від латинського слова status– стан, становище.
Статистика – наука, що збирає, обробляє і вивчає різні дані, пов’язані з масовими явищами, процесами і подіями.
Предметом вивчення статистики є, зокрема, кількісний бік масових суспільних явищ і процесів у в’язку з їх якісним боком.
Іноді неточно визначають статистику як «науку збирання даних». Це галузь прикладної математики.
Математична статистика – розділ математики, присвячений математичним методам систематизації, обробки й використання статистичних даних для наукових і практичних висновків.
Статистика виникла з практичних потреб людей, їхньої господарської діяльності, необхідності обліку земельних угідь, майна, кількості населення, вивчення його занять, вікового складу тощо. Цікаво, що в Англії у 17 ст., коли статистичне вивчення поширилося на явища суспільного життя, людей, які займалися цими питаннями, називали «політичними арифметиками». Одним з головних представників «політичних арифметиків» Англії був В. Петті (1625-1687).
Статистику розділяють на описову і пояснювальну.
Описова статистика займається добором кількісної інформації, необхідної (або цікавої) для різних людей. Такою є спортивна інформація, відомості про середній рівень заробітної плати в державі, середньорічну температуру в певному регіоні тощо.
Великі масиви даних, перш ніж вони вивчатимуться людиною, мають узагальнюватися або згортатися. Саме це робить описова статистика, яка описує, узагальнює або зводить до бажаного виду властивості масивів даних.
За допомогою пояснювальної статистики з добутих статичних результатів роблять певні висновки, складають прогнози. Предметом вивчення статистики є такі об’єкти, як кількість і склад населення, трудові ресурси суспільства (їх розподіл і використання), національне багатство, виробництво і розподіл суспільного продукту і національного прибутку, матеріальний достаток населення, освіта, культура, охорона здоров’я, показники статистики органів державного управління і громадських організацій.
У процесі статистичного дослідження застосовують особливі прийоми вивчення, які в сукупності утворюють статистичний метод. Складовими елементами статистичного методу є масове спостереження, статичне зведення, групування, обчислення середніх величин та індексів, побудова графіків.
Статистичне спостереження – перший етап статистичного дослідження.
На схемі систематизовано види статистичних спостережень.
Статистичні спостереження
Вид статичного спостереження |
За часовою ознакою | За способом організації | За ступенем повноти охоплення одиниць |
Поточне | Періодичне | Одиничне |
Суцільне | Несуцільне |
Звітне | Експедиційне | Самообчислення |
Вибіркове | Спостереження основного масиву | Анкетне | Монографічний опис |
Спостереження за часовою ознакою
Поточне спостереження передбачає систематичне вивчення змін, що відбуваються в певній сукупності в міру їх надходження. Наприклад, щоденний облік відвідування в певному класі.
Періодичне спостереження проводиться через строго визначені інтервали часу – місяць, квартал, рік. Наприклад, облік успішності в школі за чверть, навчальний рік. У сільському господарстві – щорічний перепис худоби тощо.
Одиночне спостереження, як правило, проводиться в разі потреби в якийсь певний момент за особливим завданням. Наприклад, перепис житлового фонду в певному районі міста.
Спостереження за способом організації
Звітне спостереження – вивчення певних явищ і процесів на основі статистичних відомостей, які містяться у різноманітній звітності.
Під час експедиційного спостереження спеціальні люди – обліковці – обходять закріплені за ними ділянки території і здійснюють там реєстрацію. Прикладом є перепис населення.
Спостереження само обчисленням полягає в тому, що представники статистичних органів роздають населенню або установам статистичні формуляри, які періодично, через певні інтервали часу, збирають і обробляють для отримання узагальнених даних.
Спостереження за ступенем повноти
охоплення одиниць
Цей вид статистичного спостереження безпосередньо пов'язаний з математикою, а тому після загального огляду методів, якими користується статистика, ми повернемося до нього.
Суцільним є спостереження, в якому реєструється ознака всіх без винятку одиниць, що входять у сукупність, яка вивчається. Суцільне спостереження застосовується, наприклад, під час перепису населення.
Несуцільним називають такий вид спостереження, під час якого реєструють ознаки лише частини одиниць досліджуваної сукупності, і за частиною роблять висновок про всю сукупність.
Видами несуцільного спостереження є: вибіркове спостереження, спостереження основного масиву, анкетне спостереження і монографічний опис.
Найпоширенішим з видів несуцільного спостереження є вибіркове спостереження. Всю сукупність, з якої роблять відбір одиниць спостереження, називають генеральною. Сукупність одиниць, відібраних для вибіркового спостереження, називається вибірковою.
Під час вибіркового спостереження обстеженню підлягає відібрана певним чином частина одиниць усієї її сукупності, а результати обчислення цієї частини сукупності поширюються на всю сукупність у цілому.
Для того щоб за вибіркою можна було досить впевнено судити про властивості генеральної сукупності, вибірка має бути представницькою (репрезентованою).
Репрезентативність вибірки означає, що об’єкти вибірки досить добре представляють генеральну сукупність.
Репрезентативність вибірки забезпечується випадковістю відбору. Останнє означає, що будь-який об’єкт вибірки відібраний випадково, при цьому всі об’єкти мають однакову імовірність потрапити до вибірки. Існує кілька способів відбору, які забезпечують репрезентативність вибірки. Розглянемо основні з них.
Коли об’єкти генеральної сукупності невеликі і знаходяться, наприклад, в ящику, то, перемішавши їх, з ящика беруть по одному з об’єкту доти, доки не утвориться вибірка. Але такий відбір неможливий, коли генеральна сукупність складається з досить великих за розмірами об’єктів, наприклад з потужних електродвигунів, або з таких об’єктів, які під час перемішування псуються, наприклад з електроламп. У такому разі всі об’єкти генеральної сукупності нумерують, кожний номер записують на окрему картку, а картки ретельно перемішують. З отриманої сукупності карток вибирають одну навмання. Об’єкт, номер якого відповідає номеру кратки, вважається таким, що потрапив до вибірки. Таке виймання карток продовжують доти, доки не утворять потрібну вибірку. При цьому можуть бути два варіанти вибірки: випадкова вибірка з поверненням відібраних об’єктів у генеральну сукупність і без такого повернення. Якщо обсяг генеральної сукупності великий, то різниця між вибірками з поверненням і без повернення незначна, якщо обсяг невеликий, то різниця буде істотною.
Для генеральних сукупностей великого обсягу застосування карток для утворення вибірок також ускладнюється через написання великої кількості карток з номерами і труднощі перемішування їх великої кількості. У такому разі використовують таблицю випадкових чисел .
1534 6128 6047 0806 9915 2882 9213 8410 9974 3402 |
7106 8993 8556 5201 8274 7158 1223 9836 2362 8162 |
2836 4102 8644 5705 4525 4341 4388 3899 2103 8226 |
7873 2551 9343 7355 5695 3463 9760 3683 4326 0782 |
5574 0330 9297 1448 5752 1178 6691 1253 3825 3364 |
7545 2358 6751 9562 9630 5786 6861 1683 9079 7871 |
Нехай, наприклад, треба утворити вибірку з генеральної сукупності великого обсягу, якою є виготовлені заводом протягом кварталу електродвигуни. Кожний двигун має чотиризначний номер. Якщо у вибірці має бути 20 двигунів, то з таблиці навмання вибирають 20 чисел (можна й підряд) і двигуни з відповідними номерами відправляють на контроль. Якщо не звертати увагу на те, що деякі номери можуть повторюватися і, отже, деякі двигуни мають обстежувати двічі,то вибірка буде з поверненням. Якщо треба утворити випадкову вибірку без повернення, то при відборі випадкових чисел з таблиці треба пропустити число, яке випало другий раз.
Після того як утворена вибірка,всі її об’єкти обстежуються щодо властивості, яка цікавить, і в результаті дістають дані, що зберігаються.
Звичайно, одержані дані є множиною розташованих як завгодно чисел. У такій множині важко помітити яку-небудь закономірність їх варіювання. Щоб помітити таку закономірність (якщо вона є), дослідні дані піддають обробці. Наприклад, обробка результатів спостережень полягає в тому, що отримані наслідки спостережень розташовують у порядку не спадання. Така обробка називається ранжуванням дослідних даних.
Після ранжування дослідні дані легко об’єднати в групи так, щоб у кожній окремій групі дані були однаковими.
Приклад. На телефонній станції проводилися спостереження над числом Х неправильних з’єднань за хвилину. Спостереження протягом години дали такі результати: 3; 1; 3; 1; 4; 2; 2; 4; 0; 3; 0; 2; 2; 0; 2; 1; 4; 3; 3; 1; 4; 2; 2; 1; 1; 2; 1; 0; 3; 4; 1; 3; 2; 7; 2; 0; 0; 1; 3; 3; 1; 2; 4; 2; 0; 2; 3; 1; 2; 5; 1; 1; 0; 1; 1; 2; 2; 1;1; 5.
Розташуємо ці дані в порядку не спадання і згрупуємо їх. Дістанемо такий ранжируваний ряд даних спостережень:
0; 0; 0; 0; 0; 0; 0; 0; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 5; 5; 7.
Отримали 7 груп різних спостережень. Кожне таке значення, що належить різним групам, називають варіантом, а зміну цього значення – варіюванням.
Чисельність окремої групи згрупованого ряду даних називають частотою, або вагою відповідного варіанта і позначають m, де і – індекс варіанта. Наприклад, для варіант х частота m= 10.
Відношення частоти даного варіанта до загальної суми частот усіх варіантів називається частотою варіанта і позначається Р, де і – індекс варіанта.
Дискретним варіаційним рядом розподілу називається. Ранжирувана сукупність варіантів хз відповідними їх частотами m або частостями Р.
Результатами спостережень для наведеного прикладу (робота телефонної станції) зручно подати у вигляді таблиці
Індекс | і | 1 2 3 4 5 6 7 |
Число неправильних з’єднань за хвилину | х | 0 1 2 3 4 5 7 |
Частота | m | 8 17 16 10 6 2 1 |
Частість | Р |
У практиці статистично розрізняють три способи відбору одиниць сукупності, яка вивчається.
1) Випадковий відбір – усі одиниці сукупності мають однакову можливість потрапити до вибірки. Відбір здійснюється з усієї сукупності жеребкуванням.
2) Механічний відбір – одиниці спостереження відбирають у певному порядку. Наприклад, під час механічного відбору при вивченні якості продукції береться на вибір кожна десята або двадцята деталь.
3) Типовий відбір – усю масу одиниць, що вивчаються, розчленовують на дрібніші однорідні групи і здійснюють наступний відбір одиниць – «представників» кожної групи у випадковому або механічному порядку. Наприклад, під час вивчення бюджету сімей їх попередньо поділяють на групи за соціальним станом і рівнем прибутків.
Поширюючи дані вибіркового спостереження на всю генеральну сукупність, застосовують два способи поширених даних: спосіб прямого перерахунку і спосіб поправочних коефіцієнтів. Перший спосіб полягає в тому, що результати вибіркового спостереження приймають і для генеральної сукупності.
Другий спосіб застосовують під час уточнення результатів суцільного спостереження. Суть його полягає в тому, що дані вибіркового обстеження зіставляють з даними суцільного спостереження і визначають коефіцієнт розходження.
Спостереження основного масиву передбачає облік лише частини сукупності, яка має переважну питому вагу в обсязі досліджуваного об’єкта. Наприклад, вивчення цін на ринках, які мають найбільшу питому вагу в оборотах торгівлі.
Анкетне спостереження не надійне (частина анкет не повертається). Воно використовується переважно транспортними організаціями і органами зв’язку для вивчення ефективності обслуговування населення.
Монографічний опис полягає в тому, що для обстеження береться один об’єкт, який докладно вивчають (здебільше це має місце під час вивчення і поширення передового досвіду).
Важливу частину статистичних методів становлять планування і аналіз експериментів, спрямованих на виявлення і перевірку причинних зв’язків між змінними. Планування експериментів спирається в основному на поєднання теорії ймовірностей з елементарною логікою.
Статистичні дослідження проводяться за таким планом:
1) формулюється завдання дослідження і визначаються обсяг, місце і час потрібної перевірки;
2) здійснюються збирання необхідних даних та їх наочне подання;
3) проводиться обробка зібраного статистичного матеріалу.
На першому етапі важливо чітко визначити мету дослідження,встановити, які об’єми вивчатимуться і в якій кількості (обсяг вибірки). Необхідно встановити, які ознаки при цьому братимуться до уваги, які кількісні та якісні характеристики об’єктів слід оцінити.
На другому етапі використовують різні методи збирання даних: спостереження, порівняння, усне і письмове анкетування, систематизація даних.
На третьому етапі (частково на другому) результати статистичних досліджень піддають обробці і оформляють у вигляді таблиць, діаграм, графіків. За результатами виконаної роботи роблять певні висновки.
Статистичні висновки роблять від окремих властивостей вибірок до часткових властивостей сукупності; опис властивостей як вибірок, так і сукупностей здійснюється за допомогою методів описової статистики.
Описова статистика включає в себе табулювання (складання таблиць), подання і опис сукупності даних. Ці дані можуть бути або кількісними, як наприклад, вимірювання зросту і маси людини, або якісними, наприклад вивчення певних явищ, в яких принципове значення має стать.
Статистичні таблиці
Статистичні таблиці мають підмет і присудок.
Статистичний підмет-це та сукупність, про яку йдеться в таблиці.
Як правило, підмет розміщується у лівій частині таблиці.
Статистичний присудок - це ті ознаки або показники, які характеризують статистичний підмет.
Підмет розміщується в заголовках граф-стовпців.
За структурою підмета статистичні таблиці поділяються на прості, групові і комбінаційні.
Прості - підмет задається переліком окремих об єктів (назви підприємств, міст, країн і т.п.).
Групові - в підметі одиниці сукупності групуються за однією якоюсь ознакою.
Комбінаційні - в підметі одиниці групуються за двома і більше ознаками, пов’язаними між собою.
Наведемо приклади таблиць.
Оптимальна вологість ґрунтів
Грунт | Вологість, % |
Піщаний Супіщаний Пилуватий Суглинковий Важкий суглинковий Глинистий |
8 – 12 9 – 15 16 – 22 12 – 15 16 – 20 19 – 23 |
Зміни в пам’яті, увазі, швидкості реакції за день
Випробування, % вранішні вечірні |
Різниця, % | ||
Пам'ять Обсяг уваги Швидкість реакції Помилки |
100 100 100 100 |
79,3 72,7 83,4 111,1 |
- 20,7 - 27,3 - 16,6 -11,1 |
Співвідношення затрат робочого часу на виконання трудових функцій
Трудові функції робітника |
Питома вага відповідних елементів робочого часу, % |
||
Наладчик | Оператор | Наладчик токарних автоматів | |
Робочий час Активне спостереження і регулювання режиму з пульту управління Машино-ручне управління Суте ручне праця Наладка, підна-ладка, зміна інструменту, контроль продукції |
100 59,7 5,3 18,7 16,3 |
100 33,9 46,0 16,3 3,8 |
100 54,7 2,2 0,5 42,6 |
Якщо групування здійснено за інтервалами зміни ознаки, то таке групування називають інтервальним.
Наприклад, вибіркове вимірювання врожайності жита на площі 1200га дало результати, які ми подаємо за допомогою інтервального групування.
Залежність рівня автоматизації та освітньої структури персоналу,
який обслуговує автоматизоване обладнання, % загальної кількості
Кількість років освіти персоналу | Контроль, здійснюваний персоналом | Напівавто- матичний контроль | Автоматичний контроль зворотного зв’язку |
Логічний контроль за допомогою системи зворотного зв’язку |
Менше за 8 8 – 11 12 Більше за 12 |
10 40 35 15 100 |
16 40 32 12 100 |
5 25 37 33 100 |
1 6 24 69 100 |
Подавши результат групування рядом варіант або інтервалів варіації, розміщених у зростаючій послідовності, і низкою відповідних частот, дістанемо варіаційний ряд (відповідно дискретний або інтервальний).
Частотою значення ознаки або інтервалу називають кількість членів сукупності з деякою варіантною або відповідно кількість членів сукупності, варіанти яких лежать у даному інтервалі.
У випадку визначення врожайності жита частота врожайності 23-25цга становить 150, а 31-33 цга-250.
Врожайність, ц/га |
21-23 | 23-25 | 25-27 | 27-29 | 31-33 | 33-35 | Всього |
Площа, га | 100 | 150 | 250 | 300 | 250 | 150 | 1200 |
У випадку статистичного розподілу абітурієнтів частота результату 10 балів дорівнює 6, а 14 балів-3.
Для наочного зображення статистичного розподілу користуються графічним зображенням варіаційних рядів-діаграмами, графіками, гістограмою, полігоном та ін. Діаграми і графіки вам відомі. Розглянемо інші види графічного зображення.
Гістограма - це послідовність стовпців, кожний з яких спирається на один розрядний інтервал, а висота його відображає кількість випадків або частот у цьому розряді. Прийнято поширювати шкалу на один розрядний інтервал вправо і вліво від розглядуваного діапазону.
Ряди розподілу. Наочне зображення статистичного розподілу
Рядом розподілу називають ряд чисел, які характеризують розподіл одиниць досліджуваної сукупності. Ряд чисел, які характеризують розподіл одиниць досліджуваної сукупності залежно від величини ознаки, називається варіаційним рядом.
Нехай у даній статистичній сукупності вивчається деяка ознака, яка, взагалі кажучи, змінюється з переходом від одного члена статистичної сукупності до іншого. Зміну цієї ознаки називають її варіацією, а значення ознаки у даного члена статистичної сукупності – його варіантною.
Якщо здійснити групування варіант за окремими значеннями ознаки, матимемо дискретне групування (від латинського слова discretus – роздільний, перервний).
Наприклад, можна скласти дискретний варіаційний ряд за кількістю балів, отриманих абітурієнтами на вступних іспитах.
Нехай 35 абітурієнтів дістали на трьох екзаменах таку кількість балів: 10; 10; 11; 9; 15; 12; 9; 12; 13; 9; 8; 11; 14; 13; 12; 9; 10; 14; 10; 7; 8; 7; 9; 11; 15; 12; 7; 7; 8; 13; 13; 14; 10. Побудуємо статистичний розподіл цих даних.
Кількість балів |
7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 |
Кількість абітурієнтів |
5 | 3 | 5 | 6 | 3 | 4 | 4 | 3 | 2 |
Побудову гістограми для графічного зображення інтервального варіаційного ряду здійснюють таким чином. На осі абсцис відкладають інтервали значень ознаки і на кожному з них, як на основі, будують прямокутник з висотою, пропорційною частоті інтервалу.
Розраховано, що кількість інтервалів має бути не меншою від 8 – 10 і не більшою від 20 – 25 при об’ємі статистичної сукупності n ≥ 50. У випадку дискретного розподілу на осі абсцис відкладають окремі значення ознаки.
Зазвичай вибирають шкали так, щоб ширина гістограми становила близько 1 її висоти, тобто щоб відношення висоти до ширини було приблизно 3 : 5. Середина стовпчика суміщається із серединою інтервалу розряду.
На практиці прийнято зображувати гістограму у формі контуру, а не окремими стовпцями.
Побудова полігона розподілу нагадує побудову гістограми. У гістограмі кожний стовпчик закінчується горизонтальною лінією, причому на висоті, що відповідає частоті в цьому розряді. А в полігоні він закінчується точкою над серединою свого розрядного інтервалу на такій самій висоті.
Для побудови полігона варіаційного ряду на осі абсцис прямокутної системи координат відкладають інтервали значень ознаки і в серединах інтервалів ставлять перпендикуляри, довжини яких пропорційні відповідним частотам. Потім кінці сусідніх перпендикулярів з’єднують відрізками прямих, а кінці крайніх перпендикулярів з’єднують із серединами сусідніх інтервалів, частоти яких дорівнюють нулю. У результаті дістають замкнуту фігуру у вигляді многокутника, яку називають полігоном.
Приклад. За даними таблиці «Результати випробувань міцності ниток» побудуйте гістограму і полігон.
Результати випробувань міцності ниток
Міцність нитки,Х |
120 – 140 |
140 – 160 |
160 – 180 |
180 – 200 |
200 – 220 |
220 – 240 |
240 – 260 |
260 – 280 |
Кількість Ниток, m |
1 | 4 | 10 | 14 | 12 | 6 | 2 | 1 |
Відкладаємо значення ознаки на осі абсцис, а частоти – на осі ординат (масштаб на обох осях вибираємо довільно). На відрізках осі абсцис, які відповідають побудованим інтервалам, будуємо прямокутники і дістаємо гістограму.
Щоб побудувати полігон, даний інтервальний ряд перетворимо на дискретний, обчисливши значення ознаки, що припадає на середину.
Міцність нитки, Х |
130 | 150 | 170 | 190 | 210 | 230 | 250 | 270 |
Кількість ниток, m | 1 | 4 | 10 | 14 | 12 | 6 | 2 | 1 |
Будуємо точки, координатами яких є пари чисел з дискретного варіаційного ряду (130; 1) (150; 4) і т. п. З’єднавши утворені точки відрізками прямої, а крайні точки (130; 1) і (270; 1) – із серединами найближчих інтервалів (110; 0) і (290; 0), дістанемо полігон.
Часом замість гістограми чи полігона будують згладжену криву, яку проводять за точками настільки близько, наскільки це можливо.
Гістограма – найлегша для сприймання форма, тому їй надають перевагу, коли зображують не більше від одного розподілу. Але якщо треба порівняти два або більше розподілів, то для цього краще підходять полігони частот, бо їх можна накласти один на одного при меншій кількості перетинів ліній.
Мода і медіана
Ми вже бачили, що властивості сукупності даних можна подати у формі таблиць і графіків. Розглянемо деякі інші способи оцінювання даних за розподілом частот. Їх метою є, як прийнято говорити в статистиці, виявлення міри центральної тенденції (центрального положення).
Найпростіше знайти міру центральної тенденції за допомогою моди (від латинського слова modus – міра, правило).
Мода – це значення ознаки, яке трапляється найчастіше в даному ряді розподілу.
Для дискретних варіаційних рядів мода визначається як значення ознаки з найбільшою частотою. Наприклад, якщо в універмазі протягом дня продано 200 дитячих костюмчиків – 38 штук 22 розміру, 42 штуки 24 розміру, 56 штук 26 розміру, 18 штук 28 розміру, 33 штуки 30 розміру і 13 штук 32 розміру, то модальним номером є 26 – й, бо він має найбільшу чисельність.
Проте не кожна сукупність значень має єдину моду в строгому розумінні цього означення. В сукупності значень (3, 5, 5, 7, 8, 8, 8, 9) модою є число 8, бо воно трапляється частіше за будь-яке інше значення.
У випадку, коли всі значення в групі трапляються однаково часто, вважають, що група оцінок не має моди. Наприклад, у групі (1,2; 1,2; 1,7; 1,7; 4,8; 4,8) мо-ди немає.
Якщо два сусідні значення мають однакову частоту і вона більша від частоти будь-якого іншого значення, мода є середнє цих двох значень. Наприклад, мода групи значень (1, 2, 3, 3, 3, 4, 4, 4, 5) дорівнює 3,5 ((3 + 4) : 2). Якщо два несуміжні значення в групі мають рівні частоти і вони більші від частот будь-якого значення, то існує дві моди. Наприклад, у групі значень (7, 10, 10, 10, 11, 13, 14, 14, 14, 15) модами є 10 і 14.
Мода використовується, зокрема, у практиці торгівельної статистики під час визначення купівельного попиту на товари, рівня цін на ринках тощо.
Приклад. Білила цинкові найчастіше використовують художники в масляному живопису. Тому білу фарбу можна вважати модою сукупності фарб, що трапляються на палітрі. Цей факт враховують виробники фарб: білил цинкових випускають більше, ніж фарб інших кольорів.
Медіана – середня величина змінюваної ознаки, яка міститься всередині ряду, розміщеного в порядку зростання або спадання значень ознаки.
Отже,
Медіана – це значення змінюваної ознаки, яке ділить множину даних навпіл, так що одна половина значень більша від медіани, а друга –менша.
Якщо дані містять непарне число різних значень, наприклад 9, 11, 15, 18, 20, то медіана є середнім значенням для випадку, коли вони впорядковані, тобто медіана дорівнює 15. Якщо дані містять парне число різних випадків, наприклад 7, 11, 13, 15, то медіана дорівнює середньому між двома центральними значеннями, якщо вони впорядковані, тобто (11 + 13) : 2 = 12.
Приклад.
1. Знайти медіану сукупності даних:
а) 12, 2, 9, 11, 15, 24, 10;
б) 18, 43, 24, 17, 21, 26.
Розв’язання. а) Розмістимо дані сукупності в порядку зростання: 2, 9, 10, 11, 12, 15, 24; n= 7 – непарне число. М= 11.
б) Розмістимо дані в порядку зростання:
17, 18, 21, 24, 26, 43;
n = 6 – парне число. М = = = 22,5.
2. Результати контрольної роботи за матеріалом розділу дано в таблиці:
Оцінка, бал | 12 | 9 | 6 | 3 | Всього |
Частота | 11 | 9 | 2 | 20 | 42 |
Як можна оцінити якість знань учнів з цього розділу?
Розв’язання. Медіана ділить усі оцінки навпіл. Двадцять перший член дорівнює 3, двадцять другий член дорівнює 3. Медіана дорівнює = 3. Бачимо, що із 42 оцінок 21 не перевищує 6, отже, половина оцінок складається з 3 і 6, що свідчить про незадовільну якість знань.
Середні значення
Статистика оперує такими середніми значеннями: середне арифметичне, середнє квадратичне, середнє геометричне.
Середнє арифметичне. Нехай ми маємо n об’єктів, у яких виміряна деяка характеристика, що має значення х , х ,…, х.
Середнім значенням (або середнім арифметичним) називається таке число , яке дістають діленням суми всіх даних вибірки х, х, х, …, х на число цих даних n.
= ,
або = (Σ – знак суми – «сигма» велика).
Приклади. 1) Протягом перших п’яти днів березня температура повітря, вимірювана о 8 год. ранку, становила 3, 5, 4, 1, 2. Знайти середню температуру за ці дні.
Маємо: .
2) З двох учнів треба вибрати одного в баскетбольну команду. Відомі кількості їхніх влучень м’яча в корзину на кожні десять кидків під час тренувань.
Номер тренування | 1 | 2 | 3 | 4 | 5 |
Кількість влучень |
Перший учень | ||||
4 | 3 | 5 | 3 | 6 | |
Другий учень | |||||
5 | 4 | 3 | 6 | 5 |
Розв’язання. Знаходимо середню кількість влучень.
Для першого учня:
.
Для другого учня:
.
Отже, в команду слід узяти другого учня.
Розглянемо деякі властивості середнього арифметичного.
1) Знайдемо відхилення l кожного значення х від середнього . Різниця (х - ) може бути від’ємною або додатною.Сума всіх n відхилень дорівнює нулю. Проілюструємо цю властивість на прикладі.
Вихідні дані: (0; 0; 1; 1; 3; 3; 3; 5);n= 8; .
Значення | Середнє арифметичне | Відхилення |
0 0 1 1 3 3 3 5 |
2 2 2 2 2 2 2 2 |
-2 -2 -1 -1 1 1 1 3 - 0 |
2) Якщо до кожного результату спостережень додати деяке число с (константу), то середнє арифметичне перетвориться на (). Візьмемо, наприклад, попередні 8 значень і додамо до кожного з них по 5. Дістанемо числа 5; 5; 6; 6; 8; 8; 8; 10, середнє арифметичне яких (5+5+6+6+8+8+8+10) : 8 = 7. Середнє на 5 одиниць більше.
3) Якщо кожне значення сукупності із середнім помножити на константу с, то середнє арифметичне стане с . Перевірте властивість, використовуючи попередні дані.
Якщо величини деяких даних повторюються, то середнє арифметичне визначається за формулою
,
де f- частота повторення результату х.
Приклади. 1) Протягом двадцяти днів серпня температура повітря вранці була такою: 17є; 18є; 19є; 20є; 18є; 18є; 18є; 19є; 19є; 20є; 20є; 19є; 19є; 19є; 20є; 19є; 18є; 17є; 16є; 19є.
Знайти середню температуру за цими даними.
Тут окремі значення (17є; 18є; 19є; 20є) повторюються. Середня температура дорівнює:
.
Подаємо запис обчислення середнього арифметичного при повторенні деяких даних у вигляді таблиці:
Вихідні дані | х | Частота f | xf | Остаточне обчислення |
2 6 10 2 6 10 3 6 11 4 6 12 4 8 12 4 9 15 5 9 15 5 9 15 |
2 3 4 5 6 8 9 10 11 12 15 |
2 1 3 2 4 1 3 2 1 2 3 |
4 3 12 10 24 8 27 20 11 24 45 |
, де і = 1, 2, 3,…, 11 |
n= |
2) За контрольну роботу учні одержали такі оцінки:
Оцінка, бали | 12 | 9 | 6 | 3 |
Кількість учнів | 6 | 7 | 4 | 17 |
Чи достатньо засвоєний матеріал?
Знайдемо середнє значення оцінок.
.
Ця оцінка є задовільною. Але частота оцінки «2» (мода) дуже висока, вона дорівнює 17. Отже, матеріал засвоєний учнями недостатньо.
Середнє квадратичне відхилення. Ми вже встановили, що сума відхилень даних від середнього значення дорівнює нулю. Тому якби ми вирішили шукати середній показник відхилень, то він також дорівнював би нулю. В статистиці користуються іншим показником – середнім квадратичним відхиленням, який знаходять так: усі відхилення підносять до квадрата; знаходять середнє арифметичне цих квадратів; із знайденого середнього арифметичного добувають квадратний корінь. Середнє квадратичне відхилення позначають грецькою буквою δ («сигма» мала):
Значення х | Середнє арифметичне |
Відхилення () |
Квадрат відхилення ()І |
Квадратичне відхилення δ |
5 8 10 12 17 20 |
-7 -4 -2 0 5 8 |
49 16 4 0 25 64 |
||
|
|
|
|
Δ= == ==≈ ≈ 5,13 |
δ = .
Знаходження середнього квадратичного відхилення подано в таблиці.
У статистиці користуються також величиною δ² (квадрат середнього квадратичного відхилення), яку називають дисперсією.
Середнє геометричне n доданих чисел х, х, х, …, хвизначається виразом m=, тобто середнє геометричне є корінь n-го добутку всіх .
У випадку двох чисел а і b середнє геометричне називають середнім пропорційним цих чисел. З рівності m випливає, що а:m = m:b.
На практиці окремим особам, організаціям, керівникам підприємств доводиться розв’язувати різноманітні задачі, пов’язані з використанням понять моди, медіани, середнього. Наприклад, яких розмірів дитячого взуття треба випускати більше,ніж інших; на якому з міських маршрутів має бути автобусів більше, ніж на решті; якого розміру спортивних костюмів треба виготовити найбільше для учнів 10-11 класів тощо.
Завдання математичної статистики.
Завдання математичної статистики полягає в тому, щоб на основі деяких властивостей сукупності елементів, узятих з генеральної сукупності, зробити певні висновки про властивості всієї генеральної сукупності.
Теорія статистичного виведення – це формалізована система методів роз-в’язування задач, що характеризуються намаганням вивести властивості великого масиву даних обстеженням вибірки. Завдання математичної статистики полягає в тому, щоб передбачити властивості всієї сукупності, знаючи властивості вибірки з цієї сукупності. Ця теорія безпосередньо базується на теорії ймовірностей.
У генеральній сукупності нас здебільшого цікавить деяка ознака, зумовлена випадковістю, яка може мати якісний або кількісний характер.