Елементи математичної статистики
Приклад
На 100 навмання вибраних ділянках, однакових за певними характеристиками, зібрано різні урожаї зерна, що характеризуються такою таблицею:
Знайти числові характеристфики цих статистичних даних.
♦ 1) Мінімальні і максимальні спостережені значення:
хmin = 14, xmax = 20.
2) Розмах вибірки: R = 20 – 14 = 6;
3) Мода: М0 = х4 = 17.
4) Медіана: Ме = 17. Оскільки варіаційний ряд містить 100 варіант (100 = 2m – парне число), то
.
5) Статистичне середнє:
.
6) Середнє гармонічне:
.
7) Середнє геометричне:
.
8) Середнє квадратичне:
.
Помічаємо, що . Виявляється, що завжди є правильною рівність .
9) Статистична дисперсія:
.
10) Виправлена статистична дисперсія:
.
11) Середнє квадратичне відхилення:
.
12) Початкові моменти:
13) Центральні моменти: ,
,
.
14) Коефіцієнт асиметрії: .
15) Ексцес: .
Оскільки Е < 0, то цей розподіл плосковершинний.
Враховуючи, що і полігон частот майже симетричний відносно , то можна вважати, що маємо симетричний розподіл відносних частот. А сам полігон частот цього розподілу має вигляд:
Приклад
За даними n = 100 спостережень за середньою урожайністю зерна x (ц/га) дістали таблицю відносних частот того, що
Треба перевірити, чи близька щільність цього розподілу до нормального розподілу зі щільністю . При цьому вважати рівень значущості α = 0,05, а число ступенів свободи r = 7 – 1 = 6.
♦ Користуючись спеціальними таблицями, обчислюємо
.
Дістаємо
Визначаємо величину .
За спеціальною таблицею значень для рівня значущості α = 0,05 та числа ступенів вільності r = 6
знаходимо .
Оскільки , то гіпотеза про близькість функцій узгоджується зі статистичними даними. Отже, даний статистичний розподіл близький до нормального розподілу з параметрами а = 17 і σ = 1,5 за рівнем значущості α = 0,05.♦
Приклад
Внаслідок проведення п’яти незалежних випробувань дістали п’ять пар значень випадкових величин X і Y, заданих у вигляді таблиці:
Обчислити основні числові характеристики випадкових величин та записати рівняння прямих регресій Y на Х і Х на Y.
♦ Очевидно, що в результаті кожного з п’яти випробувань дістаємо єдину пару значень (хі; уі), тому для варіант хі та уі випадкових величин Х та Y частоти ni = nj = 1. Обчислимо статистичне середнє, дисперсію та середнє квадратичне відхилення для випадковвих величин X та Y:
;
;
;
;
;
.
Для вивчення залежності між величинами X i Y обчислимо вибірковий коефіцієнт кореляції, який визначається за формулою .
Оскільки
,
то .
Отже, коефіцієнт кореляції , тому залежність між величинами X і Y можна вважати лінійною, причому кореляція є від’ємною (значення Y спадають при зростанні значень X).
У цьому випадку лінії регресії є прямими. Запишемо рівняння прямих регресії Y на X: та Х на Y: .
Тоді рівняння прямих регресії мають вигляд:
.♦
Приклад
Дана вибірка: 1, 9, 4, 6, 3, 4, 1, 3, 8, 9, 9, 6, 6, 9. Знайти її моду, медіану та середнє значення. Побудувати відповідну гістограму.
♦ Впорядкуємо задану вибірку: 1, 1, 3, 3, 4, 4, 6, 6, 6, 8, 9, 9, 9, 9.
Мода – те число, яке зустрічається найбільшу кількість разів. Це є число 9 (М = 9).
Оскільки, у вибірці парна кількість чисел (14), то медіану будемо шукати як середнє арифметичне двох середніх чисел – . Отже, m = 6.
Середнє значення шукатимемо, як середнє арифметичне усіх чисел вибірки:
. Отже, хс = 5,6.
Побудуємо відповідну гістограму ♦