Федеральное агентство по образованию РФ
Сибирская государственная автомобильно-дорожная академия (СибАДИ)
Кафедра: «Высшая математика»
РАСЧЕТНО-ГРАФИЧЕСКАЯ РАБОТА
Тема: «Проверка гипотезы о законе распределения генеральной совокупности X по критерию Пирсона»
Выполнила: студентка 23ЭУТ
Хасянова А.Ф.
Проверил: Матвеева С.В
Дата_______________
Оценка_____________
Омск-2010
Содержание
1. Введение. Исходные данные
2. Вариационный ряд
3. Интервальный вариационный ряд
4. Построение гистограммы плотности относительных частот. Выдвижение гипотезы о законе распределения генеральной совокупности Х
5. Оценки числовых характеристик и параметров выдвинутого закона
6. Теоретическая функция плотности рассматриваемого закона распределения «Построение ее на гистограмме»
7. Проверка критерия Пирсона
Вывод
1. Исходные данные варианта №20
Дана выборка из генеральной совокупности случайной величины Х. Данные представлены в таблице 1.
Таблица 1
79,02 |
79,70 |
74,68 |
20,47 |
11,70 |
44,64 |
40,75 |
8,59 |
96,42 |
6,17 |
91,75 |
93,29 |
77,57 |
81,25 |
76,59 |
51,84 |
6,17 |
42,79 |
80,87 |
92,81 |
48,04 |
14,70 |
100,64 |
69,83 |
94,56 |
70,42 |
47,93 |
47,48 |
66,79 |
42,12 |
20,27 |
51,36 |
62,51 |
66,86 |
87,99 |
99,29 |
5,96 |
60,38 |
62,53 |
75,50 |
46,55 |
83,53 |
55,65 |
59,26 |
77,05 |
101,10 |
29,93 |
102,21 |
86,11 |
45,92 |
90,93 |
24,30 |
9,76 |
90,25 |
36,72 |
84,96 |
20,50 |
81,99 |
56,29 |
31,75 |
43,61 |
68,70 |
80,47 |
100,66 |
29,98 |
48,88 |
40,37 |
67,46 |
91,46 |
59,11 |
90,75 |
4,64 |
36,53 |
32,39 |
6,99 |
8,41 |
30,85 |
37,30 |
64,44 |
25,60 |
18,00 |
84,27 |
98,88 |
36,39 |
34,64 |
49,49 |
10,53 |
50,97 |
39,40 |
3,59 |
100,39 |
18,57 |
9,27 |
10,89 |
65,91 |
35,62 |
75,45 |
37,86 |
89,74 |
4,57 |
Выборка содержит 100 наблюдаемых значений, поэтому выборка имеет объем n=100.
2. Построение вариационного ряда
Операция расположения значений случайной величины по не убыванию называется ранжированием. Последовательность элементов х(1) ≤ х(2) ≤…≤ х(k) называется вариационным рядом, элементы которого называют вариантами.
Проранжировав статистические данные, получаем вариационный ряд (табл. 2).
Таблица 2
3,59 |
9,76 |
24,30 |
36,53 |
44,64 |
51,84 |
66,68 |
77,05 |
84,96 |
93,29 |
4,57 |
10,53 |
25,60 |
36,72 |
45,92 |
55,65 |
66,79 |
77,75 |
86,11 |
94,56 |
4,64 |
10,89 |
29,93 |
37,30 |
46,55 |
56,29 |
67,46 |
79,02 |
87,99 |
96,42 |
5,96 |
11,70 |
29,98 |
37,86 |
47,48 |
59,11 |
68,78 |
79,70 |
89,74 |
98,88 |
6,17 |
14,70 |
30,85 |
39,40 |
47,93 |
59,26 |
69,83 |
80,47 |
90,25 |
99,29 |
6,17 |
18,00 |
31,75 |
40,37 |
48,04 |
60,38 |
70,42 |
80,87 |
90,75 |
100,39 |
6,99 |
18,57 |
32,39 |
40,75 |
48,88 |
62,51 |
74,68 |
81,25 |
90,93 |
100,46 |
8,41 |
20,27 |
34,64 |
42,12 |
49,49 |
62,53 |
75,45 |
81,99 |
91,46 |
100,66 |
8,59 |
20,47 |
35,62 |
42,79 |
50,97 |
64,44 |
75,50 |
83,53 |
91,75 |
101,10 |
9,27 |
20,50 |
36,39 |
43,61 |
51,36 |
65,71 |
76,59 |
84,27 |
92,81 |
102,21 |
3. Построение интервального вариационного ряда
Опытные данные объединяем в группы так, чтобы в каждой отдельной группе значения вариант будут одинаковы, и тогда можно определить число, показывающее, сколько раз встречается соответствующая варианта в определенной (соответствующей) группе.
Численность отдельной группы сгруппированного ряда опытных данных называется выборочной частотой соответствующей варианты x(i) и обозначается mi; при этом , где n – объем выборки.
Отношение выборочной частоты данной варианты к объему выборки называется относительной выборочной частотой и обозначается Pi*,
т.е. – число (частота) попаданий значений X в i-й разряд, n – объем выборки.
Т.к. согласно теореме Бернулли имеем, что т.е. выборочная относительная частота сходится по вероятности соответствующей вероятности, тогда из условия:
Интервальным вариационным рядом распределения называется упорядоченная совокупность частичных интервалов значений С.В. с соответствующими им частотами или относительными частотами.
Для построения интервального вариационного ряда выполняем следующие действия.
1. Находим размах выборки R = xmax – xmin. Имеем R = 102,21-3,59=98,62 .
2. Определяем длину частичного интервала ∆ – шаг разбиения по формуле Стерджеса: где n – объем выборки, К– число частичных интервалов . ,
3. ∆=10
4. Определяем начало первого частичного интервала
После разбиения на частичные интервалы просматриваем ранжированную выборку и определяем, сколько значений признака попало в каждый частичный интервал, включая в него те значения, которые ≥ нижней границы и меньше верхней границы. Строим интервальный вариационный ряд (табл. 3).
Таблица 3
Разряды |
mi |
|
|
= |
|
1 |
[3.5-13.5) |
14 |
0.14 |
0.014 |
8.5 |
2 |
[13.5-23.5) |
6 |
0.06 |
0.006 |
18.5 |
3 |
[23.5-33.5) |
7 |
0.07 |
0.007 |
28.5 |
4 |
[33.5-43.5) |
12 |
0.12 |
0.012 |
38.5 |
5 |
[43.5-53.5) |
12 |
0.12 |
0.012 |
48.5 |
6 |
[53.5-63.5) |
7 |
0.07 |
0.007 |
58.5 |
7 |
[63.5-73.5) |
8 |
0.08 |
0.008 |
68.5 |
8 |
[73.5-83.5) |
12 |
0.12 |
0.012 |
78.5 |
9 |
[83.5-93.5) |
13 |
0.13 |
0.013 |
88.5 |
10 |
[93.5-103.5) |
9 |
0.09 |
0.009 |
98.5 |
Контроль |
=100 |
=1 |
Где -плотность относительной частоты
-середина частичных интервалов
4. Построение гистограммы
Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длины , а высоты равны отношению – плотность частоты (или – плотность частности).
По данным таблицы 4 строим гистограмму (рис. 1).
Гистограмма частот является статистическим аналогом дифференциальной функции распределения (плотности) случайной величины Х. Площадь гистограммы равна единице.
Выдвижение гипотезы о законе распределения генеральной совокупности
По данным наблюдений статистическое среднее и выборочное среднее квадратическое отклонение у* по значению почти совпадают. Учитывая данный факт, а также вид гистограммы можно предположить, что случайная величина имеет равномерное распределение.
По виду гистограммы выдвигаем гипотезу о равномерном законе распределения генеральной совокупности Х.
5. Оценка числовых характеристик и параметров закона распределения
Оценками математической статистики называют приближенные значения числовых характеристик или параметров законов распределения генеральной совокупности Х вычисленные на основе выборки.
Оценка называется точечной, если она определяется числом или точкой на числовой оси.
Оценка (как точечная, так и интервальная) является случайной величиной, так как она вычисляется на основе экспериментальных данных и является функцией выборки.
При вычислении точечных оценок для удобства берут не сами элементы выборки, а середины частичных интервалов из интервального вариационного ряда (табл. 1) и применяют формулы:
где n - объем выборки, – i-й элемент выборки
Составим таблицу для нахождения и
Таблица 4
i |
|
|
1 |
|
8.5*14=119 |
2 |
|
18.5*6=111 |
3 |
|
28.5*7=199.5 |
4 |
|
38.5*12=462 |
5 |
|
48.5*12=582 |
6 |
|
58.5*7=409.5 |
7 |
|
68.5*8=548 |
8 |
|
78.5*12=942 |
9 |
|
88.5*13=1150.5 |
10 |
|
98.5*9=886.5 |
|
|
6. Равномерный закон
интервальный вариационный генеральный совокупность
Выдвинута гипотеза о распределении генеральной совокупности Х по равномерному закону
найдем функцию плотности равномерного закона вычислив оценки параметров и
,
Т.к М(x)= , , D(x)=
Таблица 5
i |
|
1 |
|
2 |
|
3 |
|
4 |
|
5 |
|
6 |
|
7 |
|
8 |
|
9 |
|
10 |
|
186 |
После того, как найдены значения функции плотности для каждого разряда, нанесем их прямо на гистограмму, получая тем самым кривую функции плотности
7 Проверка гипотезы о законе распределения генеральной совокупности по критерию Пирсона
В качестве меры расхождения между статистическим и гипотетическим (теоретическим) распределениями возьмем критерий Пирсона К = ч2.
Пирсон доказал, что значение статистического критерия не зависит от функции и от числа опытов n, а зависит от числа частичных интервалов интервального вариационного ряда. При увеличении ч2, и находится по формуле:
К = или К =
Дальнейшие вычисления, необходимые для определения расчетного значения выборочной статистики , проведем в таблице 5.
Таблица 6
i |
|
|
|
|
|
/ |
1 |
0.14 |
14 |
0.1029 |
10.29 |
|
13.76/10.37=1.33 |
2 |
0.06 |
6 |
0.1 |
10 |
|
16/10=1.6 |
3 |
0.07 |
7 |
0.1 |
10 |
|
16/10=1.6 |
4 |
0.12 |
12 |
0.1 |
10 |
|
16/10=1.6 |
5 |
0.12 |
12 |
0.1 |
10 |
|
16/10=1.6 |
6 |
0.07 |
7 |
0.1 |
10 |
|
16/10=1.6 |
7 |
0.08 |
8 |
0.1 |
10 |
|
16/10=1.6 |
8 |
0.12 |
12 |
0.1 |
10 |
|
16/10=1.6 |
9 |
0.13 |
13 |
0.1 |
10 |
|
16/10=1.6 |
10 |
0.09 |
9 |
0.1149 |
11.49 |
|
6.3/11.49=0.548 |
|
|
01.86 |
|
Чтобы найти значение надо воспользоваться табличными распределениями в которых значение сл. величины находят по заданному уровню значимости и вычисленному числу степеней свободы
R- число частичных интервалов в таблице 1 но если в некоторых из интервалов значения то надо объединить расположенные рядом интервалы так, чтобы тогда число
R-это число из необъединенных интервалов
i- число неизвестных параметров
В рассматриваемом эмпирическом распределении не имеются частоты, меньшие 5. Случайная величина ч2 (мера расхождения) независимо от вида закона распределения генеральной совокупности при (n ≥ 50) имеет распределение ч2 с числом степеней свободы
1) К =
уровень значимости б =1–=0,05
,
найдем по таблице значений критическое значение для б = 0,05 и =9
Имеем =16.9. Так как то предполагаемая гипотеза о показательном законе распределения генеральной совокупности не противоречит опытным данным и принимается на уровне значимости б.
2)=,
=
3) M(x)= ,
M(x)=
4) D(x)=
D(x.1)=
5) Таким образом, критическая область для гипотезы задается неравенством ; P()= Это означает, что нулевую гипотезу можно считать правдоподобной и гипотеза Но принимается
Вывод: В ходе расчетно-графической работы мы установили, что генеральная совокупность X распределена по равномерному закону, проверив это по критерию Пирсона. Определили параметры и числовые характеристики закона и построили для них доверительные интервалы.