БАЛТИЙСКИЙ ВОЕННО-МОРСКОЙ ИНСТИТУТ
КАФЕДРА МАТЕМАТИКИ
КУРСОВАЯ РАБОТА
Тема: «Элементы математической статистики
и корреляционного анализа»
Руководитель:
кандидат физико-математических наук
доцент Спектор В. Е.
Выполнил:
ст 2 ст Смоколов Т. В.
422я учебная группа
Вариант 18
Содержание
Введение ………………………………………………………………………. |
Стр.3 |
Глава I «Обработка данных наблюдений и проверка гипотез» ……………. |
Стр.4 |
§1. Статистическое распределение выборки ……………………………… |
Стр.5 |
§2. Расчет сводных характеристик выборки………………………………. |
Стр.6 |
§3. Расчет интервальных оценок генеральных параметров ……………… |
Стр.7 |
§4. Проверка гипотезы о нормальном распределении |
|
генеральной совокупности по критерию Пирсона …………………………. |
Стр.8 |
§5. Построение гистограммы выборки и теоретической |
|
нормальной кривой …………………………………………………………… |
Стр.9 |
Глава II «Элементы корреляционного анализа» ……………………………. |
Стр. 11 |
§1. Корреляционная таблица и корреляционное поле ……………………… |
Стр. 12 |
§2. Нахождение выборочного коэффициента корреляции ………………… |
Стр. 12 |
§3. Нахождение доверительного интервала для |
|
генерального коэффициента корреляции……………………………………. |
Стр. 16 |
§4. Нахождение выборочного уравнения прямой |
|
регрессии Y на X и построение ее графика …………………………………. |
Стр. 16 |
Заключение ……………………………………………………………………. |
Стр. 18 |
Список использованной литературы ………………………………………... |
Стр. 19 |
ВВЕДЕНИЕ
Наблюдаемые нами события (явления) можно подразделить на следующие три вида: достоверные, невозможные и случайные. Невозможно учесть влияние на результат всех причин, поскольку число их очень велико и законы их действий неизвестны. Поэтому Т.В. не ставит перед собой задачу предсказать, произойдет единичное событие или нет, -она просто не в силах это сделать.
По –иному обстоит дело, если рассматриваются случайные события, которые могут многократно наблюдаться при осуществлении одних и тех же условий S, т.е. если речь идет о массовых однородных случайных событий. Оказывается, что достаточно большое число однородных случайных событий независимо от их конкретной природы подчиняется определенным закономерностям, а именно вероятностным закономерностям. Установлением этих закономерностей и занимается Т.В. Итак, предметом Т.В. является изучение вероятностных закономерностей однородных массовых случайных событий. Знание закономерностей которым подчиняются массовые случайные события, позволяет предвидеть, как эти события будут протекать.
Методы Т.В. широко применяются в различных отраслях естествознания и техники. В последние годы методы Т.В. все шире и шире проникают в различные области науки и техники, способствуя их прогрессу.
Краткая историческая справка. Первые работы, в которых зарождались основные понятия теории вероятностей, представляли собой попытки создания теории азартных игр (Кардано, Гюйгенс, Паскаль, Ферма и другие в XVI–XVII вв.).
Следующий этап развития теории вероятностей связан с именем Якоба Бернулли (1654–1705). Доказанная им теорема, получившая впоследствии название «Закона больших чисел», была первым теоретическим обоснованием накопленных ранее фактов.
Дальнейшими успехами теория вероятностей обязана Муавру, Лапласу, Гауссу, Пуассону и др.
Новый, наиболее плодотворный период связан с именами П. Л. Чебышева (1821–1894) и его учеников А.А.Маркова (1856–1922) и А.М.Ляпунова (1857–1918). В этот период теория вероятностей становится стройной математической наукой. Ее последующее развитие обязано в первую очередь русским и советским математикам (С. Н. Бернштейн, В. И. Романовский, А. Н. Колмогоров, А. Я. Хинчин, Б. В. Гнеденко, Н. В. Смирнов и др.) В настоящее время ведущая роль в создании новых ветвей теории вероятностей также принадлежит советским математикам.
ГЛАВА I
Обработка данных наблюдений и проверка гипотез
Задание:
В результате независимых измерений получены n
значений ошибки точности настройки РПУ на заданную частоту: х1
, х2
,…хn
. Произвести полный статистический анализ данных выборки и сделать соответствующие выводы.
Значения выборки
-0,787 |
1,473 |
0,159 |
0,940 |
-0,842 |
0,308 |
-1,266 |
0,889 |
-1,100 |
2,199 |
1,159 |
0,702 |
0,533 |
-0,536 |
0,926 |
-0,660 |
1,071 |
1,306 |
1,121 |
0,571 |
0,989 |
-0,383 |
-0,256 |
-0,126 |
2,945 |
-1,019 |
0,167 |
1,183 |
1,506 |
0,881 |
0,090 |
-0,348 |
-0,292 |
0,054 |
0,971 |
-0,709 |
0,192 |
-0,122 |
-1,671 |
1,033 |
0,122 |
-1,447 |
0,525 |
0,349 |
-0,511 |
0,476 |
0,495 |
-0,326 |
-0,883 |
0,181 |
-1,487 |
-1,060 |
0,891 |
-0,056 |
-0,486 |
0,062 |
-1,441 |
-1614 |
0,759 |
-0,256 |
0,251 |
0,495 |
1,654 |
1,443 |
0,065 |
-0,381 |
-1,060 |
-0,170 |
0,889 |
1,147 |
1,531 |
-1,441 |
0,873 |
0,627 |
-0,199 |
-0,443 |
-0,598 |
0,845 |
-0,435 |
-0,508 |
1,409 |
-0,361 |
0,874 |
-1,220 |
-0,124 |
1,730 |
-0,079 |
1,485 |
-1,007 |
-0,992 |
-0,266 |
0,503 |
0,934 |
0,883 |
0,969 |
-0,592 |
-1,080 |
0,084 |
1,018 |
0,983 |
§1. Статистическое распределение выборки
1. По данным выборки найдем:
а) Размах варьирования: R = xmax
– xmin
,
б) Количество интервалов (разрядов):
k = 5lg n |
Или |
k = log2
|
k = 5lg 100 = 10 |
k = log2
|
k
»
10
.
в) Длину разряда:
Интервал (-1,671 ; 2,945) расширим до интервала (-1,9 ; 3,1). Сдвиг в каждую стороны при этом не превысит: .
Для нового интервала изменения признака (-1,9;3,1) при k
»
10
длина разряда получается равной
2. Произведем группировку опытных данных и построим интервальный вариационный ряд. Расчет оформим в виде таблицы 1.
Таблица № 1
Границы интервалов |
(-1,9;-1.4] |
(-1.4;-0.9] |
(-0.9;-0.4] |
(-0.4;0.1] |
(0.1;0.6] |
(0.6;1.1] |
(1.1;1.6] |
(1.6;2.1] |
(2.1;2.6] |
(2.6;3.1] |
Подсчет частот |
||||||||||
Частоты ni
|
6 |
9 |
13 |
19 |
16 |
20 |
13 |
2 |
1 |
1 |
Относительные частоты ni
|
6/100 |
9/100 |
13/100 |
19/100 |
16/100 |
20/100 |
13/100 |
2/100 |
1/100 |
1/100 |
Накопленные частоты Σni
|
6 |
15 |
28 |
47 |
63 |
83 |
96 |
98 |
99 |
100 |
§2. Расчет сводных характеристик выборки
1. Вычислим моду и медиану выборочного распределения.
2. По интервальному вариационному ряду, полученному в §1 составить дискретный вариационный ряд в виде таблицы 2, в котором в качестве вариант берём середины разрядов
Таблица № 2
xi
|
-1.6 |
-1.1 |
-0.6 |
-0.1 |
0.4 |
0.9 |
1.4 |
1.9 |
2.4 |
2.9 |
n
|
6 |
9 |
13 |
19 |
16 |
20 |
13 |
2 |
1 |
1 |
Вычислим выборочную среднюю (математическое ожидание) и выборочную дисперсию :
|
|
|
|
3. Для расчета сводных характеристик выборки по методу произведений составим таблицу 3.
Таблица № 3
Разряды |
n
|
u
|
n
|
n
|
n
|
n
|
(u
|
(u
|
ni
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
-1.6 |
6 |
-5 |
-30 |
150 |
-750 |
3750 |
-4 |
256 |
1536 |
-1.1 |
9 |
-4 |
-36 |
144 |
-576 |
2304 |
-3 |
81 |
729 |
-0.6 |
13 |
-3 |
-39 |
117 |
-351 |
1053 |
-2 |
16 |
208 |
-0.1 |
19 |
-2 |
-38 |
76 |
-152 |
304 |
-1 |
1 |
19 |
0.4 |
16 |
-1 |
-16 |
16 |
-16 |
16 |
0 |
2 |
0 |
0.9 |
20 |
0 |
0 |
0 |
0 |
0 |
1 |
1 |
20 |
1.4 |
13 |
1 |
13 |
13 |
13 |
13 |
2 |
16 |
208 |
1.9 |
2 |
2 |
4 |
8 |
16 |
32 |
3 |
81 |
162 |
2.4 |
1 |
3 |
3 |
9 |
27 |
81 |
4 |
256 |
256 |
2.9 |
1 |
4 |
4 |
16 |
64 |
256 |
5 |
625 |
625 |
100 |
-135 |
549 |
-1725 |
7809 |
3763 |
Контроль расчетов производим по формуле:
4. Вычислим начальные условные эмпирические моменты:
5. Используя начальные моменты , вычислим центральные моменты:
6. Найдем выборочную среднюю (выборочное математическое ожидание):
,
где С = 0,09
7. Вычислим выборочную дисперсию и исправленную выборочную дисперсию:
,
8. Найдем выборочное среднее квадратическое отклонение (с.к.о.) и исправленное выборочное с.к.о.:
,
9. Определим, чему равны выборочная асимметрия и выборочный эксцесс:
§3. Расчет интервальных оценок генеральных параметров
Построим доверительные интервалы для оценки генерального математического ожидания mx
и генерального с.к.о. σх
. Для этого по заданной доверительной вероятности (надежности) γ из таблицы функции Лапласа найдем значение аргумента tγ
этой функции, для которого Ф(tγ
) = γ.
|
|
|
Используя найденное tγ
, рассчитаем границы доверительного интервала для
Интервальную оценку генерального с. к. о. определим по одной из формул :
|
|
В данном варианте q<1 то 0,77181272<σx
|
§4. Проверка гипотезы о нормальном распределении
генеральной совокупности по критерию Пирсона
Для того, чтобы при заданном уровне значимости α = 1 – γ проверить гипотезу о нормальном распределении обследуемого признака X генеральной совокупности, заполним таблицу 5.
Таблица №5
xi
|
ni
|
|
|
|
|
|
|
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
-1,6 |
6 |
-1,91 |
0,111 |
5,7961 |
0,20387267 |
0,041564066 |
0,007171 |
6,211043676 |
-1,1 |
9 |
-1,38 |
0,217 |
11,3312 |
-2,33116784 |
5,434343513 |
0,479593 |
7,148424692 |
-0,6 |
13 |
-0,86 |
0,332 |
17,3362 |
-4,33616463 |
18,80232367 |
1,084572 |
9,748407658 |
-0,1 |
19 |
-0,34 |
0,391 |
20,4170 |
-1,41698906 |
2,007858005 |
0,098343 |
17,68135345 |
0,4 |
16 |
0,18 |
0,364 |
19,0071 |
-3,00712025 |
9,042772216 |
0,475757 |
13,46863684 |
ter;">0,9 |
20 |
0,70 |
0,263 |
13,7332 |
6,266833444 |
39,27320141 |
2,859734 |
29,1265673 |
1,4 |
73 |
1,23 |
0,144 |
7,5193 |
5,48069968 |
30,03806898 |
3,994796 |
22,47549543 |
1,9 |
2 |
1,75 |
0,065 |
3,3941 |
-1,39412862 |
1,9435946 |
0,572634 |
1,178505723 |
2,4 |
1 |
2,27 |
0,023 |
1,2010 |
-0,20099936 |
0,040400741 |
0,033639 |
0,832639913 |
2,9 |
1 |
2,79 |
0,006 |
0,3133 |
0,68669582 |
0,471551149 |
1,505091 |
3,191786334 |
11,111329 |
111,06286 |
Контроль вычислений производим по формуле:
Обозначим сумму элементов восьмого столбца , и для заданного уровня значимости α числа свободы р = k – 3 находим критическую точку (α; р)
ВЫВОД: так как, то нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности. Другими словами, эмпирические и теоретические частоты различаются незначимо (случайно).
§5. Построение гистограммы выборки и теоретической
нормальной кривой
1. Для построения гистограммы в выбранной системе координат на оси абсцисс откладываем разряды, а на каждом из разрядов как на основании строим прямоугольник с высотой , составляя таблицу 6.
Таблица №6
Разряды |
-1.6 |
-1.1 |
-0.6 |
-0.1 |
0.4 |
0.9 |
1.4 |
1.9 |
2.4 |
2.9 |
|
0,12 |
0,18 |
0,26 |
0,38 |
0,32 |
0,40 |
0,26 |
0,04 |
0,02 |
0,06 |
В последней строке результаты вычислений округлим до 0,01.
На этом же графике строим гипотетическую (предположительную) теоретическую нормальную кривую. Для этого берем середины разрядов хi
и выравнивающие частоты ni
из таблицы 5. Эти данные заносим в таблицу 7.
3.Таблица №7
xi
|
-1.6 |
-1.1 |
-0.6 |
-0.1 |
0.4 |
0.9 |
1.4 |
1.9 |
2.4 |
2.9 |
|
0,12 |
0,23 |
0,35 |
0,41 |
0,38 |
0,27 |
0,15 |
0,07 |
0,024 |
0,006 |
наносим точки с координатами и соединяем их плавной линией, получая искомую кривую.
ВЫВОД: В данной части курсовой работы проверена гипотеза Пирсона, ее нет оснований отвергнуть, другими словами, эмпирические и теоретические частоты различаются незначимо (случайно).
ГЛАВА
I
I
Элементы корреляционного анализа
ВАРИАНТ №
18
Дано
: Результаты исследований зависимости между случайными величинами X и Y
представлены в виде таблицы 8:
Таблица №8
Y |
X |
||||||
30 |
35 |
40 |
45 |
50 |
55 |
ny
|
|
45 |
4 |
2 |
6 |
||||
55 |
5 |
3 |
8 |
||||
65 |
5 |
45 |
5 |
55 |
|||
75 |
7 |
8 |
2 |
17 |
|||
85 |
4 |
3 |
7 |
14 |
|||
nx
|
4 |
7 |
15 |
57 |
10 |
7 |
Произвести корреляционный анализ зависимости Y от X, для чего:
1) построить корреляционное поле;
2) найти выборочный коэффициент корреляции ;
3) получить доверительный интервал rxy
для с надежностью γ;
4) найти выборочное уравнение прямой регрессии Y на X;
5) в выбранной системе координат построить точки (xi
,
yi
) и выборочное уравнение регрессии Y на X.
§1. Корреляционная таблица и корреляционное поле
Представим данные корреляционной таблицы в виде корреляционного поля. Для этого в выбранной системе координат изобразим точки (xi
,
yj
) и рядом с каждой точкой укажем, если это позволит масштаб, соответствующую частоту nxy
. По расположению точек можно сделать предположение о наличии (или отсутствии) линейной корреляционной зависимости между обследуемыми признаками X и Y.
Для данных таблицы 8 корреляционное поле имеет вид:
Расположение точек говорит о наличии положительной корреляции между признаками X и Y.
§2. Нахождение выборочного коэффициента корреляции
Вычисления можно значительно упростить, если перейти от истинных вариант xi
, yj
к условным ui
, vj
соответственно, а именно:
|
|
C1
h1
u
u
u
u
u
u
|
C2
h2
v1
v2
v3
v4
|
Формула для вычисления эмпирического коэффициента корреляции в условных вариантах имеет вид:
Для нахождения составим расчетную таблицу 9.
Таблица №9
xi
|
ui
|
ni
|
ni
|
ni
|
(ui
|
(ui
|
ni
|
30 |
-3 |
4 |
-12 |
36 |
-2 |
4 |
16 |
35 |
-2 |
7 |
-14 |
28 |
-1 |
1 |
7 |
40 |
-1 |
15 |
-15 |
15 |
0 |
0 |
0 |
45 |
0 |
57 |
0 |
0 |
1 |
1 |
57 |
50 |
1 |
10 |
10 |
10 |
2 |
4 |
40 |
55 |
2 |
7 |
14 |
28 |
3 |
9 |
63 |
100 |
-17 |
117 |
183 |
Контроль
,
то есть вычисления верны
Так как , то
Аналогичные вычисления проводим для v
в таблице 10.
Таблица №10
yj
|
vj
|
nj
|
nj
|
nj
|
(vj
|
(vj
|
nj
|
45 |
-2 |
6 |
-12 |
24 |
-1 |
1 |
6 |
55 |
-1 |
8 |
-8 |
8 |
0 |
0 |
0 |
65 |
0 |
55 |
0 |
0 |
1 |
1 |
55 |
75 |
1 |
17 |
17 |
17 |
2 |
4 |
68 |
85 |
2 |
4 |
28 |
56 |
3 |
9 |
126 |
100 |
25 |
105 |
255 |
Контроль вычислений производим по формуле:
вычисления верны.
Для вычисления требуется еще найти. Для ее нахождения составим корреляционную таблицу 11 в условных вариантах.
Подставив найденные значения в формулу (*), получим
Таблица №11
ui
vj
|
-3 |
-2 |
-1 |
0 |
1 |
2 |
|
|
|||||||||||||
-3 |
-12 |
-4 |
-16 |
48 |
|||||||||||||||||
4
|
2
|
|
|
|
|
||||||||||||||||
-12 |
-6 |
||||||||||||||||||||
-2 |
-10 |
-3 |
-13 |
26 |
|||||||||||||||||
|
5
|
3
|
|
|
|
||||||||||||||||
-10 |
-6 |
||||||||||||||||||||
-1 |
- |
-5 |
0 |
5 |
0 |
0 |
|||||||||||||||
|
|
5
|
45
|
5
|
|
||||||||||||||||
-5 |
-45 |
-5 |
|||||||||||||||||||
0 |
-7 |
0 |
2 |
0 |
-5 |
0 |
|||||||||||||||
|
|
7
|
8
|
2
|
|
||||||||||||||||
0 |
0 |
0 |
|||||||||||||||||||
1 |
0 |
3 |
17 |
17 |
|||||||||||||||||
|
|
|
4
|
3
|
|
||||||||||||||||
4 |
3 |
||||||||||||||||||||
|
-12 |
-16 |
-11 |
-41 |
-2 |
7 |
|
||||||||||||||
|
36 |
32 |
11 |
0 |
-2 |
14 |
|
контроль |
§3. Нахождение доверительного интервала
для генерального коэффициента корреляции
Задана надежность γ = 0,99. Доверительный интервал для генерального коэффициента корреляции rxy
имеет вид:
Следовательно с вероятностью 0,99 доверительный интервал имеет вид:
§4. Нахождение выборочного уравнения прямой
регрессии Y на X и построение ее графика
Общий вид уравнения прямой линии регрессии Y на X имеет вид:
Полученное уравнение регрессии показывает, как в среднем изменяется значение признака Y в зависимости от изменения признака Х.
В выбранной системе координат строим прямую и точки (xi
, yi
) корреляционного поля.
Таблица для построения графика
30 |
35 |
40 |
45 |
50 |
55 |
43,877 |
52,225 |
60,572 |
68,919 |
77,266 |
85,613 |
ВЫВОД:. Построив корреляционное поле мы убеждаемся, что расположение точек говорит о наличии положительной корреляции между Х и Y. По расположению точек можно судить о линейной зависимости между Х и Y.
Заключение
В проделанной курсовой работе была предоставлена возможность проверить гипотезу Пирсона, опираясь на полученные результаты я могу утверждать, что эмпирические и теоретические частоты различаются незначительно. Так же был проведен корреляционный анализ, была выявлена сильная линейная зависимость между величинами X и Y
Список использованной литературы
1. Гмурман В.Е. «Теория вероятностей математической статистики» – М.: Высшая школа, 1999 г.
2. «Пособие и методические указания к выполнению курсовой работы» – Калининград: 1998 г.