Вариант 4-1
1. Рассчитайте параметры уравнения линейной регрессии
2. Оцените тесноту связи с помощью показателей корреляции и детерминации
3. Определите среднюю ошибку аппроксимации. Сделайте выводы
4. Оцените статистическую надежность регрессионного моделирования с помощью F-критерия Фишера и t-критерия Стьюдента
5. Оцените полученные результаты, оформите выводы
№ набл. |
Район |
Средний размер назначенных ежемесячных пенсий, тыс.руб., y |
Прожиточный минимум в среднем на одного пенсионера в месяц, тыс.руб., x |
1 |
Брянская обл. |
240 |
178 |
2 |
Владимирская обл. |
226 |
202 |
3 |
Ивановская обл. |
221 |
197 |
4 |
Калужская обл. |
226 |
201 |
5 |
Костромская обл. |
220 |
189 |
6 |
г.Моска |
250 |
302 |
7 |
Москавская обл. |
237 |
215 |
8 |
Орловская обл. |
232 |
166 |
9 |
Рязанская обл. |
215 |
199 |
10 |
Смоленская обл. |
220 |
180 |
11 |
Тверская обл. |
222 |
181 |
12 |
Тульская обл. |
231 |
186 |
13 |
Ярославская обл. |
229 |
250 |
Fтабл.=4,84(
|
=9,29 |
=34,75 |
1. Расчет параметров уравнения линейной регрессии по данным таблицы:
Решение:
1. Уравнение линейной регрессии имеет следующий вид:
№ наблюдения
|
х
|
y
|
X2
|
X·Y
|
yx
|
y- yx
|
Ai
|
|
1 |
178 |
240 |
31684 |
42720 |
222,51 |
17,49 |
7,29 |
|
2 |
202 |
226 |
40804 |
45652 |
227,67 |
-1,67 |
0,74 |
|
3 |
197 |
221 |
38809 |
43537 |
226,59 |
-5,59 |
2,53 |
|
4 |
201 |
226 |
40401 |
45426 |
227,45 |
-1,45 |
0,64 |
|
5 |
189 |
220 |
35721 |
41580 |
224,87 |
-4,87 |
2,22 |
|
6 |
302 |
250 |
91204 |
75500 |
t-align:center;">249,17 |
0,83 |
0,33 |
|
7 |
215 |
237 |
46225 |
50955 |
230,46 |
6,54 |
2,76 |
|
8 |
166 |
232 |
27556 |
38512 |
219,93 |
12,07 |
5,20 |
|
9 |
199 |
215 |
39601 |
42785 |
227,02 |
-12,02 |
5,59 |
|
10 |
180 |
220 |
32400 |
39600 |
222,94 |
-2,94 |
1,34 |
|
11 |
181 |
222 |
32761 |
40182 |
223,15 |
-1,15 |
0,52 |
|
12 |
186 |
231 |
34596 |
42966 |
224,23 |
6,77 |
2,93 |
|
13 |
250 |
229 |
62500 |
57250 |
237,99 |
-8,99 |
3,93 |
|
Сумма
|
2646 |
2969 |
554262 |
606665 |
||||
Ср. значение
|
203,54 |
228,38 |
42635,54 |
46666,54 |
2,77 |
Найдем b:
Тогда
Уравнение линейной регрессии имеет вид:
ŷx
=184,239+0,215x
2. а) Рассчитываем коэффициент корреляции:
по формуле:
rxy
= b — = 0,21 =0,78
с помощью статистической функции КОРРЕЛ-r =0,78
Связь между переменными x и y прямая, средняя, близкая к сильной, т.е. величина среднемесячной пенсии в значительной мере зависит от прожиточного минимума в среднем на одного пенсионера в месяц
б) Для определения средней ошибки аппроксимации рассчитываем столбцы
yx
, y- yx
, Ai
:
Ai
= y- yx
* 100, А = 1/n∑n
i
=1
Ai
Получаем значение средней ошибки аппроксимации
А = 2,77%
Величина ошибки аппроксимации говорит о хорошем качестве модели.
в) Величина коэффициента детерминации получена с помощью функции
ЛИНЕЙН R2
= rxy
2
= 0,61,
то есть в 61% случаев изменения среднемесячного прожиточного минимума на одного пенсионера приводят к изменению среднемесячной пенсии. Другими словами – точность подбора регрессии 61 % - средняя.
3. Оценка статистической значимости
а) по критерию Фишера:
1. Выдвигаем нулевую гипотезу о статистической незначимости параметров регрессии и показателя корреляции а = b = rxy
=0;
2. Фактическое значение критерия получено из функции ЛИНЕЙН
∑(ỹx-y)²/m r²xy0,61
Fфакт= = (n-2) = (13-2) = 1,56*11 = 17,2;
∑(y-ỹ)² /(n-m-1) 1-r²xy 1-0,61
3. Fтабл
=4,84
4. Сравниваем фактическое и табличное значения критерия Fфакт> Fтабл
, т.е.нулевую гипотезу отклоняем и делаем вывод о статистической значимости и надежности полученной модели.
б) по критерию Стьюдента:
1. Выдвигаем гипотезу о статистически незначимом отличии показателей от нуля: a = b = r²xy = 0;
2. Табличное значение t – критерия зависит от числа степеней свободы и заданного уровня значимости α. Уровень значимости – это вероятность отвергнуть правильную гипотезу.
rxy √(n-m)
t=
√(1- r2
xy
)
Где n – количество наблюдений; m – количество факторов.
t= 0,78√(13-2)= 2,59=4,18
√(1-0,61)0,62
3. Фактические значения t-критерия рассчитываются отдельно для каждого параметра модели. С этой целью сначала определяются случайные ошибки параметров mа , mb, mrxy
.
mа=Sост √∑х2
= 1,65;
mb= Sост = 0,004
nσх σх√n
mrxy
=
√(1- r2
xy
) = 0,062
n-m-1
где Sост=√(∑ (y- yx
) ) = 5 = 0,5
n-m-110
Рассчитываем фактические значения t – критерия:
tфа =a/ mа =111,66
tфb =b/ mb =53,75
tфrxy
= rxy
/mrxy
= 12,58
tфа>tтабл ; tфb>tтабл ; tфrxy
>tтабл . Нулевую гипотезу отклоняем , параметры a, b, rxy
- не случайно отличаются от нуля и являются статистически значимыми и надежными.