Задание 1.
 
По 15 предприятиям, выпускающим один и тот же вид продукции известны значения двух признаков:
х
- 
выпуск продукции, тыс. ед.;
у - 
затраты на производство, млн. руб.
|   x
  | 
  y
  | 
|   5,3  | 
  18,4  | 
|   15,1  | 
  22,0  | 
|   24,2  | 
  32,3  | 
|   7,1  | 
  16,4  | 
|   11,0  | 
  22,2  | 
|   8,5  | 
  21,7  | 
|   14,5  | 
  23,6  | 
|   10,2  | 
  18,5  | 
|   18,6  | 
  26,1  | 
|   19,7  | 
  30,2  | 
|   21,3  | 
  28,6  | 
|   22,1  | 
  34,0  | 
|   4,1  | 
  14,2  | 
|   12,0  | 
  22,1  | 
|   18,3  | 
  28,2  | 
Требуется:
4. Построить поле корреляции и сформулировать гипотезу о форме связи;
5. Построить модели:
2.1 Линейной парной регрессии;
2.2 Полулогарифмической парной регрессии;
2.3 Степенной парной регрессии; Для этого:
1. Рассчитать параметры уравнений;
2. Оценить тесноту связи с помощью коэффициента (индекса) корреляции;
3. Оценить качество модели с помощью коэффициента (индекса) детерминации и средней ошибки аппроксимации;
4. Дать с помощью среднего коэффициента эластичности сравнительную оценку силы связи фактора с результатом;
5. С помощью F
-критерия Фишера оценить статистическую надежность результатов регрессионного моделирования;
3. По значениям характеристик, рассчитанных в пунктах 2-5 выбрать лучшее уравнение регрессии;
4. Используя метод Гольфрельда-Квандта проверить остатки на гетероскедастичность;
5. Рассчитать прогнозное значение результата, если прогнозное значение фактора увеличится на 5% от его среднего уровня. Для уровня значимости =0,05 определить доверительный интервал прогноза.
Решение.
1. Строим поле корреляции.
Анализируя расположение точек поля корреляции, предполагаем, что связь между признаками х
и у
может быть линейной, т.е. у=а+
b
х
, или нелинейной вида: у=а+
bln
х, у = ах
b
. 
Основываясь на теории изучаемой взаимосвязи, предполагаем получить зависимость у
от х
вида у=а+
b
х,
т. к. затраты на производство y
можно условно разделить на два вида: постоянные, не зависящие от объема производства - a
, такие как арендная плата, содержание администрации и т.д.; и переменные, изменяющиеся пропорционально выпуску продукции b
х,
такие как расход материала, электроэнергии и т.д.
2.1 Модель линейной парной регрессии
2.1.1 Рассчитаем параметры a
и b
линейной регрессии у=а+
b
х
. 
Строим расчетную таблицу 1.
Таблица 1
|   №
  | 
  x
  | 
  y
  | 
  yx
  | 
  x2
  | 
  y2
  | 
  
  | 
  
  | 
  Аi
  | 
|   1  | 
  5,3  | 
  18,4  | 
  97,52  | 
  28,09  | 
  338,56  | 
  16,21  | 
  2,19  | 
  11,92  | 
|   2  | 
  15,1  | 
  22,0  | 
  332,20  | 
  228,01  | 
  484,00  | 
  24,74  | 
  -2,74  | 
  12,46  | 
|   3  | 
  24,2  | 
  32,3  | 
  781,66  | 
  585,64  | 
  1043,29  | 
  32,67  | 
  -0,37  | 
  1,14  | 
|   4  | 
  7,1  | 
  16,4  | 
  116,44  | 
  50,41  | 
  268,96  | 
  17,77  | 
  -1,37  | 
  8,38  | 
|   5  | 
  11,0  | 
  22,2  | 
  244,20  | 
  121,00  | 
  492,84  | 
  21,17  | 
  1,03  | 
  4,63  | 
|   6  | 
  8,5  | 
  21,7  | 
  184,45  | 
  72,25  | 
  470,89  | 
  18,99  | 
  2,71  | 
  12,47  | 
|   7  | 
  14,5  | 
  23,6  | 
  342,20  | 
  210,25  | 
  556,96  | 
  24,22  | 
  -0,62  | 
  2,62  | 
|   8  | 
  10,2  | 
  18,5  | 
  188,70  | 
  104,04  | 
  342,25  | 
  20,47  | 
  -1,97  | 
  10,67  | 
|   9  | 
  18,6  | 
  26,1  | 
  485,46  | 
  345,96  | 
  681,21  | 
  27,79  | 
  -1,69  | 
  6,48  | 
|   10  | 
  19,7  | 
  30,2  | 
  594,94  | 
  388,09  | 
  912,04  | 
  28,75  | 
  1,45  | 
  4,81  | 
|   11  | 
  21,3  | 
  28,6  | 
  609,18  | 
  453,69  | 
  817,96  | 
  30,14  | 
  -1,54  | 
  5,39  | 
|   12  | 
  22,1  | 
  34,0  | 
  751,40  | 
  488,41  | 
  1156,00  | 
  30,84  | 
  3,16  | 
  9,30  | 
|   13  | 
  4,1  | 
  14,2  | 
  58,22  | 
  16,81  | 
  201,64  | 
  15,16  | 
  -0,96  | 
  6,77  | 
|   14  | 
  12,0  | 
  22,1  | 
  265,20  | 
  144,00  | 
  488,41  | 
  22,04  | 
  0,06  | 
  0,26  | 
|   15  | 
  18,3  | 
  28,2  | 
  516,06  | 
  334,89  | 
  795,24  | 
  27,53  | 
  0,67  | 
  2,38  | 
|   Σ  | 
  212,0  | 
  358,5  | 
  5567,83  | 
  3571,54  | 
  9050,25  | 
  358,50  | 
  0,00  | 
  99,69  | 
|   среднее  | 
  14,133  | 
  23,900  | 
  371,189  | 
  238,103  | 
  603,350  | 
  23,90  | 
  0,00  | 
  6,65  | 
Параметры a
и b
уравнения
Yx
= 
a
+ 
bx
определяются методом наименьших квадратов:
Разделив на n
и решая методом Крамера, получаем формулу для определения b
:
Уравнение регрессии:
 
=11,591+0,871
x
С увеличением выпуска продукции на 1 тыс. руб. затраты на производство увеличиваются на 0,871 млн. руб. в среднем, постоянные затраты равны 11,591 млн. руб.
2.1.2. Тесноту связи оценим с помощью линейного коэффициента парной корреляции.
Предварительно определим средние квадратические отклонения признаков.
Средние квадратические отклонения:
Коэффициент корреляции:
Между признаками X
и Y
наблюдается очень тесная линейная корреляционная связь.
2.1.3 Оценим качество построенной модели.
Определим коэффициент детерминации:
т. е. данная модель объясняет 90,5% общей дисперсии у
, на долю необъясненной дисперсии приходится 9,5%. 
Следовательно, качество модели высокое.
Найдем величину средней ошибки аппроксимации А
i
.
Предварительно из уравнения регрессии определим теоретические значения для каждого значения фактора.
Ошибка аппроксимации А
i
,
i
=1…15:
Средняя ошибка аппроксимации:
Ошибка небольшая, качество модели высокое.
5.1.4. Определим средний коэффициент эластичности:
Он показывает, что с увеличением выпуска продукции на 1% затраты на производство увеличиваются в среднем на 0,515%.
2.1.5.Оценим статистическую значимость полученного уравнения. Проверим гипотезу H
0
, что выявленная зависимость у 
от х 
носит случайный характер, т. е. полученное уравнение статистически незначимо. Примем α=0,05. Найдем табличное (критическое) значение F-
критерия Фишера:
Найдем фактическое значение F
- критерия Фишера:
следовательно, гипотеза H
0
отвергается, принимается альтернативная гипотеза H
1
: с вероятностью 1-α=0,95 полученное уравнение статистически значимо, связь между переменными x
и y
неслучайна.
Построим полученное уравнение.
2.2. Модель полулогарифмической парной регрессии
.
2.2.1. Рассчитаем параметры а
и b 
в регрессии:
у
x
=а +
bln
х
. 
Линеаризуем данное уравнение, обозначив:
z=lnx
. 
Тогда:
y
=
a
+ 
bz
.
Параметры a
и b
уравнения
 
 = 
a
+ 
bz
определяются методом наименьших квадратов:
Рассчитываем таблицу 2.
Таблица 2
|   №
  | 
  x
  | 
  y
  | 
  z
  | 
  yz
  | 
  z2
  | 
  y
  | 
  
  | 
  
  | 
  Аi
  | 
|   1  | 
  5,3  | 
  18,4  | 
  1,668  | 
  30,686  | 
  2,781  | 
  338,56  | 
  15,38  | 
  3,02  | 
  16,42  | 
|   2  | 
  15,1  | 
  22,0  | 
  2,715  | 
  59,723  | 
  7,370  | 
  484,00  | 
  25,75  | 
  -3,75  | 
  17,03  | 
|   3  | 
  24,2  | 
  32,3  | 
  3,186  | 
  102,919  | 
  10,153  | 
  1043,29  | 
  30,42  | 
  1,88  | 
  5,83  | 
|   4  | 
  7,1  | 
  16,4  | 
  1,960  | 
  32,146  | 
  3,842  | 
  268,96  | 
  18,27  | 
  -1,87  | 
  11,42  | 
|   5  | 
  11,0  | 
  22,2  | 
  2,398  | 
  53,233  | 
  5,750  | 
  492,84  | 
  22,61  | 
  -0,41  | 
  1,84  | 
|   6  | 
  8,5  | 
  21,7  | 
  2,140  | 
  46,439  | 
  4,580  | 
  470,89  | 
  20,06  | 
  1,64  | 
  7,58  | 
|   7  | 
  14,5  | 
  23,6  | 
  2,674  | 
  63,110  | 
  7,151  | 
  556,96  | 
  25,34  | 
  -1,74  | 
  7,39  | 
|   8  | 
  10,2  | 
  18,5  | 
  2,322  | 
  42,964  | 
  5,393  | 
  342,25  | 
  21,86  | 
  -3,36  | 
  18,17  | 
|   9  | 
  18,6  | 
  26,1  | 
  2,923  | 
  76,295  | 
  8,545  | 
  681,21  | 
  27,81  | 
  -1,71  | 
  6,55  | 
|   10  | 
  19,7  | 
  30,2  | 
  2,981  | 
  90,015  | 
  8,884  | 
  912,04  | 
  28,38  | 
  1,82  | 
  6,03  | 
|   11  | 
  21,3  | 
  28,6  | 
  3,059  | 
  87,479  | 
  9,356  | 
  817,96  | 
  29,15  | 
  -0,55  | 
  1,93  | 
|   12  | 
  22,1  | 
  34,0  | 
  3,096  | 
  105,250  | 
  9,583  | 
  1156,00  | 
  29,52  | 
  4,48  | 
  13,18  | 
|   13  | 
  4,1  | 
  14,2  | 
  1,411  | 
  20,036  | 
  1,991  | 
  201,64  | 
  12,84  | 
  1,36  | 
  9,60  | 
|   14  | 
  12,0  | 
  22,1  | 
  2,485  | 
  54,916  | 
  6,175  | 
  488,41  | 
  23,47  | 
  -1,37  | 
  6,20  | 
|   15  | 
  18,3  | 
  28,2  | 
  2,907  | 
  81,975  | 
  8,450  | 
  795,24  | 
  27,65  | 
  0,55  | 
  1,95  | 
|   Σ  | 
  212,0  | 
  358,5  | 
  37,924  | 
  947,186  | 
  100,003  | 
  9050,25  | 
  358,50  | 
  0,00  | 
  131,14  | 
|   Средн.  | 
  14,133  | 
  23,900  | 
  2,528  | 
  63,146  | 
  6,667  | 
  603,350  | 
  23,90  | 
  0,00  | 
  8,74  | 
Разделив на n
и решая методом Крамера, получаем формулу для определения b
:
Уравнение регрессии:
 
 = -1,136 + 9,902
z
2.2.2. Оценим тесноту связи между признаками у
и х
.
Т. к. уравнение у = а + b
l
n x
линейно относительно параметров а
и b
и его линеаризация не была связана с преобразованием зависимой переменной _у
, то теснота связи между переменными у
и х
, оцениваемая с помощью индекса парной корреляции Rxy
, также может быть определена с помощью линейного коэффициента парной корреляции ryz
среднее квадратическое отклонение z
:
Значение индекса корреляции близко к 1, следовательно, между переменными у
и х 
наблюдается очень тесная корреляционная связь вида  = 
a
 + 
bz
.
2.2.3 Оценим качество построенной модели.
Определим коэффициент детерминации:
т. е. данная модель объясняет 83,8% общей вариации результата у
, на долю необъясненной вариации приходится 16,2%. 
Следовательно, качество модели высокое.
Найдем величину средней ошибки аппроксимации А
i
.
Предварительно из уравнения регрессии определим теоретические значения для каждого значения фактора.
Ошибка аппроксимации А
i
, i
=1…15:
Средняя ошибка аппроксимации:
Ошибка небольшая, качество модели высокое.
2.2.4.Определим средний коэффициент эластичности:
Он показывает, что с увеличением выпуска продукции на 1% затраты на производство увеличиваются в среднем на 0,414%.
2.2.5.Оценим статистическую значимость полученного уравнения. Проверим гипотезу H
0
, что выявленная зависимость у 
от х 
носит случайный характер, т.е. полученное уравнение статистически незначимо. Примем α=0,05. 
Найдем табличное (критическое) значение F
-критерия Фишера:
Найдем фактическое значение F
-критерия Фишера:
следовательно, гипотеза H
0
отвергается, принимается альтернативная гипотеза H
1
: с вероятностью 1-α=0,95 полученное уравнение статистически значимо, связь между переменными x
и y
неслучайна.
Построим уравнение регрессии на поле корреляции
2.3. Модель степенной парной регрессии.
2.3.1. Рассчитаем параметры а
и b 
степенной регрессии:
Расчету параметров предшествует процедура линеаризации данного уравнения:
и замена переменных:
Y=lny, X=lnx, A=lna
Параметры уравнения:
Y
=
A
+
bX
определяются методом наименьших квадратов:
Рассчитываем таблицу 3.
Определяем b
:
Уравнение регрессии:
Построим уравнение регрессии на поле корреляции:
2.3.2. Оценим тесноту связи между признаками у 
и х 
с помощью индекса парной корреляции Ryx
.
Предварительно рассчитаем теоретическое значение  для каждого значения фактора x
,
и , тогда: 
Значение индекса корреляции Rxy
близко к 1, следовательно, между переменными у 
и х 
наблюдается очень тесная корреляционная связь вида: 
2.3.3.Оценим качество построенной модели.
Определим индекс детерминации:
R
2
=0,9362
=0,878, 
т. е. данная модель объясняет 87,6% общей вариации результата у, 
а на долю необъясненной вариации приходится 12,4%. 
Качество модели высокое.
Найдем величину средней ошибки аппроксимации.
Ошибка аппроксимации А
i
, i
=1…15:
Средняя ошибка аппроксимации:
Ошибка небольшая, качество модели высокое.
2.3.4. Определим средний коэффициент эластичности:
Он показывает, что с увеличением выпуска продукции на 1% затраты на производство увеличиваются в среднем на 0,438%.
2.3.5.Оценим статистическую значимость полученного уравнения.
Проверим гипотезу H
0
, что выявленная зависимость у 
от х 
носит случайный характер, т. е. полученное уравнение статистически незначимо. Примем α=0,05.
табличное (критическое) значение F
-критерия Фишера:
фактическое значение F
-критерия Фишера:
Таблица 3
|   №
  | 
  x
  | 
  y
  | 
  X
  | 
  Y
  | 
  YX
  | 
  X2
  | 
  y
  | 
  
  | 
  
  | 
  
  | 
  Аi
  | 
|   1  | 
  5,3  | 
  18,4  | 
  1,668  | 
  2,912  | 
  4,857  | 
  2,781  | 
  338,56  | 
  15,93  | 
  2.47  | 
  6,12  | 
  13,44  | 
|   2  | 
  15,1  | 
  22,0  | 
  2,715  | 
  3,091  | 
  8,391  | 
  7,370  | 
  484,00  | 
  25,19  | 
  -3,19  | 
  10,14  | 
  14,48  | 
|   3  | 
  24,2  | 
  32,3  | 
  3,186  | 
  3,475  | 
  11,073  | 
  10,153  | 
  1043,29  | 
  30,96  | 
  1,34  | 
  1,80  | 
  4,15  | 
|   4  | 
  7,1  | 
  16,4  | 
  1,960  | 
  2,797  | 
  5,483  | 
  3,842  | 
  268,96  | 
  18,10  | 
  -1,70  | 
  2,89  | 
  10,37  | 
|   5  | 
  11,0  | 
  22,2  | 
  2,398  | 
  3,100  | 
  7,434  | 
  5,750  | 
  492,84  | 
  21,92  | 
  0,28  | 
  0,08  | 
  1,24  | 
|   6  | 
  8,5  | 
  21,7  | 
  2,140  | 
  3,077  | 
  6,586  | 
  4,580  | 
  470,89  | 
  19,58  | 
  2,12  | 
  4,48  | 
  9,75  | 
|   7  | 
  14,5  | 
  23,6  | 
  2,674  | 
  3,161  | 
  8,454  | 
  7,151  | 
  556,96  | 
  24,74  | 
  -1,14  | 
  1,30  | 
  4,84  | 
|   8  | 
  10,2  | 
  18,5  | 
  2,322  | 
  2,918  | 
  6,776  | 
  5,393  | 
  342,25  | 
  21,21  | 
  -2,71  | 
  7,35  | 
  14,66  | 
|   9  | 
  18,6  | 
  26,1  | 
  2,923  | 
  3,262  | 
  9,535  | 
  8,545  | 
  681,21  | 
  27,59  | 
  -1,49  | 
  2,22  | 
  5,71  | 
|   10  | 
  19,7  | 
  30,2  | 
  2,981  | 
  3,408  | 
  10,157  | 
  8,884  | 
  912,04  | 
  28,29  | 
  1,91  | 
  3,63  | 
  6,31  | 
|   11  | 
  21,3  | 
  28,6  | 
  3,059  | 
  3,353  | 
  10,257  | 
  9,356  | 
  817,96  | 
  29,28  | 
  -0,68  | 
  0,46  | 
  2,37  | 
|   12  | 
  22,1  | 
  34,0  | 
  3,096  | 
  3,526  | 
  10,916  | 
  9,583  | 
  1156,00  | 
  29,75  | 
  4,25  | 
  18,03  | 
  12,49  | 
|   13  | 
  4,1  | 
  14,2  | 
  1,411  | 
  2,653  | 
  3,744  | 
  1,991  | 
  201,64  | 
  14,23  | 
  -0,03  | 
  0,00  | 
  0,24  | 
|   14  | 
  12,0  | 
  22,1  | 
  2,485  | 
  3,096  | 
  7,692  | 
  6,175  | 
  488,41  | 
  22,78  | 
  -0,68  | 
  0,46  | 
  3,06  | 
|   15  | 
  18,3  | 
  28,2  | 
  2,907  | 
  3,339  | 
  9,707  | 
  8,450  | 
  795,24  | 
  27,40  | 
  0,80  | 
  0,65  | 
  2,85  | 
|   сумма  | 
  212,0  | 
  358,5  | 
  37,924  | 
  47,170  | 
  121,062  | 
  100,003  | 
  9050,25  | 
  358,5  | 
  0,00  | 
  59,61  | 
  105,95  | 
|   среднее  | 
  14,133  | 
  23,900  | 
  2,528  | 
  3,145  | 
  8,071  | 
  6,667  | 
  603,350  | 
  23,90  | 
  0,00  | 
  3,97  | 
  7,06  | 
следовательно, гипотеза H
0
отвергается, принимается альтернативная гипотеза H
1
: с вероятностью 1-α=0,95 полученное уравнение статистически значимо, связь между переменными x
и y
неслучайна.
3. Выбор лучшего уравнения.
Составим таблицу полученных результатов исследования.
Таблица 4
|   Уравнение  | 
  Коэффициент (индекс) корреляции  | 
  Коэффициент (индекс) детерминации  | 
  Средняя ошибка аппроксимации  | 
  Коэффициент эластичности  | 
|   линейное  | 
  0,951 
		
		td>
   | 
0,905   | 
6,65   | 
0,515  | 
|   полулогагифмическое  | 
  0,915  | 
  0,838  | 
  8,74  | 
  0,414  | 
|   степенное  | 
  0,936  | 
  0,878  | 
  7,06  | 
  0,438  | 
Анализируем таблицу и делаем выводы.
- Все три уравнения оказались статистически значимыми и надежными, имеют близкий к 1 коэффициент (индекс) корреляции, высокий (близкий к 1) коэффициент (индекс) детерминации и ошибку аппроксимации в допустимых пределах.
- При этом характеристики линейной модели указывают, что она несколько лучше полулогарифмической и степенной описывает связь между признаками x
и у.
- Поэтому в качестве уравнения регрессии выбираем линейную модель.
4. 
Для выбранной модели проверим предпосылку МНК о гомоскедастичности остатков, т. е. о том, что остатки регрессии имеют постоянную дисперсию. 
Используем метод Гольдфельдта-Квандта.
1. Упорядочим наблюдения по мере возрастания переменной х
.
2. Исключим из рассмотрения 3 центральных наблюдения.
3. Рассмотрим первую группу наблюдений (малые значения фактора х
) и определим этой группы.
4. Рассмотрим вторую группу наблюдений (большие значения фактора х) и определим этой группы.
5. Проверим, значимо или незначимо отличаются дисперсии остатков этих групп.
Таблица 5
|   №
  | 
  x
  | 
  y
  | 
  yx
  | 
  x2
  | 
  y
  | 
  
  | 
  
  | 
  
  | 
|   1  | 
  4,1  | 
  14,2  | 
  58,22  | 
  16,81  | 
  201,64  | 
  15,47  | 
  -1,27  | 
  1,60  | 
|   2  | 
  5,3  | 
  18,4  | 
  97,52  | 
  28,09  | 
  338,56  | 
  16,50  | 
  1,90  | 
  3,61  | 
|   3  | 
  7,1  | 
  16,4  | 
  116,44  | 
  50,41  | 
  268,96  | 
  18,05  | 
  -1,65  | 
  2,72  | 
|   4  | 
  8,5  | 
  21,7  | 
  184,45  | 
  72,25  | 
  470,89  | 
  19,26  | 
  2,44  | 
  5,97  | 
|   5  | 
  10,2  | 
  18,5  | 
  188,70  | 
  104,04  | 
  342,25  | 
  20,72  | 
  -2,22  | 
  4,93  | 
|   6  | 
  11,0  | 
  22,2  | 
  244,20  | 
  121,00  | 
  492,84  | 
  21,41  | 
  0,79  | 
  0,63  | 
|   сумма  | 
  46,2  | 
  111,4  | 
  889,53  | 
  392,60  | 
  2115,14  | 
  111,40  | 
  0,00  | 
  19,46  | 
|   среднее  | 
  7,70  | 
  18,57  | 
  148,26  | 
  65,43  | 
  352,52  | 
  18,57  | 
  0,00  | 
  3,89  | 
Определим параметры уравнения регрессии 1 группы:
Уравнение регрессии 1 группы:
=11,93+0,86
x
Таблица 6
|   №
  | 
  x
  | 
  y
  | 
  yx
  | 
  x2
  | 
  y
  | 
  
  | 
  
  | 
  
  | 
|   10  | 
  18,3  | 
  28,2  | 
  516,06  | 
  334,89  | 
  795,24  | 
  27,56  | 
  0,64  | 
  0,41  | 
|   11  | 
  18,6  | 
  26,1  | 
  485,46  | 
  345,96  | 
  681,21  | 
  27,85  | 
  -1,75  | 
  3,06  | 
|   12  | 
  19,7  | 
  30,2  | 
  594,94  | 
  388,09  | 
  912,04  | 
  28,92  | 
  1,28  | 
  1,63  | 
|   13  | 
  21,3  | 
  28,6  | 
  609,18  | 
  453,69  | 
  817,96  | 
  30,49  | 
  -1,89  | 
  3,56  | 
|   14  | 
  22,1  | 
  34,0  | 
  751,40  | 
  488,41  | 
  1156,00  | 
  31,27  | 
  2,73  | 
  7,47  | 
|   15  | 
  24,2  | 
  32,3  | 
  781,66  | 
  585,64  | 
  1043,29  | 
  33,32  | 
  -1,02  | 
  1,03  | 
|   сумма  | 
  124,2  | 
  179,4  | 
  3738,70  | 
  2596,68  | 
  5405,74  | 
  179,40  | 
  0,00  | 
  17,17  | 
|   среднее  | 
  20,70  | 
  29,90  | 
  623,12  | 
  432,78  | 
  900,96  | 
  29,90  | 
  0,00  | 
  3,43  | 
Параметры уравнения регрессии 2 группы:
Уравнение регрессии 2 группы:
 
=9,7+0,98
x
S
1
=
19.46>
S
2
=
17.17
F
факт.
< 
F
табл.
следовательно, остатки гомоскедастичны, предпосылки МНК не нарушены.
5. Рассчитаем прогнозное значение результата у, если прогнозное значение фактора х увеличивается на 5% от его среднего уровня.
Точечный прогноз:
11,59+0,871,0514,13=24,515 млн. руб.
Для данной величины выпуска продукции прогнозное значение затрат на производство составляет 24,515 млн. руб.
Для уровня значимости α= 0,05 определим доверительный интервал прогноза.
Предварительно определим стандартные ошибки коэффициента корреляции и параметра b
.
Стандартная ошибка коэффициента корреляции:
Ошибка прогноза:
Доверительный интервал прогноза значений y
при  с вероятностью 0,95 составит:
Прогноз надежный, но не очень точный, т. к.
Задание 2
 
Имеются данные о заработной плате у 
(тысяч рублей), возрасте х1
(лет), стаже работы по специальности х2
(лет) и выработке х3
(штук в смену) по 15 рабочим цеха:
|   №
  | 
  y
  | 
  х
  | 
  х2
  | 
  х
  | 
|   1  | 
  3,2  | 
  30  | 
  6  | 
  12  | 
|   2  | 
  4,5  | 
  41  | 
  18  | 
  20  | 
|   3  | 
  3,3  | 
  37  | 
  11  | 
  12  | 
|   4  | 
  3,0  | 
  33  | 
  9  | 
  18  | 
|   5  | 
  2,8  | 
  24  | 
  4  | 
  15  | 
|   6  | 
  3,9  | 
  44  | 
  19  | 
  17  | 
|   7  | 
  3,7  | 
  37  | 
  18  | 
  17  | 
|   8  | 
  4,2  | 
  39  | 
  22  | 
  26  | 
|   9  | 
  4,7  | 
  49  | 
  30  | 
  26  | 
|   10  | 
  4,4  | 
  48  | 
  24  | 
  22  | 
|   11  | 
  2,9  | 
  29  | 
  8  | 
  18  | 
|   12  | 
  3,7  | 
  31  | 
  6  | 
  20  | 
|   13  | 
  2,4  | 
  26  | 
  5  | 
  10  | 
|   14  | 
  4,5  | 
  47  | 
  19  | 
  20  | 
|   15  | 
  2,6  | 
  29  | 
  4  | 
  15  | 
Требуется:
1. С помощью определителя матрицы парных коэффициентов межфакторной корреляции оценить мультиколлинеарность факторов, исключить из модели фактор, ответственный за мультиколлинеарность.
2. Построить уравнение множественной регрессии в стандартизованной форме:
2.1. Оценить параметры уравнения.
2.2. Используя стандартизованные коэффициенты регрессии сравнить факторы по силе их воздействия на результат.
2.3. Оценить тесноту связи между результатом и факторами с помощью коэффициента множественной корреляции.
2.4. Оценить с помощью коэффициента множественной детерминации качество модели.
2.5. Используя F-критерий Фишера оценить статистическую значимость присутствия каждого из факторов в уравнении регрессии.
3. Построить уравнение множественной регрессии в естественной форме, пояснить экономический смысл параметров уравнения.
4. Найти среднюю ошибку аппроксимации.
5. Рассчитать прогнозное значение результата, если прогнозное значение факторов составит: х1
= 35 лет, х2
= 
10 лет, х3
= 20 штук в смену.
Решение.
Для оценки мультиколлинеарности факторов используем определитель матрицы парных коэффициентов корреляции между факторами.
Определим парные коэффициенты корреляции.
Для этого рассчитаем таблицу 7.
Используя рассчитанную таблицу, определяем дисперсию y
, 
x
1
, 
x
2
, 
x
3
.
Найдем среднее квадратическое отклонение признаков y
, 
x
1
, 
x
2
, x
3
, как корень квадратный из соответствующей дисперсии.
Определим парные коэффициенты корреляции:
таблица 7
|   №
  | 
  y
  | 
  y2
  | 
  x1
  | 
  x1
  | 
  x2
  | 
  x2
  | 
  x3
  | 
  x3
  | 
  yx1
  | 
  yx2
  | 
  yx3
  | 
  x1
  | 
  x1
  | 
  x2
  | 
  
  | 
  
  | 
  А
  | 
|   1  | 
  3,2  | 
  10,24  | 
  30  | 
  900  | 
  6  | 
  36  | 
  12  | 
  144  | 
  96,0  | 
  19,2  | 
  38,4  | 
  180  | 
  360  | 
  72  | 
  2,87  | 
  0,33  | 
  10,18  | 
|   2  | 
  4,5  | 
  20,25  | 
  41  | 
  1681  | 
  18  | 
  324  | 
  20  | 
  400  | 
  184,5  | 
  81,0  | 
  90,0  | 
  738  | 
  820  | 
  360  | 
  4,00  | 
  0,50  | 
  11,03  | 
|   3  | 
  3,3  | 
  10,89  | 
  37  | 
  1369  | 
  11  | 
  121  | 
  12  | 
  144  | 
  122,1  | 
  36,3  | 
  39,6  | 
  407  | 
  444  | 
  132  | 
  3,32  | 
  -0,02  | 
  0,73  | 
|   4  | 
  3,0  | 
  9,00  | 
  33  | 
  1089  | 
  9  | 
  81  | 
  18  | 
  324  | 
  99,0  | 
  27,0  | 
  54,0  | 
  297  | 
  594  | 
  162  | 
  3,38  | 
  -0,38  | 
  12,79  | 
|   5  | 
  2,8  | 
  7,84  | 
  24  | 
  576  | 
  4  | 
  16  | 
  15  | 
  225  | 
  67,2  | 
  11,2  | 
  42,0  | 
  96  | 
  360  | 
  60  | 
  2,65  | 
  0,15  | 
  5,47  | 
|   6  | 
  3,9  | 
  15,21  | 
  44  | 
  1936  | 
  19  | 
  361  | 
  17  | 
  289  | 
  171,6  | 
  74,1  | 
  66,3  | 
  836  | 
  748  | 
  323  | 
  4,04  | 
  -0,14  | 
  3,54  | 
|   7  | 
  3,7  | 
  13,69  | 
  37  | 
  1369  | 
  18  | 
  324  | 
  17  | 
  289  | 
  136,9  | 
  66,6  | 
  62,9  | 
  666  | 
  629  | 
  306  | 
  3,59  | 
  0,11  | 
  3,03  | 
|   8  | 
  4,2  | 
  17,64  | 
  39  | 
  1521  | 
  22  | 
  484  | 
  26  | 
  676  | 
  163,8  | 
  92,4  | 
  109,2  | 
  858  | 
  1014  | 
  572  | 
  4,19  | 
  0,01  | 
  0,20  | 
|   9  | 
  4,7  | 
  22,09  | 
  49  | 
  2401  | 
  30  | 
  900  | 
  26  | 
  676  | 
  230,3  | 
  141,0  | 
  122,2  | 
  1470  | 
  1274  | 
  780  | 
  4,83  | 
  -0,13  | 
  2,86  | 
|   10  | 
  4,4  | 
  19,36  | 
  48  | 
  2304  | 
  24  | 
  576  | 
  22  | 
  484  | 
  211,2  | 
  105,6  | 
  96,8  | 
  1152  | 
  1056  | 
  528  | 
  4,56  | 
  -0,16  | 
  3,61  | 
|   11  | 
  2,9  | 
  8,41  | 
  29  | 
  841  | 
  8  | 
  64  | 
  18  | 
  324  | 
  84,1  | 
  23,2  | 
  52,2  | 
  232  | 
  522  | 
  144  | 
  3,13  | 
  -0,23  | 
  7,82  | 
|   12  | 
  3,7  | 
  13,69  | 
  31  | 
  961  | 
  6  | 
  36  | 
  20  | 
  400  | 
  114,7  | 
  22,2  | 
  74,0  | 
  186  | 
  620  | 
  120  | 
  3,36  | 
  0,34  | 
  9,17  | 
|   13  | 
  2,4  | 
  5,76  | 
  26  | 
  676  | 
  5  | 
  25  | 
  10  | 
  100  | 
  62,4  | 
  12,0  | 
  24,0  | 
  130  | 
  260  | 
  50  | 
  2,51  | 
  -0,11  | 
  4,65  | 
|   14  | 
  4,5  | 
  20,25  | 
  47  | 
  2209  | 
  19  | 
  361  | 
  20  | 
  400  | 
  211,5  | 
  85,5  | 
  90,0  | 
  893  | 
  940  | 
  380  | 
  4,39  | 
  0,11  | 
  2,46  | 
|   15  | 
  2,6  | 
  6,76  | 
  29  | 
  841  | 
  4  | 
  16  | 
  15  | 
  225  | 
  75,4  | 
  10,4  | 
  39,0  | 
  116  | 
  435  | 
  60  | 
  2,97  | 
  -0,37  | 
  14,17  | 
|   σ  | 
  53,8  | 
  201,08  | 
  544  | 
  20674  | 
  203  | 
  3725  | 
  268  | 
  5100  | 
  2030,7  | 
  807,7  | 
  1000,6  | 
  8257  | 
  10076  | 
  4049  | 
  53,80  | 
  0,00  | 
  91,69  | 
|   ср.  | 
  3,59  | 
  13,41  | 
  36,27  | 
  1378,27  | 
  13,53  | 
  248,33  | 
  17,87  | 
  340,00  | 
  135,38  | 
  53,85  | 
  66,71  | 
  550,47  | 
  671,73  | 
  269,93  | 
  3,59  | 
  0,00  | 
  6,11  | 
Матрица парных коэффициентов корреляции:
|   y
  | 
  x1
  | 
  x2
  | 
  x3
  | 
|
|   y
  | 
  1,000  | 
|||
|   x1
  | 
  0,908  | 
  1,000  | 
||
|   x2
  | 
  0,894  | 
  0,931
  | 
  1,000  | 
|
|   x3
  | 
  0,783  | 
  0,657  | 
  0,765  | 
  1,000  | 
Анализируем матрицу парных коэффициентов корреляции.
- rx1x2
=0.931, т. е. между факторами x1
и x2
существует сильная корреляционная связь, один из этих факторов необходимо исключить.
- rx1x3
=0.657 меньше, чем rx2x3
=0.765, т.е. корреляция фактора х2
с фактором х3
сильнее, чем корреляция факторов х1
и х3
.
- Из модели следует исключить фактор х2
, т.к. он имеет наибольшую тесноту связи с х3
и, к тому же, менее тесно (по сравнению с x
1
) связан с результатом у 
(0.894<0.908).
2.1. Уравнение регрессии в естественной форме будет иметь вид:
 
y
x
 = a + bl
x]
+b3
x3
,
фактор х2
исключен из модели. 
Стандартизованное уравнение:
 
ty
 
= 
β
1
tx
1
+
β
3
tx
3
где:
ty
, 
tx
1
, 
tx
3
– стандартизованные переменные.
Параметры уравнения β
1
и β
3
определим методом наименьших квадратов из системы уравнений:
Или:
Систему решаем методом Крамера:
|   ∆=
  | 
  1  | 
  0,657  | 
  = 1-0,6572
  | 
|   0,657  | 
  1  | 
|   ∆β1
  | 
  0,908  | 
  0,657  | 
  = 0,908-0,6570,783=0,394  | 
|   0,783  | 
  1  | 
|   ∆β3
  | 
  1  | 
  0,571  | 
  =0,833-0,5710,413= 0,186  | 
|   0,413  | 
  0,833  | 
Тогда:
Получили уравнение множественной регрессии в стандартизованном масштабе:
ty
 
= 0,693
tx
1
+0,327
tx
3
Коэффициенты β1
и β3
сравнимы между собой в отличии от коэффициентов чистой регрессии b
1
и b
3
.
β1
=
0,693 больше β3
=
0,327, 
следовательно, фактор x
1
сильнее влияет на результат y
чем фактор x
3
.
Определим индекс множественной корреляции:
Cвязь между y
и факторами x
1
, x
3
характеризуется как тесная, т. к. значение индекса множественной корреляции близко к 1.
Коэффициент множественной детерминации:
R
2
yx
1
x
3
=(0.941)2
=0.886
Т. е. данная модель объясняет 88,6% вариации y
, на долю неучтенных в модели факторов приходится 100-88,6=11,4% 
Оценим значимость полученного уравнения регрессии с помощью F
-критерия Фишера:
F
табл
(α=
0,05; 
k
1
=
2; 
k
2
=
15-2-1=12)=
3,88
Табличное значение критерия Фишера (определяем по таблице значений критерия Фишера при заданном уровне значимости α 
и числе степеней свободы k
1
и k
2
) меньше фактического значения критерия. следовательно, гипотезу H
0
о том, что полученное уравнение статистически незначимо и ненадежно, отвергаем и принимаем альтернативную гипотезу H
1
: полученное уравнение статистически значимо, надежно и пригодно для анализа и прогноза.
Оценим статистическую значимость включения в модель факторов x
1
и x
2.
F
табл 
(α=
0,05; 
k
1
=
1; 
k
2
=
15-2-1=12)=
4,75
Fx
1 
>
F
табл.
Fx
3 
>
F
табл.
Значит, включение в модель факторов x
1
и x
3
статистически значимо.
Перейдем к уравнению регрессии в естественном масштабе:
Уравнение множественной регрессии в естественном масштабе:
Экономическая интерпретация параметров уравнения:
b1
=0.064, это значит, что с увеличением x1
– возраста рабочего на 1 год заработная плата рабочего увеличивается в среднем на 64 рубля, если при этом фактор x2 
- выработка рабочего не меняется и фиксирован на среднем уровне.
b3
=0,053, это значит, что с увеличением x3 
– выработки рабочего на 1 шт. в смену, заработная плата рабочего увеличивается в среднем на 53 рубля, если при этом фактор x1
- возраст рабочего не меняется и фиксирован на среднем уровне.
a
=0,313 не имеет экономической интерпретации, формально это значение результата y
при нулевом значении факторов, но факторы могут и не иметь нулевого значения.
Найдем величину средней ошибки аппроксимации, таблица 7.
Ошибка аппроксимации А
i
, i
=1…15:
Средняя ошибка аппроксимации:
Ошибка небольшая, качество модели высокое.
Используем полученную модель для прогноза.
Если х1
=35, х2
=10, х3
=20, то
ур
= 0,313 + 0,064•35 + 0,053•20 = 3,618 тыс. руб.
т. е. для рабочего данного цеха, возраст которого 35 лет, а выработка 20 шт. в смену, прогнозное значение заработной платы - 3618 руб.