РефератыМатематикаПоПостроение корреляции исследуемых зависимостей

Построение корреляции исследуемых зависимостей

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ


ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ЭКОНОМИКИ И ФИНАНСОВ»


КАФЕДРА СТАТИСТИКИ И ЭКОНОМЕТРИКИ


КОНТРОЛЬНОЕ ЗАДАНИЕ


по дисциплине "ЭКОНОМЕТРИКА"


ВАРИАНТ № 5


Санкт-Петербург


2009


1. По 10 банкам изучается зависимость прибыли (у – млн. руб.) от вложений в уставные капиталы предприятий (х – млн. руб.):















































Прибыль, млн. руб.
Вложения в уставные капиталы предприятий, млн. руб.
1
55,3
20
2
50,2
25
3
60,9
35
4
62,8
42
5
63,9
47
6
64,5
50
7
65,5
55
8
66,8
63
9
67,9
70
10
69,3
80

1. Построить поле корреляции рассматриваемой зависимости.


2. Определить уравнение регрессии полулогарифметической модели: = а + b*lnх.


3. Найти индекс корреляции и сравнить его с линейным коэффициентом корреляции. Пояснить причины различий.


4. Найти среднюю ошибку аппроксимации.


5. Рассчитать стандартную ошибку регрессии.


6. С вероятностью 0,95 оценить статистическую значимость уравнения и коэффициента регрессии. Сделать выводы.


7. С вероятностью 0,95 оценить доверительный интервал ожидаемого размера прибыли, если вложения в уставные капиталы предприятий составят 45 млн. руб.


решение

При изучении зависимости между двумя признаками графический метод подбора вида уравнения регрессии достаточно нагляден. Он основан на поле корреляции.



Рисунок 1.1. Поле корреляции, характеризующее зависимость прибыли от вложений в ставные капиталы предприятий.


Для определения параметров полулогарифмической функции используется система нормальных уравнений следующего вида:


.


Таблица 1.1


Определение параметров регрессии
































































































































у у2
х lnx (lnx)2
у*lnx
1 55,3 3058,09 20 2,996 0,655 8,974 165,664
2 50,2 2520,04 25 3,219 0,344 10,361 161,588
3 60,9 3708,81 35 3,555 0,062 12,640 216,521
4 62,8 3943,84 42 3,738 0,005 13,970 234,726
5 63,9 4083,21 47 3,850 0,002 14,824 246,024
6 64,5 4160,25 50 3,912 0,011 15,304 252,325
7 65,5 4290,25 55 4,007 0,041 16,059 262,480
8 66,8 4462,24 63 4,143 0,114 17,166 276,761
9 67,9 4610,41 70 4,248 0,197 18,050 288,473
10 69,3 4802,49 80 4,382 0,333 19,202 303,674
Сумма 627,1 39639,63 487 38,051 1,764 146,550 2408,237
Среднее 62,710 3963,96 48,700 3,805 - 14,655 240,824
s 5,605 - - 0,421 - - -

.


а = = 0,02;


b = = 16,428.


Итак, получили следующее уравнении регрессии: = 0,02 + 16,428*lnх.


Подставляя в уравнении регрессии фактические значения х, получаем теоретические значения результата . По ним рассчитываем показатель тесноты связи – индекс корреляции.


rху
=


Таблица 1.2


Расчет коэффициента корреляции
















































































у
1 55,3 49,23 36,80 54,91
2 50,2 52,90 7,29 156,50
3 60,9 58,43 6,11 3,28
4 62,8 61,42 1,90 0,01
5 63,9 63,27 0,40 1,42
6 64,5 64,29 0,05 3,20
7 65,5 65,85 0,12 7,78
8 66,8 68,08 1,65 16,73
9 67,9 69,81 3,66 26,94
10 69,3 72,01 7,33 43,43
Сумма 627,1 625,30 65,31 314,19
Среднее 62,710 - - -

rху
= = 0,89 – связь сильная.


Рассчитаем линейный коэффициент корреляции:


rxy
= b* = 16,428* = 0,91 – данное значение близко к единице и означает наличие очень тесной зависимости прибыли от вложений в уставные капиталы предприятий.


Мы получили различие между индексом корреляции и линейным коэффициентом корреляции из-за различий в принимаемой базе при расчетах, т.е. в одном случае используется потенцированное значение, а в другом непотенциированное.


Средняя ошибка аппроксимации – среднее отклонение расчетных значений от фактических:


= *100%.


Таблица 1.3


Расчет средней ошибки аппроксимации






























































у
1 55,3 49,23 0,110
2 50,2 52,90 -0,054
3 60,9 58,43 0,041
4 62,8 61,42 0,022
5 63,9 63,27 0,010
6 64,5 64,29 0,003
7 65,5 65,85 -0,005
8 66,8 68,08 -0,019
9 67,9 69,81 -0,028
10 69,3 72,01 -0,039
Сумма 627,1 625,30 0,040

= *0,040*100 = 0,4% - в среднем расчетные значения отклоняются от фактических на 0,4%.


Стандартная ошибка регрессии, как и ошибка аппроксимации, служит для оценки качества уравнения регрессии. Ошибка определяется по формуле:


S = = = 2,857.


f-тест – оценивание качества уравнения регрессии – состоит в проверке гипотезы Н0
о статической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнения фактического Fфакт
и критического Fтабл
значений f-критерия Фишера.


Fфакт
определяется из соотношения:


Fфакт
= = = 30,48,


где n – число единиц совокупности;


m – число параметров при переменных х.


Поскольку Fфакт
> Fтабл.
= 5,32, то Н0
– гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность.


Для параметров парной регрессии средняя ошибка оценки вычисляется:


mb
= = = 2,151;


tb
= = = 7,637.


Табличное значение критерия Стьюдента при уровне значимости 0,05 и количестве степеней свободы 10 – 2 = 8 составляет 2,306.


Вывод: полученное значение критерия tb
по модулю больше табличного, следовательно, можно отклонить гипотезу о несущественности коэффициента регрессии b.


Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если вложения в уставные капиталы предприятий составят 45 млн. руб., то вложения в уставные капиталы предприятий будут:


= 0,02 + 16,428*ln45 = 62,556 млн. руб.


Ошибка прогноза вычисляется по формуле:


m= sост
* = 2,857* = 2,857*1,049 = 2,997.


Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит:


D = tтабл
* m = 2,306*2,997 = 6,911.


Доверительный интервал прогноза:


g = ±D = 62,556 ± 6,911;


gmin = - D = 62,556 – 6,911 = 55,645;


gmах = + D = 62,556 + 6,911 = 69,467.


Итак, ожидаемый размер прибыли, если вложения в уставные капиталы предприятий составят 45 млн. руб., не выйдет с вероятностью 0,95 за пределы интервала [55,645; 69,467] млн. руб.


2. По 20 предприятиям региона, выпускающим однородную продукцию построена модель объема выпуска (у – тыс. ед.) от численности занятых (х1
- человек), элекровооруженности труда (х2
– кВт*час на 1 работника) и потерь рабочего времени (х3
- %). Результаты оказались следующими:


= а + 1,8*х1
+ 3,2*х2
– 2,1*х3
R2
= 0,875


(2,1) (3,4) (4,9) (1,9)


В скобках указаны фактические значения t-критерия для параметров уравнения регрессии.


Кроме того, известна следующая информация:





















Среднее значение
Коэффициент вариации, %
у
25
40
х1

420
20
х2

30
35
х3

18
10

1. Дать интерпретацию коэффициентов регрессии и оценить их значимость. Сделать выводы.


2. Оценить параметр а.


3. Оценить значимость уравнения регрессии с помощью F-критерия Фишера с вероятностью 0,95. Сделать выводы.


4. Построить уравнение множественной регрессии в стандартизованном масштабе и сделать выводы.


5. Найти частные коэффициенты корреляции и сделать выводы.


6. Дать интервальную оценку для коэффициентов регрессии.


7. Определить частные средние коэффициенты эластичности и сделать выводы.


8. Оценить скорректированный коэффициент множественной детерминации.


решение

Интерпретация уравнения регрессии: параметр b1
свидетельствует о том, что с увеличением численности занятых на 1 чел., объем выпуска увеличивается на 1,8 тыс. ед. при постоянном уровне электровооруженности труда и потерь рабочего времени.


Увеличение электровооруженности труда на 1 кВт.час на 1 работника объем выпуска увеличивается на 3,2 тыс. ед. при постоянном уровне численности занятых и потерь рабочего времени.


Увеличение же потерь рабочего времени на 1% объем выпуска снижается на 2,1 тыс. ед. при постоянном уровне численности занятых и элекровооруженности труда.


Оценку статистической значимости коэффициентов регрессии проведем с помощью t-статистики Стьюдента и путем расчета доверительного интервала каждого из показателей.


Выдвигаем гипотезу Н0
о статистически незначимом отличии коэффициентов регрессии от нуля.


tтабл
для числа степеней свободы df = n – 2 = 20 – 2 = 18 и a = 0,05 составит 2,101.


Фактические значения t-статистики:


tb
1
= 3,4 > tтабл
= 2,101;


tb
2
= 4,9 > tтабл
= 2,101;


tb
3
= -1,9 < tтабл
= 2,101.


Гипотеза Н0
отклоняется, т.е. b1
и b2
не случайно отличаются от 0, а статистически значимы. Гипотеза Н0
не отклоняется в случае коэффициента b3
, данный коэффициент следует признать статистически незначимым.


Выдвигаем гипотезу Н0
о статистически незначимом отличии показателя а от нуля.


tтабл
для числа степеней свободы df = n – 2 = 20 – 2 = 18 и a = 0,05 составит 2,101.


Фактические значения t-статистики: tа
= 2,1 > tтабл
= 2,10.


Гипотеза Н0
отклоняется, т.е. параметр а не случайно отличаются от 0, а статистически значим.


f-тест – оценивание качества уравнения регрессии – состоит в проверке гипотезы Н0
о статической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнения фактического Fфакт
и критического Fтабл
значений f-критерия Фишера.


Fфакт
определяется из соотношения:


Fфакт
= = = 37,33,


где n – число единиц совокупности;


m – число параметров при переменных х.


Поскольку Fфакт
> Fтабл.
= 3,24, то Н0
– гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность.


Для построения уравнения в стандартизованном масштабе рассчитаемbi
, используя формулы для перехода от bi
к bi
:


bi
= bi
*.


Таблица 2.1


Расчет среднеквадратического отклонения































Среднее значение Коэффициент вариации, % s
(1) (2) (3) (4) = (2)*(3)
у 25 40 10
х1
420 20 84
х2
30 35 10,5
х3
18 10 1,8

b1
= 1,8* = 15,12;


b2
= 3,2* = 3,36;


b3
= -2,1* = -0,38;


Получим уравнение: ty
= 15,12*tx
1
+ 3,36*tx
2
– 0,38*tх3
.


Анализ β-коэффициентов показывает, что на объем выпуска из трех исследуемых факторов сильнее оказывает фактор X1
– численность занятых, так как ему соответствует наибольшее значение β-коэффициента.


Частные коэффициенты корреляции можно определить по формуле на основе коэффициентов детерминации:


ryx1*x2x3
= ;


ryx2*x1x3
= ;


ryx3*x1x2
= .


Определяем частный коэффициент корреляции у с х1
:



1
= ;


tb1
= Þ Fх
1
= = 3,42
= 11,56;


= R2
- = 0,875 - = 0,785;


ryx1*x2x3
= = 0,647.


При постоянном уровне электровооруженности труда и потерь рабочего времени объем выпуска тесно зависит от численности занятых (теснота зависимости соответствует 0,647).


Определяем частный коэффициент корреляции у с х2
:



2
= ;


tb2
= Þ Fх
2
= = 4,92
= 24,01;


= R2
- = 0,875 - = 0,687;


ryx2*x1x3
= = 0,775.


При постоянном уровне численности занятых и потерь рабочего времени объем выпуска тесно зависит от электровооруженности труда (теснота зависимости соответствует 0,775).


Определяем частный коэффициент корреляции у с х3
:



3
= ;


tb3
= Þ Fх
3
= = 1,92
= 3,61;


= R2
- = 0,875 - = 0,847;


ryx2*x1x3
= = 0,428.


При постоянном уровне численности занятых и электровооруженности труда объем выпуска средне зависит от потерь рабочего времени (теснота зависимости соответствует 0,428).


Для расчета доверительного интервала определяем предельную ошибку для коэффициентов регрессии при факторах:


D = tтабл
*mbxi
,


где mbx
1
= = = 0,529;


mbx
2
= = = 0,653;


mbx
3
= = = -1,105;


- для b1


D = 2,11*0,529 = 1,116.


b1
- D = 1,8 – 1,1 = 0,7;


b1
+D = 1,8 + 1,1 = 2,9.


Итак, интервальное значение для коэффициента регрессии при факторе х1
с вероятностью 0,95 следующее [0,7; 2,9].


- для b2


D = 2,11*0,653 = 1,378.


b2
- D = 3,2 – 1,4 = 1,8;


b2
+D = 3,2 + 1,4 = 4,6.


Итак, интервальное значение для коэффициента регрессии при факторе х2
с вероятностью 0,95 следующее [1,8; 4,6].


- для b3


D = -2,11*1,105 = -2,332.


b2
- D = -2,1 + 2,3 = 0,2;


b2
+D = -2,1 - 2,3 = -4,4.


Итак, интервальное значение для коэффициента регрессии при факторе х3
с вероятностью 0,95 следующее [-4,4; 0,2].


Частные коэффициенты эластичности для линейной регрессии рассчитывают, как правило, при средних значениях факторов и результата:


= bi
*.


= 1,8* = 30,24;


= 3,2* = 3,84;


= -2,1* = -1,51.


Анализ частных коэффициентов эластичности показывает, что по абсолютному приросту наибольшее влияние на значение объема выпуска оказывает фактор X1
– численность занятых, увеличение данного фактора на 1 пункт приводит к увеличению объема выпуска на 30,24 пункта. Увеличение электровооруженности труда на 1 пункт приводит к увеличению объема выпуска на 3,84 пункта. А увеличение потерь рабочего времени на 1 пункт приводит к снижению объема выпуска на 1,51 пункта.


Скорректированный коэффициент множественной детерминации содержит поправку на число степеней свободы и рассчитывается по формуле:


= 1 – (1 – R2
)* = 1 – (1 – 0,875)* = 0,852.


3. Показать, что в следующей системе одновременных уравнений точно идентифицируемым является одно из уравнений:



Какое это уравнение? Имеет ли оно статистическое решение с помощью КМНК?


решение

Выполним идентификацию каждого структурного уравнения и всей системы для ответа на вопрос — имеют ли решения каждое из уравнений и система в целом. Воспользуемся счетным правилом, по которому в каждом уравнении системы необходимо сравнить НY
- число эндогенных переменных в данном уравнении и Dx
- число отсутствующих в уравнении экзогенных переменных из общего для всей системы их перечня. Для удобства анализа представим результаты в таблице.


Таблица 3.1


Результаты идентификации структурных уравнений и всей системы
































Номер уравнения Число эндогенных переменных в уравнении, НY
Число экзогенных переменных из общего их списка, отсутствующих в уравнении, Dx
Сравнение параметров НY
и Dx
+1
Решение об идентификации уравнения
1 2 1 2
= 1+1
Точно идентифицируемо
2 2 1 2 = 1+1 Точно идентифицируемо
3 2 1 2 = 1+1 Точно идентифицируемо
4 3 2 3 = 2+1 Точно идентифицируемо

Проверим необходимое условие идентификации для уравнений модели.


I
уравнение
























Уравнение Отсутствующие переменные
у3
у4
х3
Второе b23
0 0
Третье -1 0 0
Четвертое 0 -1 a33

DetA= 0.


Следовательно, не выполняется достаточное условие идентификации, и первое уравнение не идентифицируемо.


II
уравнение
























Уравнение Отсутствующие переменные
у1
у4
х3
Первое -1 0 0
Третье b31
0 0
Четвертое b41
-1 a33

DetA = 0.


Следовательно, не выполняется достаточное условие идентификации, и второе уравнение не идентифицируемо.


III
уравнение
























Уравнение Отсутствующие переменные
у2
у4
х3
Первое b12
0 0
Второе -1 0 0
Четвертое b42
-1 a33

DetA = 0.


Следовательно, не выполняется достаточное условие идентификации, и третье уравнение не идентифицируемо.


IV
уравнение
























Уравнение Отсутствующие переменные
у3
х1
х2
Первое 0 а11
а12
Второе b23
а21
а22
Третье -1 а31
а32

Det A = = -a11
* + a12
*¹ 0.


Ранг матрицы равен 2, что не менее числа эндогенных переменных системы без единицы.


Следовательно, выполняется достаточное условие идентификации, и четвертое уравнение точно идентифицируемо.


Вся модель является не идентифицируемой. Соответственно идентифицируемое уравнение не может быть решено с помощью КМНК.


4. Динамика ВРП на душу населения по региону характеризуется следующими данными за 1997-2003 гг. (тыс. руб.):


















1997 1998 1999 2000 2001 2002 2003
10,0 12,7 14,3 17,1 29,4 42,2 52,4

1. Определить коэффициент автокорреляции первого порядка и дать его интерпретацию.


2. Построить уравнение тренда в виде экспоненты или показательной кривой. Дать интерпретацию параметров.


3. С помощью критерия Дарбина-Уотсона сделать выводы относительно автокорреляции в остатках в рассматриваемом уравнении.


4. Дать интервальный прогноз ожидаемого уровня ВРП на душу населения на 2005 год.


5.


решение

Для изменения автокорреляции уровней динамического ряда используется коэффициент автокорреляции:


r1
= ,


где = = 28,02 тыс. руб.;


= = 20,95 тыс. руб.


Таблица 4.1


Расчет коэффициента автокорреляции первого порядка для временного ряда



















































































t yt
yt
-1
yt
-
yt-1
-
(yt
- )*(yt-1
- )
(yt
- )2
(yt-1
- )2
1 10,0 - - - - - -
2 12,7 10,0 -15,32 -10,95 167,72 234,60 119,90
3 14,3 12,7 -13,72 -8,25 113,16 188,15 68,06
4 17,1 14,3 -10,92 -6,65 72,60 119,17 44,22
5 29,4 17,1 1,38 -3,85 -5,33 1,91 14,82
6 42,2 29,4 14,18 8,45 119,85 201,17 71,40
7 52,4 42,2 24,38 21,25 518,15 594,55 451,56
Итого 178,1 125,7 0 0 986,15 1339,55 769,98

r1
= = 0,971.


Полученное значение свидетельствует об очень тесной зависимости между ВРП на душу населения по региону текущего и непосредственно предшествующего годов и, следовательно, о наличии во временном ряде ВРП на душу населения по региону сильной линейной тенденции.


Определим параметры уравнения тренда в виде показательной кривой у = а*bt
:


lgy = lga + t*lgb


Y = C + B*t,


где Y = lgy;


C = lga;


B = lgb.


Таблица 4.1


Расчет параметров тренда


















































































у Y t Y*t Y2
t2
1 10,0 1,000 1 1,000 1,000 1
2 12,7 1,104 2 2,208 1,218 4
3 14,3 1,155 3 3,466 1,335 9
4 17,1 1,233 4 4,932 1,520 16
5 29,4 1,468 5 7,342 2,156 25
6 42,2 1,625 6 9,752 2,642 36
7 52,4 1,719 7 12,035 2,956 49
Сумма 178,1 9,305 28 40,735 12,827 140
Среднее 25,44 1,329 4 5,819 1,832 20

В = = = 0,126;


А = - В* = 1,329 – 0,126*4 = 0,825.


Получено линейное уравнение: = 0,825 + 0,126*t.


Произведем потенцирование полученного уравнения и запишем его в обычной форме: = 100,825
*100,126*
t
= 6,683*1,337t
.



Рис. 4.1. Графическое отображение уравнения тренда.


Показатель b = 1,337 представляет собой средний за период цепной коэффициент роста уровней ряда. Параметр а = 0,825 означает начальный уровень ряда в момент времени, равный 0.


Остатки et
рассчитываются по формуле:


et
= yt
- .


Критерий Дарбина-Уотсона рассчитывается по формуле:


d = .


Таблица 4.2


Расчет критерия Дарбина-Уотсона







































































уt
et
et-1
1 10,0 8,94 1,06
2 12,7 11,95 0,75 1,06 0,097 0,568
3 14,3 15,97 -1,67 0,75 5,885 2,796
4 17,1 21,35 -4,25 -1,67 6,670 18,104
5 29,4 28,55 0,85 -4,25 26,045 0,720
6 42,2 38,17 4,03 0,85 10,101 16,214
7 52,4 51,04 1,36 4,03 7,099 1,856
Сумма - - - - 55,896 40,258

d = = 1,39.


Фактическое значение d сравниваем с табличным значением при 5%-ном уровне значимости. При n = 7 лет и m = 1 (число факторов) нижнее значение d’ равно 0,70, а верхнее - 1,36. Так как фактическое значение d равно 1,39.



На основании схемы видно, что d = 1,39 попадает в промежуток от dU
до 4 – dU
. Следовательно, нет оснований отклонять гипотезу Н0
об отсутствии автокорреляции в остатках.


При t = 9, что соответствует 2005 году, прогнозное значение составит:


= 6,683*1,3379
= 91,2 тыс. руб.


Таблица 4.3


Расчет стандартной ошибки прогноза








































































уt
t
1 10,0 8,94 1,124 1 9
2 12,7 11,95 0,563 2 4
3 14,3 15,97 2,789 3 1
4 17,1 21,35 18,063 4 0
5 29,4 28,55 0,722 5 1
6 42,2 38,17 16,241 6 4
7 52,4 51,04 1,850 7 9
Сумма 178,1 176,0 41,351 28 28
Среднее - - - 4 -

S = = = 2,876.


myt
= = = 1,726.


ta
* myt
= 2,571*1,726 = 4,4.


91,2 – 4,4 = 86,8 ££ 91,2 + 4,4 = 95,6.


Интервальный прогноз ожидаемого уровня ВРП на душу населения на 2005 год составит 86,8 ££ 95,6 тыс. руб.


5. Динамика показателя деятельности организаций с участием иностранного капитала в регионе характеризуется следующими данными:


































Год
Среднесписочная численность работников, тыс. чел. (х
t

)
Выпуск товаров, работ и услуг, млрд. руб. (у
t

)
1998
25,8
6
1999
29,5
14
2000
31,4
19
2001
29,1
29
2002
35,5
45
2003
42,0
64
2004
46,1
69

В результате аналитического выравнивания получены следующие уравнения трендов и коэффициенты детерминации (t = 1:7):


a) для выпуска товаров, работ и услуг:


= -9,8571 + 11,25*t, R2
=0,9654,


b) для среднесписочной численности работников:


= 27,4 – 0,8238*t + 0,5048*t2
, R2
=0,9397.


1) Дать интерпретацию параметров уравнений трендов.


2) Определить коэффициент корреляции между временными рядами, используя:


a) непосредственно исходные уровни;


b) отклонения от основной тенденции.


3) Обосновать различие полученных результатов и сделать вывод о тесноте связи между временными рядами.


4) Построить уравнение регрессии по отклонениям от трендов.


решение

Наиболее простую экономическую интерпретацию имеют параметры линейного тренда. Параметры линейного тренда можно интерпретировать так:


а – начальный уровень временного ряда в момент времени t = 0;


b – средний за период абсолютный прирост уровней ряда.


Для исходной задачи начальный уровень ряда для выпуска товаров соответствует значению -9,8571 млрд. руб., средний за период абсолютный прирост уровней ряда составляет 11,25 млрд. руб. Параметр b > 0, значит уровни ряда равномерно возрастают на 11,25 млрд. руб. каждый год.


Для среднесписочной численности работников коэффициент а - начальный уровень ряда соответствует значению 27,4 тыс. чел.; абсолютное ускорение увеличения среднесписочной численности работников соответствует 1,0096.


Рассчитаем коэффициент корреляции между временными рядами, используя непосредственно исходные уровни. Коэффициент корреляции характеризует тесноту линейной связи между изучаемыми признаками. Определяем его по формуле:


rxy
= ,


Таблица 5.1


Расчет параметров коэффициента корреляции








































































у х х*у у2
х2
1 6 25,8 154,8 36 665,64
2 14 29,5 413 196 870,25
3 19 31,4 596,6 361 985,96
4 29 29,1 843,9 841 846,81
5 45 35,5 1597,5 2025 1260,25
6 64 42,0 2688 4096 1764
7 69 46,1 3180,9 4761 2125,21
Сумма 246 239,4 9474,7 12316 8518,12
Среднее 35,14 34,20 1353,53 1759,43 1216,87


= = = 6,87;



= = = 22,90.


rxy
= = 0,965 - связь сильная, прямая.


Рассчитаем коэффициент корреляции между временными рядами, используя отклонения от основной тенденции.


Таблица 5.2


Расчет отклонений от основной тенденции


















































































у х х - у -
1 6 25,8 27,08 1,39 -1,28 4,61
2 14 29,5 27,77 12,64 1,73 1,36
3 19 31,4 29,47 23,89 1,93 -4,89
4 29 29,1 32,18 35,14 -3,08 -6,14
5 45 35,5 35,90 46,39 -0,4 -1,39
6 64 42,0 40,63 57,64 1,37 6,36
7 69 46,1 46,37 68,89 -0,27 0,11
Сумма 246 239,4 239,41 246,00 -1,28 0,02
Среднее 35,14 34,20 - - 0 0,00286

Таблица 5.3


Расчет параметров коэффициента корреляции








































































у х х*у у2
х2
1 4,61 -1,28 -5,90 21,25 1,64
2 1,36 1,73 2,35 1,85 2,99
3 -4,89 1,93 -9,44 23,91 3,72
4 -6,14 -3,08 18,91 37,70 9,49
5 -1,39 -0,4 0,56 1,93 0,16
6 6,36 1,37 8,71 40,45 1,88
7 0,11 -0,27 -0,03 0,01 0,07
Сумма 0,02 -1,28 -0,03 0,00 1,64
Среднее 0,00286 0 15,14 127,11 21,59


= = = 4,65;



= = = 11,27.


rxy
= = 0,289 - связь слабая, прямая.


При измерении корреляции между двумя временными рядами следует учитывать возможное существование ложной корреляции, что связано с наличием во временных рядах тенденции, т.е. зависимости обоих рядов от общего фактора времени. Для того чтобы устранить ложную корреляцию, следует коррелировать не сами уровни временных рядов, а их последовательные (первые или вторые) разности или отклонения от трендов (если последние не содержат тенденции).


Различия полученных результатов объясняется ложной корреляцией из-за наличия во временных рядах тенденции. Таким образом между временными рядами существует прямая слабая взаимосвязь.


Линейная регрессия сводится к нахождению уравнения вида:


= a + b*x.


Классический подход к оцениванию параметров линейной регрессии основан на методе наименьших квадратов.


Для линейных и нелинейных уравнений, приводимых к линейным, решается следующая система относительно a и b.


,


Можно воспользоваться готовыми формулами, которые вытекают из этой системы:


а = ;


b = = = 0,701;


а = 0,00286 – 0,701*0 = 0,00286.


Уравнение регрессии по отклонениям от трендов: = 0,00286 + 0,701*х.

Сохранить в соц. сетях:
Обсуждение:
comments powered by Disqus

Название реферата: Построение корреляции исследуемых зависимостей

Слов:4066
Символов:45457
Размер:88.78 Кб.