Построение корреляции исследуемых зависимостей

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ

ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ЭКОНОМИКИ И ФИНАНСОВ»

КАФЕДРА СТАТИСТИКИ И ЭКОНОМЕТРИКИ

КОНТРОЛЬНОЕ ЗАДАНИЕ

по дисциплине "ЭКОНОМЕТРИКА"

ВАРИАНТ № 5

Санкт-Петербург

2009

1. По 10 банкам изучается зависимость прибыли (у – млн. руб.) от вложений в уставные капиталы предприятий (х – млн. руб.):

№	Прибыль, млн. руб.	Вложения в уставные капиталы предприятий, млн. руб.
1	55,3	20
2	50,2	25
3	60,9	35
4	62,8	42
5	63,9	47
6	64,5	50
7	65,5	55
8	66,8	63
9	67,9	70
10	69,3	80

1. Построить поле корреляции рассматриваемой зависимости.

2. Определить уравнение регрессии полулогарифметической модели: = а + b*lnх.

3. Найти индекс корреляции и сравнить его с линейным коэффициентом корреляции. Пояснить причины различий.

4. Найти среднюю ошибку аппроксимации.

5. Рассчитать стандартную ошибку регрессии.

6. С вероятностью 0,95 оценить статистическую значимость уравнения и коэффициента регрессии. Сделать выводы.

7. С вероятностью 0,95 оценить доверительный интервал ожидаемого размера прибыли, если вложения в уставные капиталы предприятий составят 45 млн. руб.

решение

При изучении зависимости между двумя признаками графический метод подбора вида уравнения регрессии достаточно нагляден. Он основан на поле корреляции.

Рисунок 1.1. Поле корреляции, характеризующее зависимость прибыли от вложений в ставные капиталы предприятий.

Для определения параметров полулогарифмической функции используется система нормальных уравнений следующего вида:

Таблица 1.1

Определение параметров регрессии

№	у	у2	х	lnx		(lnx)2	у*lnx
1	55,3	3058,09	20	2,996	0,655	8,974	165,664
2	50,2	2520,04	25	3,219	0,344	10,361	161,588
3	60,9	3708,81	35	3,555	0,062	12,640	216,521
4	62,8	3943,84	42	3,738	0,005	13,970	234,726
5	63,9	4083,21	47	3,850	0,002	14,824	246,024
6	64,5	4160,25	50	3,912	0,011	15,304	252,325
7	65,5	4290,25	55	4,007	0,041	16,059	262,480
8	66,8	4462,24	63	4,143	0,114	17,166	276,761
9	67,9	4610,41	70	4,248	0,197	18,050	288,473
10	69,3	4802,49	80	4,382	0,333	19,202	303,674
Сумма	627,1	39639,63	487	38,051	1,764	146,550	2408,237
Среднее	62,710	3963,96	48,700	3,805	-	14,655	240,824
s	5,605	-	-	0,421	-	-	-

а = = 0,02;

b = = 16,428.

Итак, получили следующее уравнении регрессии: = 0,02 + 16,428*lnх.

Подставляя в уравнении регрессии фактические значения х, получаем теоретические значения результата . По ним рассчитываем показатель тесноты связи – индекс корреляции.

rху
=

Таблица 1.2

Расчет коэффициента корреляции

№	у
1	55,3	49,23	36,80	54,91
2	50,2	52,90	7,29	156,50
3	60,9	58,43	6,11	3,28
4	62,8	61,42	1,90	0,01
5	63,9	63,27	0,40	1,42
6	64,5	64,29	0,05	3,20
7	65,5	65,85	0,12	7,78
8	66,8	68,08	1,65	16,73
9	67,9	69,81	3,66	26,94
10	69,3	72,01	7,33	43,43
Сумма	627,1	625,30	65,31	314,19
Среднее	62,710	-	-	-

rху
= = 0,89 – связь сильная.

Рассчитаем линейный коэффициент корреляции:

rxy
= b* = 16,428* = 0,91 – данное значение близко к единице и означает наличие очень тесной зависимости прибыли от вложений в уставные капиталы предприятий.

Мы получили различие между индексом корреляции и линейным коэффициентом корреляции из-за различий в принимаемой базе при расчетах, т.е. в одном случае используется потенцированное значение, а в другом непотенциированное.

Средняя ошибка аппроксимации – среднее отклонение расчетных значений от фактических:

= *100%.

Таблица 1.3

Расчет средней ошибки аппроксимации

№	у
1	55,3	49,23	0,110
2	50,2	52,90	-0,054
3	60,9	58,43	0,041
4	62,8	61,42	0,022
5	63,9	63,27	0,010
6	64,5	64,29	0,003
7	65,5	65,85	-0,005
8	66,8	68,08	-0,019
9	67,9	69,81	-0,028
10	69,3	72,01	-0,039
Сумма	627,1	625,30	0,040

= *0,040*100 = 0,4% - в среднем расчетные значения отклоняются от фактических на 0,4%.

Стандартная ошибка регрессии, как и ошибка аппроксимации, служит для оценки качества уравнения регрессии. Ошибка определяется по формуле:

S = = = 2,857.

f-тест – оценивание качества уравнения регрессии – состоит в проверке гипотезы Н0
о статической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнения фактического Fфакт
и критического Fтабл
значений f-критерия Фишера.

Fфакт
определяется из соотношения:

Fфакт
= = = 30,48,

где n – число единиц совокупности;

m – число параметров при переменных х.

Поскольку Fфакт
> Fтабл.
= 5,32, то Н0
– гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность.

Для параметров парной регрессии средняя ошибка оценки вычисляется:

mb
= = = 2,151;

tb
= = = 7,637.

Табличное значение критерия Стьюдента при уровне значимости 0,05 и количестве степеней свободы 10 – 2 = 8 составляет 2,306.

Вывод: полученное значение критерия tb
по модулю больше табличного, следовательно, можно отклонить гипотезу о несущественности коэффициента регрессии b.

Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если вложения в уставные капиталы предприятий составят 45 млн. руб., то вложения в уставные капиталы предприятий будут:

= 0,02 + 16,428*ln45 = 62,556 млн. руб.

Ошибка прогноза вычисляется по формуле:

m= sост
* = 2,857* = 2,857*1,049 = 2,997.

Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит:

D = tтабл
* m = 2,306*2,997 = 6,911.

Доверительный интервал прогноза:

g = ±D = 62,556 ± 6,911;

gmin = - D = 62,556 – 6,911 = 55,645;

gmах = + D = 62,556 + 6,911 = 69,467.

Итак, ожидаемый размер прибыли, если вложения в уставные капиталы предприятий составят 45 млн. руб., не выйдет с вероятностью 0,95 за пределы интервала [55,645; 69,467] млн. руб.

2. По 20 предприятиям региона, выпускающим однородную продукцию построена модель объема выпуска (у – тыс. ед.) от численности занятых (х1
- человек), элекровооруженности труда (х2
– кВт*час на 1 работника) и потерь рабочего времени (х3
- %). Результаты оказались следующими:

= а + 1,8*х1
+ 3,2*х2
– 2,1*х3
R2
= 0,875

(2,1) (3,4) (4,9) (1,9)

В скобках указаны фактические значения t-критерия для параметров уравнения регрессии.

Кроме того, известна следующая информация:

Среднее значение	Коэффициент вариации, %
у	25	40
х1	420	20
х2	30	35
х3	18	10

1. Дать интерпретацию коэффициентов регрессии и оценить их значимость. Сделать выводы.

2. Оценить параметр а.

3. Оценить значимость уравнения регрессии с помощью F-критерия Фишера с вероятностью 0,95. Сделать выводы.

4. Построить уравнение множественной регрессии в стандартизованном масштабе и сделать выводы.

5. Найти частные коэффициенты корреляции и сделать выводы.

6. Дать интервальную оценку для коэффициентов регрессии.

7. Определить частные средние коэффициенты эластичности и сделать выводы.

8. Оценить скорректированный коэффициент множественной детерминации.

решение

Интерпретация уравнения регрессии: параметр b1
свидетельствует о том, что с увеличением численности занятых на 1 чел., объем выпуска увеличивается на 1,8 тыс. ед. при постоянном уровне электровооруженности труда и потерь рабочего времени.

Увеличение электровооруженности труда на 1 кВт.час на 1 работника объем выпуска увеличивается на 3,2 тыс. ед. при постоянном уровне численности занятых и потерь рабочего времени.

Увеличение же потерь рабочего времени на 1% объем выпуска снижается на 2,1 тыс. ед. при постоянном уровне численности занятых и элекровооруженности труда.

Оценку статистической значимости коэффициентов регрессии проведем с помощью t-статистики Стьюдента и путем расчета доверительного интервала каждого из показателей.

Выдвигаем гипотезу Н0
о статистически незначимом отличии коэффициентов регрессии от нуля.

tтабл
для числа степеней свободы df = n – 2 = 20 – 2 = 18 и a = 0,05 составит 2,101.

Фактические значения t-статистики:

tb
1
= 3,4 > tтабл
= 2,101;

tb
2
= 4,9 > tтабл
= 2,101;

tb
3
= -1,9 < tтабл
= 2,101.

Гипотеза Н0
отклоняется, т.е. b1
и b2
не случайно отличаются от 0, а статистически значимы. Гипотеза Н0
не отклоняется в случае коэффициента b3
, данный коэффициент следует признать статистически незначимым.

Выдвигаем гипотезу Н0
о статистически незначимом отличии показателя а от нуля.

tтабл
для числа степеней свободы df = n – 2 = 20 – 2 = 18 и a = 0,05 составит 2,101.

Фактические значения t-статистики: tа
= 2,1 > tтабл
= 2,10.

Гипотеза Н0
отклоняется, т.е. параметр а не случайно отличаются от 0, а статистически значим.

Fфакт
определяется из соотношения:

Fфакт
= = = 37,33,

где n – число единиц совокупности;

m – число параметров при переменных х.

Поскольку Fфакт
> Fтабл.
= 3,24, то Н0
– гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность.

Для построения уравнения в стандартизованном масштабе рассчитаемbi
, используя формулы для перехода от bi
к bi
:

bi
= bi
*.

Таблица 2.1

Расчет среднеквадратического отклонения

Среднее значение	Коэффициент вариации, %	s
(1)	(2)	(3)	(4) = (2)*(3)
у	25	40	10
х1	420	20	84
х2	30	35	10,5
х3	18	10	1,8

b1
= 1,8* = 15,12;

b2
= 3,2* = 3,36;

b3
= -2,1* = -0,38;

Получим уравнение: ty
= 15,12*tx
1
+ 3,36*tx
2
– 0,38*tх3
.

Анализ β-коэффициентов показывает, что на объем выпуска из трех исследуемых факторов сильнее оказывает фактор X1
– численность занятых, так как ему соответствует наибольшее значение β-коэффициента.

Частные коэффициенты корреляции можно определить по формуле на основе коэффициентов детерминации:

ryx1*x2x3
= ;

ryx2*x1x3
= ;

ryx3*x1x2
= .

Определяем частный коэффициент корреляции у с х1
:

Fх
1
= ;

tb1
= Þ Fх
1
= = 3,42
= 11,56;

= R2
- = 0,875 - = 0,785;

ryx1*x2x3
= = 0,647.

При постоянном уровне электровооруженности труда и потерь рабочего времени объем выпуска тесно зависит от численности занятых (теснота зависимости соответствует 0,647).

Определяем частный коэффициент корреляции у с х2
:

Fх
2
= ;

tb2
= Þ Fх
2
= = 4,92
= 24,01;

= R2
- = 0,875 - = 0,687;

ryx2*x1x3
= = 0,775.

При постоянном уровне численности занятых и потерь рабочего времени объем выпуска тесно зависит от электровооруженности труда (теснота зависимости соответствует 0,775).

Определяем частный коэффициент корреляции у с х3
:

Fх
3
= ;

tb3
= Þ Fх
3
= = 1,92
= 3,61;

= R2
- = 0,875 - = 0,847;

ryx2*x1x3
= = 0,428.

При постоянном уровне численности занятых и электровооруженности труда объем выпуска средне зависит от потерь рабочего времени (теснота зависимости соответствует 0,428).

Для расчета доверительного интервала определяем предельную ошибку для коэффициентов регрессии при факторах:

D = tтабл
*mbxi
,

где mbx
1
= = = 0,529;

mbx
2
= = = 0,653;

mbx
3
= = = -1,105;

- для b1

D = 2,11*0,529 = 1,116.

b1
- D = 1,8 – 1,1 = 0,7;

b1
+D = 1,8 + 1,1 = 2,9.

Итак, интервальное значение для коэффициента регрессии при факторе х1
с вероятностью 0,95 следующее [0,7; 2,9].

- для b2

D = 2,11*0,653 = 1,378.

b2
- D = 3,2 – 1,4 = 1,8;

b2
+D = 3,2 + 1,4 = 4,6.

Итак, интервальное значение для коэффициента регрессии при факторе х2
с вероятностью 0,95 следующее [1,8; 4,6].

- для b3

D = -2,11*1,105 = -2,332.

b2
- D = -2,1 + 2,3 = 0,2;

b2
+D = -2,1 - 2,3 = -4,4.

Итак, интервальное значение для коэффициента регрессии при факторе х3
с вероятностью 0,95 следующее [-4,4; 0,2].

Частные коэффициенты эластичности для линейной регрессии рассчитывают, как правило, при средних значениях факторов и результата:

= bi
*.

= 1,8* = 30,24;

= 3,2* = 3,84;

= -2,1* = -1,51.

Анализ частных коэффициентов эластичности показывает, что по абсолютному приросту наибольшее влияние на значение объема выпуска оказывает фактор X1
– численность занятых, увеличение данного фактора на 1 пункт приводит к увеличению объема выпуска на 30,24 пункта. Увеличение электровооруженности труда на 1 пункт приводит к увеличению объема выпуска на 3,84 пункта. А увеличение потерь рабочего времени на 1 пункт приводит к снижению объема выпуска на 1,51 пункта.

Скорректированный коэффициент множественной детерминации содержит поправку на число степеней свободы и рассчитывается по формуле:

= 1 – (1 – R2
)* = 1 – (1 – 0,875)* = 0,852.

3. Показать, что в следующей системе одновременных уравнений точно идентифицируемым является одно из уравнений:

Какое это уравнение? Имеет ли оно статистическое решение с помощью КМНК?

решение

Выполним идентификацию каждого структурного уравнения и всей системы для ответа на вопрос — имеют ли решения каждое из уравнений и система в целом. Воспользуемся счетным правилом, по которому в каждом уравнении системы необходимо сравнить НY
- число эндогенных переменных в данном уравнении и Dx
- число отсутствующих в уравнении экзогенных переменных из общего для всей системы их перечня. Для удобства анализа представим результаты в таблице.

Таблица 3.1

Результаты идентификации структурных уравнений и всей системы

Номер уравнения	Число эндогенных переменных в уравнении, НY	Число экзогенных переменных из общего их списка, отсутствующих в уравнении, Dx	Сравнение параметров НY и Dx +1	Решение об идентификации уравнения
1	2	1	2 = 1+1	Точно идентифицируемо
2	2	1	2 = 1+1	Точно идентифицируемо
3	2	1	2 = 1+1	Точно идентифицируемо
4	3	2	3 = 2+1	Точно идентифицируемо

Проверим необходимое условие идентификации для уравнений модели.

I
уравнение

Уравнение	Отсутствующие переменные
Уравнение	у3	у4	х3
Второе	b23	0	0
Третье	-1	0	0
Четвертое	0	-1	a33

DetA= 0.

Следовательно, не выполняется достаточное условие идентификации, и первое уравнение не идентифицируемо.

II
уравнение

Уравнение	Отсутствующие переменные
Уравнение	у1	у4	х3
Первое	-1	0	0
Третье	b31	0	0
Четвертое	b41	-1	a33

DetA = 0.

Следовательно, не выполняется достаточное условие идентификации, и второе уравнение не идентифицируемо.

III
уравнение

Уравнение	Отсутствующие переменные
Уравнение	у2	у4	х3
Первое	b12	0	0
Второе	-1	0	0
Четвертое	b42	-1	a33

DetA = 0.

Следовательно, не выполняется достаточное условие идентификации, и третье уравнение не идентифицируемо.

IV
уравнение

Уравнение	Отсутствующие переменные
Уравнение	у3	х1	х2
Первое	0	а11	а12
Второе	b23	а21	а22
Третье	-1	а31	а32

Det A = = -a11
* + a12
*¹ 0.

Ранг матрицы равен 2, что не менее числа эндогенных переменных системы без единицы.

Следовательно, выполняется достаточное условие идентификации, и четвертое уравнение точно идентифицируемо.

Вся модель является не идентифицируемой. Соответственно идентифицируемое уравнение не может быть решено с помощью КМНК.

4. Динамика ВРП на душу населения по региону характеризуется следующими данными за 1997-2003 гг. (тыс. руб.):

1997	1998	1999	2000	2001	2002	2003
10,0	12,7	14,3	17,1	29,4	42,2	52,4

1. Определить коэффициент автокорреляции первого порядка и дать его интерпретацию.

2. Построить уравнение тренда в виде экспоненты или показательной кривой. Дать интерпретацию параметров.

3. С помощью критерия Дарбина-Уотсона сделать выводы относительно автокорреляции в остатках в рассматриваемом уравнении.

4. Дать интервальный прогноз ожидаемого уровня ВРП на душу населения на 2005 год.

решение

Для изменения автокорреляции уровней динамического ряда используется коэффициент автокорреляции:

r1
= ,

где = = 28,02 тыс. руб.;

= = 20,95 тыс. руб.

Таблица 4.1

Расчет коэффициента автокорреляции первого порядка для временного ряда

t	yt	yt -1	yt -	yt-1 -	(yt - )*(yt-1 - )	(yt - )2	(yt-1 - )2
1	10,0	-	-	-	-	-	-
2	12,7	10,0	-15,32	-10,95	167,72	234,60	119,90
3	14,3	12,7	-13,72	-8,25	113,16	188,15	68,06
4	17,1	14,3	-10,92	-6,65	72,60	119,17	44,22
5	29,4	17,1	1,38	-3,85	-5,33	1,91	14,82
6	42,2	29,4	14,18	8,45	119,85	201,17	71,40
7	52,4	42,2	24,38	21,25	518,15	594,55	451,56
Итого	178,1	125,7	0	0	986,15	1339,55	769,98

r1
= = 0,971.

Полученное значение свидетельствует об очень тесной зависимости между ВРП на душу населения по региону текущего и непосредственно предшествующего годов и, следовательно, о наличии во временном ряде ВРП на душу населения по региону сильной линейной тенденции.

Определим параметры уравнения тренда в виде показательной кривой у = а*bt
:

lgy = lga + t*lgb

Y = C + B*t,

где Y = lgy;

C = lga;

B = lgb.

Таблица 4.1

Расчет параметров тренда

№	у	Y	t	Y*t	Y2	t2
1	10,0	1,000	1	1,000	1,000	1
2	12,7	1,104	2	2,208	1,218	4
3	14,3	1,155	3	3,466	1,335	9
4	17,1	1,233	4	4,932	1,520	16
5	29,4	1,468	5	7,342	2,156	25
6	42,2	1,625	6	9,752	2,642	36
7	52,4	1,719	7	12,035	2,956	49
Сумма	178,1	9,305	28	40,735	12,827	140
Среднее	25,44	1,329	4	5,819	1,832	20

В = = = 0,126;

А = - В* = 1,329 – 0,126*4 = 0,825.

Получено линейное уравнение: = 0,825 + 0,126*t.

Произведем потенцирование полученного уравнения и запишем его в обычной форме: = 100,825
*100,126*
t
= 6,683*1,337t
.

Рис. 4.1. Графическое отображение уравнения тренда.

Показатель b = 1,337 представляет собой средний за период цепной коэффициент роста уровней ряда. Параметр а = 0,825 означает начальный уровень ряда в момент времени, равный 0.

Остатки et
рассчитываются по формуле:

et
= yt
- .

Критерий Дарбина-Уотсона рассчитывается по формуле:

d = .

Таблица 4.2

Расчет критерия Дарбина-Уотсона

№	уt		et	et-1
1	10,0	8,94	1,06
2	12,7	11,95	0,75	1,06	0,097	0,568
3	14,3	15,97	-1,67	0,75	5,885	2,796
4	17,1	21,35	-4,25	-1,67	6,670	18,104
5	29,4	28,55	0,85	-4,25	26,045	0,720
6	42,2	38,17	4,03	0,85	10,101	16,214
7	52,4	51,04	1,36	4,03	7,099	1,856
Сумма	-	-	-	-	55,896	40,258

d = = 1,39.

Фактическое значение d сравниваем с табличным значением при 5%-ном уровне значимости. При n = 7 лет и m = 1 (число факторов) нижнее значение d’ равно 0,70, а верхнее - 1,36. Так как фактическое значение d равно 1,39.

На основании схемы видно, что d = 1,39 попадает в промежуток от dU
до 4 – dU
. Следовательно, нет оснований отклонять гипотезу Н0
об отсутствии автокорреляции в остатках.

При t = 9, что соответствует 2005 году, прогнозное значение составит:

= 6,683*1,3379
= 91,2 тыс. руб.

Таблица 4.3

Расчет стандартной ошибки прогноза

№	уt			t
1	10,0	8,94	1,124	1	9
2	12,7	11,95	0,563	2	4
3	14,3	15,97	2,789	3	1
4	17,1	21,35	18,063	4	0
5	29,4	28,55	0,722	5	1
6	42,2	38,17	16,241	6	4
7	52,4	51,04	1,850	7	9
Сумма	178,1	176,0	41,351	28	28
Среднее	-	-	-	4	-

S = = = 2,876.

myt
= = = 1,726.

ta
* myt
= 2,571*1,726 = 4,4.

91,2 – 4,4 = 86,8 ££ 91,2 + 4,4 = 95,6.

Интервальный прогноз ожидаемого уровня ВРП на душу населения на 2005 год составит 86,8 ££ 95,6 тыс. руб.

5. Динамика показателя деятельности организаций с участием иностранного капитала в регионе характеризуется следующими данными:

Год	Среднесписочная численность работников, тыс. чел. (х t )	Выпуск товаров, работ и услуг, млрд. руб. (у t )
1998	25,8	6
1999	29,5	14
2000	31,4	19
2001	29,1	29
2002	35,5	45
2003	42,0	64
2004	46,1	69

В результате аналитического выравнивания получены следующие уравнения трендов и коэффициенты детерминации (t = 1:7):

a) для выпуска товаров, работ и услуг:

= -9,8571 + 11,25*t, R2
=0,9654,

b) для среднесписочной численности работников:

= 27,4 – 0,8238*t + 0,5048*t2
, R2
=0,9397.

1) Дать интерпретацию параметров уравнений трендов.

2) Определить коэффициент корреляции между временными рядами, используя:

a) непосредственно исходные уровни;

b) отклонения от основной тенденции.

3) Обосновать различие полученных результатов и сделать вывод о тесноте связи между временными рядами.

4) Построить уравнение регрессии по отклонениям от трендов.

решение

Наиболее простую экономическую интерпретацию имеют параметры линейного тренда. Параметры линейного тренда можно интерпретировать так:

а – начальный уровень временного ряда в момент времени t = 0;

b – средний за период абсолютный прирост уровней ряда.

Для исходной задачи начальный уровень ряда для выпуска товаров соответствует значению -9,8571 млрд. руб., средний за период абсолютный прирост уровней ряда составляет 11,25 млрд. руб. Параметр b > 0, значит уровни ряда равномерно возрастают на 11,25 млрд. руб. каждый год.

Для среднесписочной численности работников коэффициент а - начальный уровень ряда соответствует значению 27,4 тыс. чел.; абсолютное ускорение увеличения среднесписочной численности работников соответствует 1,0096.

Рассчитаем коэффициент корреляции между временными рядами, используя непосредственно исходные уровни. Коэффициент корреляции характеризует тесноту линейной связи между изучаемыми признаками. Определяем его по формуле:

rxy
= ,

Таблица 5.1

Расчет параметров коэффициента корреляции

№	у	х	х*у	у2	х2
1	6	25,8	154,8	36	665,64
2	14	29,5	413	196	870,25
3	19	31,4	596,6	361	985,96
4	29	29,1	843,9	841	846,81
5	45	35,5	1597,5	2025	1260,25
6	64	42,0	2688	4096	1764
7	69	46,1	3180,9	4761	2125,21
Сумма	246	239,4	9474,7	12316	8518,12
Среднее	35,14	34,20	1353,53	1759,43	1216,87

sх
= = = 6,87;

sу
= = = 22,90.

rxy
= = 0,965 - связь сильная, прямая.

Рассчитаем коэффициент корреляции между временными рядами, используя отклонения от основной тенденции.

Таблица 5.2

Расчет отклонений от основной тенденции

№	у	х			х -	у -
1	6	25,8	27,08	1,39	-1,28	4,61
2	14	29,5	27,77	12,64	1,73	1,36
3	19	31,4	29,47	23,89	1,93	-4,89
4	29	29,1	32,18	35,14	-3,08	-6,14
5	45	35,5	35,90	46,39	-0,4	-1,39
6	64	42,0	40,63	57,64	1,37	6,36
7	69	46,1	46,37	68,89	-0,27	0,11
Сумма	246	239,4	239,41	246,00	-1,28	0,02
Среднее	35,14	34,20	-	-	0	0,00286

Таблица 5.3

Расчет параметров коэффициента корреляции

№	у	х	х*у	у2	х2
1	4,61	-1,28	-5,90	21,25	1,64
2	1,36	1,73	2,35	1,85	2,99
3	-4,89	1,93	-9,44	23,91	3,72
4	-6,14	-3,08	18,91	37,70	9,49
5	-1,39	-0,4	0,56	1,93	0,16
6	6,36	1,37	8,71	40,45	1,88
7	0,11	-0,27	-0,03	0,01	0,07
Сумма	0,02	-1,28	-0,03	0,00	1,64
Среднее	0,00286	0	15,14	127,11	21,59

sх
= = = 4,65;

sу
= = = 11,27.

rxy
= = 0,289 - связь слабая, прямая.

При измерении корреляции между двумя временными рядами следует учитывать возможное существование ложной корреляции, что связано с наличием во временных рядах тенденции, т.е. зависимости обоих рядов от общего фактора времени. Для того чтобы устранить ложную корреляцию, следует коррелировать не сами уровни временных рядов, а их последовательные (первые или вторые) разности или отклонения от трендов (если последние не содержат тенденции).

Различия полученных результатов объясняется ложной корреляцией из-за наличия во временных рядах тенденции. Таким образом между временными рядами существует прямая слабая взаимосвязь.

Линейная регрессия сводится к нахождению уравнения вида:

= a + b*x.

Классический подход к оцениванию параметров линейной регрессии основан на методе наименьших квадратов.

Для линейных и нелинейных уравнений, приводимых к линейным, решается следующая система относительно a и b.

Можно воспользоваться готовыми формулами, которые вытекают из этой системы:

а = ;

b = = = 0,701;

а = 0,00286 – 0,701*0 = 0,00286.

Уравнение регрессии по отклонениям от трендов: = 0,00286 + 0,701*х.

Слов:	4066
Символов:	45457
Размер:	88.78 Кб.

Название реферата: Построение корреляции исследуемых зависимостей