ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО‑ЭКОНОМИЧЕСКИЙ ИНСТИТУТ
Филиал в г. Брянске
КОНТРОЛЬНАЯ РАБОТА
по дисциплине
ЭКОНОМЕТРИКА
ВЫПОЛНИЛ(А) | Симонова Н.С.
|
СТУДЕНТ(КА) | 3 курса («вечер», поток 1)
|
СПЕЦИАЛЬНОСТЬ | Финансы и кредит
|
№ ЗАЧ. КНИЖКИ | 06ффд15027
|
ПРЕПОДАВАТЕЛЬ | Малашенко В.М.
|
Брянск — 2009
ЗАДАЧА 1
По предприятиям легкой промышленности региона получена информация, характеризующая зависимость объема выпускаемой продукции (Y
, млн. руб.) от объема капиталовложений (X
, млн. руб.):
№ предприятия
|
X
|
Y
|
1 | 22 | 26 |
2 | 48 | 52 |
3 | 31 | 43 |
4 | 36 | 38 |
5 | 43 | 54 |
6 | 52 | 53 |
7 | 28 | 35 |
8 | 26 | 37 |
9 | 42 | 47 |
10 | 59 | 58 |
Требуется:
1. Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию углового коэффициента регрессии.
2. Вычислить остатки; найти остаточную сумму квадратов; определить стандартную ошибку регрессии; построить график остатков.
3. Проверить выполнение предпосылок метода наименьших квадратов.
4. Осуществить проверку значимости параметров уравнения регрессии с помощью t
-критерия Стьюдента (уровень значимости a=0,05).
5. Вычислить коэффициент детерминации R
2
; проверить значимость уравнения регрессии с помощью F
-критерия Фишера (уровень значимости a=0,05); найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели.
6. Осуществить прогнозирование значения показателя Y
при уровне значимости a=0,1, если прогнозное значения фактора Х
составит 80 % от его максимального значения.
7. Представить графически: фактические и модельные значения Y
, точки прогноза.
8. Составить уравнения нелинейной регрессии:
-логарифмической;
-степенной;
-показательной.
Привести графики построенных уравнений регрессии.
9. Для указанных моделей найти коэффициенты детерминации и средние относительные ошибки аппроксимации. Сравнить модели по этим характеристикам и сделать вывод.
РЕШЕНИЕ
Для решения задачи используется табличный процессор EXCEL.
1. С помощью надстройки «Анализ данных
» EXCELпроводим регрессионный анализ и определяем параметры уравнения линейной регрессии (меню «Сервис»
® «Анализ данных…
» ® «Регрессия
»):
(Для копирования снимка окна в буфер обмена данных WINDOWS
используется комбинация клавиш Alt+PrintScreen.)
В результате этого уравнение регрессии будет иметь вид:
(прил. 1
).
Угловой коэффициент b
1
=0,785 является по своей сути средним абсолютным приростом
. Его значение показывает, что при увеличении объема капиталовложений X
на 1 млн. руб. объем выпускаемой продукции Y
возрастает в среднем на 0,785 млн. руб.
2. При проведении регрессионного анализа в EXCEL одновременно были определены остатки регрессии (i
=1, 2, …, n
, где n
=10 — число наблюдений значений переменных X
и Y
) (см. «Вывод остатка
» в прил. 1
) и рассчитана остаточная сумма квадратов
(см. «Дисперсионный анализ
» в прил. 1
).
Стандартная ошибка линейной парной регрессии S
рег
определена там же:
млн. руб.
(см. «Регрессионную статистику
» в прил. 1
), где p
=1 — число факторов в регрессионной модели.
График остатков ei
от предсказанных уравнением регрессии значений результата (i
=1, 2, …, n
) строим с помощью диаграммы EXCEL. Предварительно в «Выводе остатка
» прил. 1
выделяются блоки ячеек «Предсказанное Y
» и «Остатки
» вместе с заголовками, а затем выбирается пункт меню «Вставка»
® «Диаграмма…
» ® «Точечная
»:
График остатков приведен в прил. 2
.
3. Проверим выполнение предпосылок обычного метода наименьших квадратов.
1) Случайный характер остатков.
Визуальный анализ графика остатков не выявляет в них какой-либо явной закономерности.
Проверим исходные данные на наличие аномальных наблюдений объема выпускаемой продукции Y
(выбросов
). С этой целю сравним абсолютные величины
стандартизированных остатков
(см. «Вывод остатка
» в прил. 1
) с табличным значением t
-критерия Стьюдента для уровня значимости a=0,05 и числа степеней свободы остатка регрессии , которое составляет t
таб
=2,306.
Видно, что ни один из стандартизированных остатков не превышает по абсолютной величине
табличное значение t
-критерия Стьюдента. Это свидетельствует об отсутствии выбросов.
2) Нулевая средняя величина остатков.
Данная предпосылка всегда выполняется для линейных моделей со свободным коэффициентом b
0
, параметры которых оцениваются обычным методом наименьших квадратов. В нашей модели алгебраическая сумма остатков и, следовательно, их среднее, равны нулю: (см. прил. 1
).
Для вычисления суммы и среднего значений остатков использовались встроенные функции EXCEL «СУММ
» и «СРЗНАЧ
».
3) Одинаковая дисперсия (гомоскедастичность) остатков.
Выполнение данной предпосылки проверим методом Глейзера в предположении линейной зависимости среднего квадратического отклонения возмущений от предсказанных уравнением регрессии значений результата (i
=1, 2, …, n
). Для этого рассчитывается коэффициент корреляции между абсолютными величинами остатков и (i
=1, 2, …, n
) с помощью выражения, составленного из встроенных функций:
=КОРРЕЛ(ABS(«Остатки
»);«Предсказанное
Y
»)
Коэффициент корреляции оказался равным (см. прил. 1
).
Критическое значение коэффициента корреляции для уровня значимости a=0,05 и числа степеней свободы составляетr
кр
=0,632.
Так как коэффициент корреляции не превышает по абсолютной величине
критическое значение, то статистическая гипотеза об одинаковой дисперсии остатков не отклоняется на уровне значимости a=0,05.
4) Отсутствие автокорреляции в остатках.
Выполнение данной предпосылки проверяем методом Дарбина–Уотсона. Предварительно ряд остатков упорядочивается в зависимости от последовательно возрастающих значений результата Y
, предсказанных уравнением регрессии. Для этой цели в «Выводе остатка
» прил. 1
выделяется любая ячейка в столбце «Предсказанное
Y
», и на панели инструментов нажимается кнопка «» («Сортировка по возрастанию
»). По упорядоченному ряду остатков рассчитываем d
‑статистику Дарбина–Уотсона
(см. прил. 1
).
Для расчетаd
‑статистики использовалось выражение, составленное из встроенных функций EXCEL:
=СУММКВРАЗН(«Остатки
2, …, n
»;«Остатки
1, …, n
–1»)/СУММКВ(«Остатки
1, …,n
»)
Критические значения d
‑статистики для числа наблюдений n
=10, числа факторов p
=1 и уровня значимости a=0,05 составляют: d
1
=0,88; d
2
=1,32.
Так как выполняется условие
,
статистическая гипотеза об отсутствии автокорреляции в остатках не отклоняется на уровне значимости a=0,05.
Проверим отсутствие автокорреляции в остатках также и по коэффициенту автокорреляции остатков первого порядка
(см. прил. 1
).
(ряд остатков упорядочен в той же самой последовательности).
Для расчета коэффициента автокорреляции использовалось выражение, составленное из встроенных функций:
=СУММПРОИЗВ(«Остатки
2, …, n
»;«Остатки
1, …, n
–1»)/СУММКВ(«Остатки
1, …,n
»)
Критическое значение коэффициента автокорреляции для числа наблюдений n
=10 и уровня значимости a=0,05 составляет r
(1)кр
=0,632. Так как коэффициент автокорреляции остатков первого порядка не превышает по абсолютной величине
критическое значение, то это еще раз указывает на отсутствие автокорреляции в остатках.
5)
Нормальный закон распределения остатков.
Выполнение этой предпосылки проверяем с помощью R
/S
-критерия, определяемого по формуле
,
где e
max
=6,32; e
min
=(–5,19) — наибольший и наименьший остатки соответственно (определялись с помощью встроенных функций «МАКС
» и «МИН
»); — стандартное отклонение ряда остатков (определено с помощью встроенной функции «СТАНДОТКЛОН
») (см. прил. 1
).
Критические границы R
/
S
-критерия для числа наблюдений n
=10 и уровня значимости a=0,05 имеют значения: (R
/S
)1
=2,67 и (R
/S
)2
=3,69.
Так как расчетное значение R
/S
-критерия попадает в интервал между критическими границами, то статистическая гипотеза о нормальном законе распределения остатков не отклоняется на уровне значимости a=0,05.
Проведенная проверка показала, что выполняются все пять предпосылок обычного метода наименьших квадратов. Это свидетельствует об адекватности регрессионной модели исследуемому экономическому явлению.
4. Проверим статистическую значимость коэффициентовb
0
и b
1
уравнения регрессии. Табличное значение t
-критерия Стьюдента для уровня значимости a=0,05 и числа степеней свободы остатка линейной парной регрессии составляет t
таб
=2,306.
t
-статистики коэффициентов
,
были определены при проведении регрессионного анализа в EXCEL и имеют следующие значения: tb
0
»3,202; tb
1
»7,288 (см. прил. 1
). Анализ этих значений показывает, что по абсолютной величине
все они превышают табличное значение t
-критерия Стьюдента. Это свидетельствует о статистической значимости обоих коэффициентов. На то же самое обстоятельство указывают и вероятности случайного формирования коэффициентов b
0
и b
1
, которые ниже допустимого уровня значимости a=0,05 (см. «P‑Значение»
).
Статистическая значимость углового коэффициента b
1
дает основание говорить о существенном (значимом) влиянии изменения объема капиталовложений X
на изменение объема выпускаемой продукции Y
.
5. Коэффициент детерминацииR
2
линейной модели также был определен при проведении регрессионного анализа в EXCEL:
(см. «Регрессионную статистику
» в прил. 1
).
ЗначениеR
2
показывает, что линейная модель объясняет 86,9 % вариации объема выпускаемой продукции Y
.
F
-статистика линейной модели имеет значение
(см. «Дисперсионный анализ
» в прил. 1
).
Табличное значениеF
-критерия Фишера для уровня значимости a=0,05 и чисел степеней свободы числителя (регрессии) и знаменателя (остатка) составляетF
таб
=5,32. Так как F
-статистика превышает табличное значениеF
-критерия Фишера, то это свидетельствует о статистической значимости уравнения регрессии в целом. На этот же факт указывает и то, что вероятность случайного формирования уравнения регрессии в том виде, в каком оно получено, составляет 8,49×10-5
(см. «Значимость F
» в «Дисперсионном анализе
» прил. 1
), что ниже допустимого уровня значимости a=0,05.
Среднюю относительную ошибку аппроксимации определяем по приближенной формуле
,
где млн. руб. — средний объем выпускаемой продукции, определенный с помощью встроенной функции «СРЗНАЧ
» (см. «Исходные данные
» в прил. 1
).
Значение Е
отн
показывает, что предсказанные уравнением регрессии значения объема выпускаемой продукции Y
отличаются от фактических значений в среднем на 7,1 %. Линейная модель имеет хорошую точность.
По результатам проверок, проведенных в пунктах 3 — 5, можно сделать вывод о достаточно хорошем качестве линейной модели и возможности ее использования для целей анализа и прогнозирования объема выпускаемой продукции.
6. Спрогнозируем объем выпускаемой продукции Y
, если прогнозное значение объема капиталовложений X
составит 80 % от своего максимального значения в исходных данных:
- максимальное значение X
—x
max
=59 млн. руб. (см. «Исходные данные
» в прил. 1
);
- прогнозное значение X
— млн. руб.
Среднее прогнозируемое значение объема выпускаемой продукции (точечный прогноз
) равно
млн. руб.
Стандартная ошибка прогноза фактического значенияобъема выпускаемой продукцииy
0
рассчитывается по формуле
млн. руб.,
где млн. руб. — средний объем капиталовложений; млн. руб. — стандартное отклонение объема капиталовложений (определены с помощью встроенных функций «СРЗНАЧ
» и «СТАНДОТКЛОН
») (см. «Исходные данные
» в прил. 1
).
Интервальный прогноз
фактического значения объема выпускаемой продукцииy
0
с надежностью (доверительной вероятностью) g=0,9 (уровень значимости a=0,1) имеет вид:
млн. руб.,
гдеt
таб
=1,860 — табличное значение t
-критерия Стьюдента при уровне значимости a=0,1 и числе степеней свободы .
Таким образом, объем выпускаемой продукции Y
с вероятностью 90 % будет находиться в интервале от 43,2 до 58,8 млн. руб.
7. График, на котором изображены фактические и предсказанные уравнением регрессии значения Y
строим с помощью диаграммы EXCEL (меню «Вставка»
® «Диаграмма…
» ® «Точечная
»). Далее строим линию линейного тренда (меню «Диаграмма»
® «Добавить линию тренда…
» ® «Линейная
»), и устанавливаем вывод на диаграмме уравнения регрессии и коэффициента детерминации R
:
Точки точечного и интервального прогнозов наносим на график вручную (прил. 3
).
8. Логарифмическую, степенную и показательную модели также строим с помощью диаграммы EXCEL (меню «Вставка»
® «Диаграмма…
» ® «Точечная
»). Далее последовательно строим соответствующие линии тренда (меню «Диаграмма»
® «Добавить линию тренда…
»), и устанавливаем вывод на диаграмме уравнения регрессии и коэффициента детерминации R
2
:
Графики линий регрессии, уравнения регрессии и значения R
2
приведены в прил. 4
. Рассмотрим последовательно каждую модель.
1) Логарифмическая модель
:
.
Значение параметра b
1
=29,9 показывает, что при увеличении объема капиталовложений X
на 1 % объем выпускаемой продукцииY
возрастает в среднем на млн. руб.
Коэффициент детерминации R
2
»0,898 показывает, что логарифмическая модель объясняет 89,8 % вариации объема выпускаемой продукции Y
.
F
-статистика Фишера логарифмической модели определяется через коэффициент детерминации R
2
по формуле
.
Табличное значениеF
-критерия Фишера одинаково как для линейной, так и для всех нелинейных моделей, которые здесь строятся (F
таб
=5,32). Так как F
-статистика превышает табличное значениеF
-критерия, то это свидетельствует о статистической значимости уравнения логарифмической регрессии.
Стандартная ошибка логарифмической регрессии также рассчитывается через коэффициент детерминации R
2
по формуле
млн. руб.,
где млн. руб. — стандартное отклонение объема выпускаемой продукции, определенное с помощью встроенной функции «СТАНДОТКЛОН
» (см. «Исходные данные
» в прил. 1
).
Среднюю относительную ошибку аппроксимации определяем по приближенной формуле
.
Предсказанные уравнением логарифмической регрессии значения объема выпускаемой продукции Y
отличаются от фактических значений в среднем на 6,2 %. Логарифмическая модель имеет хорошую точность.
2) Степенная модель:
.
Показатель степени b
1
=0,721 является средним коэффициентом эластичности
. Его значение показывает, что при увеличении объема капиталовложений X
на 1 % объем выпускаемой продукцииY
возрастает в среднем на 0,721 %.
Коэффициент детерминации R
2
»0,873 показывает, что степенная модель объясняет 87,3 % вариации объема выпускаемой продукции Y
.
F
-статистика степенной модели
также превышает табличное значениеF
-критерия Фишера (F
таб
=5,32), что указывает на статистическую значимость уравнения степенной регрессии.
Стандартная ошибка степенной регрессии равна
млн. руб.
Средняя относительная ошибка аппроксимации имеет значение
.
Предсказанные уравнением степенной регрессии значения объема выпускаемой продукции Y
отличаются от фактических значений в среднем на 7,0 %. Степенная модель имеет хорошую точность.
3) Показательная (экспоненциальная) модель:
,
где е=2,718… — основание натуральных логарифмов; — функция экспоненты (в EXCEL встроенная функция «EXP
»).
Параметр b
1
=1,019 является средним коэффициентом роста
. Его значение показывает, что при увеличении объема капиталовложений X
на 1 млн. руб. объем выпускаемой продукцииY
возрастает в среднем в 1,019 раза, то есть на 1,9 %.
Коэффициент детерминации R
2
»0,821 показывает, что показательная модель объясняет 82,1 % вариации объема выпускаемой продукции Y
.
F
-статистика показательной модели
превышает табличное значениеF
-критерия Фишера (F
таб
=5,32), что свидетельствует о статистической значимости уравнения показательной регрессии.
Стандартная ошибка показательной регрессии:
млн. руб.
Средняя относительная ошибка аппроксимации:
.
Предсказанные уравнением показательной регрессии значения объема выпускаемой продукции Y
отличаются от фактических значений в среднем на 8,3 %. Показательная модель имеет хорошую точность.
Сравнивая между собой коэффициенты детерминации R
2
четырех построенных моделей (линейной, логарифмической, степенной и показательной), можно придти к выводу, что лучшей моделью является логарифмическая модель, так как она имеет самое большое значение R
2
.
ПРИЛОЖЕНИЕ: компьютерные распечатки на 4 листах.
ЗАДАЧА 2
Задача 2а и 2б
Для каждого варианта даны по две структурные формы модели, которые заданы в виде матриц коэффициентов модели. Необходимо записать системы одновременных уравнений и проверить обе системы на идентифицируемость.
Номер варианта | Номер уравнения | Задача 2а | Задача 2б | ||||||||||||
переменные | переменные | ||||||||||||||
у
1 |
у
2 |
у
3 |
х
1 |
х
2 |
х
3 |
x
4 |
у
1 |
у
2 |
у
3 |
х
1 |
х
2 |
х
3 |
x
4 |
||
11 | 1 | –1 | b
12 |
b
13 |
a
11 |
a
12 |
0 | 0 | –1 | b
12 |
b
13 |
a
11 |
a
12 |
0 | 0 |
2 | b
21 |
–1 | 0 | a
21 |
a
22 |
a
23 |
0 | b
21 |
–1 | 0 | 0 | a
22 |
a
23 |
0 | |
3 | b
31 |
b
32 |
–1 | 0 | 0 | a
3 3 |
a
3 4 |
b
31 |
b
32 |
–1 | a
31 |
a
32 |
0 | a
3 4 |
РЕШЕНИЕ
Задача 2а
Используя матрицу коэффициентов модели в исходных данных, записываем систему одновременных уравнений регрессии в структурной форме:
Проверим каждое уравнение системы на выполнение необходимого и достаточного условия идентификации.
В первом уравнении
три эндогенные переменные: y
1
,y
2
иy
3
(H
=3). В нем отсутствуют экзогенные переменные x
3
и x
4
(D
=2). Необходимое условие идентификации выполнено. Для проверки на достаточное условие составим матрицу из коэффициентов при переменных x
3
и x
4
, отсутствующих в данном уравнении, но имеющихся в системе:
Уравнения, из которых взяты коэффициенты при переменных | Переменные | |
x
3 |
x
4 |
|
2 | a
23 |
0 |
3 | a
33 |
a
34 |
Определитель данной матрицы не равен нулю:
,
а ее ранг равен 2. В заданной системе уравнений три эндогенные переменные —y
1
, y
2
и y
3
. Так как ранг матрицы не меньше, чем количество эндогенных переменных в системе без одного, то достаточное условие идентификации для данного уравнения выполнено. Первое уравнение считается идентифицируемым.
Во втором уравнении
две эндогенные переменные: y
1
и y
2
(H
=2). В нем отсутствует одна экзогенная переменная x
4
(D
=1). Необходимое условие идентификации выполнено. Составим матрицу из коэффициентов при переменных y
3
и x
4
, которые отсутствуют во втором уравнении:
Уравнения, из которых взяты коэффициенты при переменных | Переменные | |
y
3 |
x
4 |
|
1 | b
13 |
0 |
3 | –1 | a
34 |
Определитель данной матрицы не равен нулю:
,
а ее ранг равен 2. Значит, достаточное условие идентификации выполнено, и второе уравнение считается идентифицируемым.
В третьем уравнении
три эндогенные переменные: y
1
, y
2
и y
3
(H
=3). В нем отсутствует экзогенные переменные x
1
и x
2
(D
=2). Необходимое условие идентификации выполнено. Составим матрицу из коэффициентов при переменных х
1
и x
2
, которые отсутствуют в третьем уравнении:
Уравнения, из которых взяты коэффициенты при переменных | Переменные | |
x
1 |
x
2 |
|
1 | a
11 |
a
12 |
2 | a
21 |
a
22 |
Определитель данной матрицы равен
,
а ее ранг — 2. Если , то это означает, что достаточное условие идентификации выполнено, и третье уравнение можно считать идентифицируемым.
Таким образом, все три уравнения заданной системы идентифицируемы, а значит, идентифицируема и вся система в целом.
Задача 2б
Используя матрицукоэффициентов модели в исходных данных, записываем систему одновременных уравнений регрессии в структурной форме:
Проверим каждое уравнение системы на выполнение необходимого и достаточного условия идентификации.
В первом уравнении
три эндогенные переменные: y
1
,y
2
иy
3
(H
=3). В нем отсутствуют экзогенные переменные x
3
и x
4
(D
=2). Необходимое условие идентификации выполнено. Для проверки на достаточное условие составим матрицу из коэффициентов при переменных x
3
и x
4
, отсутствующих в данном уравнении, но имеющихся в системе:
Уравнения, из которых взяты коэффициенты при переменных | Переменные | |
x
3 |
x
4 |
|
2 | a
23 |
0 |
3 | 0 | a
34 |
Определитель матрицы не равен нулю:
,
а ее ранг матрицы равен 2. В заданной системе уравнений три эндогенные переменные —y
1
, y
2
и y
3
. Так как ранг матрицы не меньше, чем количество эндогенных переменных в системе без одного, то достаточное условие идентификации для данного уравнения выполнено. Первое уравнение считается идентифицируемым.
Во втором уравнении
две эндогенные переменные: y
1
и y
2
(H
=2). В нем отсутствует экзогенные переменные x
1
и x
4
(D
=2). Так как , то это означает, что данное уравнение сверхидентифицируемо.
В третьем уравнении
три эндогенные переменные: y
1
, y
2
и y
3
(H
=3). В нем отсутствует одна экзогенная переменная x
3
(D
=1). Так как , то это означает, что данное уравнение неидентифицируемо.
Таким образом, первое уравнение заданной системы идентифицируемо, второе — сверхидентифицируемо, а третье — неидентифицируемо. Если хотя бы одно уравнение системы неидентифицируемо, то вся система считается неидентифицируемой. Данная система является неидентифицируемой и не имеет статистического решения.
Задача 2в
По данным таблицы для своего варианта, используя косвенный метод наименьших квадратов, построить структурную форму модели вида:
Вариант | n
|
у
1 |
у
2 |
х
1 |
х
2 |
11 | 1 | 33,0 | 37,1 | 3 | 11 |
2 | 45,9 | 49,3 | 7 | 16 | |
3 | 42,2 | 41,6 | 7 | 9 | |
4 | 51,4 | 45,9 | 10 | 9 | |
5 | 49,0 | 37,4 | 10 | 1 | |
6 | 49,3 | 52,3 | 8 | 16 |
РЕШЕНИЕ
С помощью табличного процессора EXCELстроим два приведенных уравнения системы одновременных уравнений регрессии (меню «Сервис»
® «Анализ данных…
» ® «Регрессия
»):
Данные уравнения образуют приведенную форму системы одновременных уравнений регрессии:
Коэффициенты приведенной формы имеют следующие значения:d
10
»19,90; d
11
»2,821; d
12
»0,394; d
20
»19,14; d
21
»1,679 и d
22
»1,181 (см. прил.
).
Таким образом, приведенная форма системы уравнений имеет вид:
Определим коэффициенты структурной формы системы уравнений
Структурные коэффициенты определяются по формулам:
;
;
;
;
;
.
Окончательно структурная форма системы одновременных уравнений регрессии примет вид:
ПРИЛОЖЕНИЕ: компьютерная распечатка на 1 листе.