ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ
ИНСТИТУТ
ЛАБОРАТОРНАЯ РАБОТА ПО ЭКОНОМЕТРИКЕ
Вариант1
Смоленск, 2007
Имеются следующие данные:
№ | prise | DEN | polyamid | lykra | firm |
Y
|
X1
|
X2
|
X3
|
X4
|
|
1 | 49,36 | 20 | 86 | 14 | 0 |
2 | 22,51 | 20 | 97 | 3 | 1 |
3 | 22,62 | 20 | 97 | 3 | 1 |
4 | 59,89 | 20 | 90 | 17 | 0 |
5 | 71,94 | 30 | 79 | 21 | 0 |
6 | 71,94 | 30 | 79 | 21 | 0 |
7 | 89,9 | 30 | 85 | 15 | 1 |
8 | 74,31 | 40 | 85 | 13 | 1 |
9 | 77,69 | 40 | 88 | 10 | 1 |
10 | 60,26 | 40 | 86 | 14 | 1 |
11 | 111,19 | 40 | 82 | 18 | 0 |
12 | 73,56 | 40 | 83 | 14 | 1 |
13 | 84,61 | 40 | 84 | 16 | 0 |
14 | 49,9 | 40 | 82 | 18 | 1 |
15 | 89,9 | 40 | 85 | 15 | 0 |
16 | 96,87 | 50 | 85 | 15 | 0 |
17 | 39,99 | 60 | 98 | 2 | 1 |
18 | 49,99 | 60 | 76 | 24 | 0 |
19 | 49,99 | 70 | 83 | 17 | 1 |
20 | 49,99 | 70 | 88 | 10 | 1 |
21 | 49,99 | 70 | 76 | 24 | 0 |
22 | 49,99 | 80 | 42 | 8 | 1 |
23 | 129,9 | 80 | 50 | 42 | 0 |
24 | 84 | 40 | 82 | 18 | 0 |
25 | 61 | 20 | 86 | 14 | 0 |
26 | 164,9 | 30 | 16 | 30 | 1 |
27 | 49,9 | 40 | 82 | 18 | 1 |
28 | 89,9 | 30 | 85 | 15 | 1 |
29 | 129,9 | 80 | 50 | 42 | 0 |
30 | 89,9 | 40 | 86 | 14 | 1 |
31 | 105,5 | 40 | 85 | 15 | 1 |
32 | 79,9 | 15 | 88 | 12 | 1 |
33 | 99,9 | 20 | 88 | 12 | 1 |
34 | 99,9 | 30 | 73 | 25 | 1 |
35 | 119,9 | 20 | 85 | 12 | 1 |
36 | 109,9 | 20 | 83 | 14 | 1 |
37 | 59,9 | 20 | 86 | 14 | 0 |
38 | 79,9 | 40 | 82 | 18 | 0 |
39 | 82,9 | 20 | 86 | 14 | 0 |
40 | 111,8 | 40 | 82 | 18 | 0 |
41 | 83,6 | 40 | 82 | 18 | 0 |
42 | 60 | 20 | 86 | 14 | 0 |
43 | 80 | 40 | 82 | 18 | 0 |
44 | 90 | 50 | 76 | 24 | 0 |
45 | 120 | 70 | 74 | 26 | 0 |
Задача состоит в построении линейной модели зависимости цены колготок от их плотности, состава и фирмы-производителя в торговых точках города Москвы и Московской области весной 2006 года.
Цена колготок – это зависимая переменная Y. В качестве независимых, объясняющих переменных были выбраны: плотность (DEN) X1, содержание полиамида X2 и лайкры X3, фирма-производитель X4.
Описание переменных содержится в Таблице 1.1:
Таблица 1.1.
Переменная | Описание |
№ | номер торговой точки |
price | цена колготок в рублях |
DEN | плотность в DEN |
polyamid | содержание полиамида в % |
lykra | содержание лайкры в % |
firm | фирма-производитель: 0 - Sanpellegrino, 1 - Грация |
Задание:
1. Рассчитайте матрицу парных коэффициентов корреляции; оцените статистическую значимость коэффициентов корреляции. Поясните выбор факторов для включения в модель.
2. Постройте уравнение регрессии. Оцените статистическую значимость параметров регрессионной модели с помощью t-критерия; нулевую гипотезу о значимости уравнения проверьте с помощью F-критерия; оцените качество уравнения регрессии с помощью коэффициента детерминации .
3. Постройте уравнение множественной регрессии только со статистически значимыми факторами. Рассчитайте доверительный интервал для каждого наблюдения (уровень значимости примите равным 5%). Результаты п.3 отобразить графически (исходные данные,
Решение.
1.Для проведения корреляционного анализа необходимо выполнить следующие действия:
Данные для корреляционного анализа должны располагаться в смежных диапазонах ячеек.
Выбрать команду Сервис – Анализ данных.
В диалоговом окне анализ данных вы
В диалогом окне Корреляция в поле Входной интервал необходимо ввести диапазон ячеек, содержащих исходные данные(значения Х и У).Если выделены и заголовки столбцов, то установить флажок Метки в первой строке.
Выбрать параметры вывода. ОК.
Матрица парных коэффициентов корреляции.
Анализ матрицы коэффициентов парной корреляции показывает, что фактор Х3(содержание лайкры) оказывает наибольшее влияние на У(цена колготок), т.к.
КПК │rx2x3=-0.67│ < 0.8
значит, мультиколлинеарность отсутствует.
Посмотрим как влияют коэффициенты Х2 и Х3 на У.
│ ryx2= -0.56 │ < │ryx3=0.6│,
следовательно фактор Х3 оказывает большее влияние на У, но в ММР включаем и Х2 и Х3, т.к. Явление МК отсутствует.
2.Для проведения регрессионного анализа выполним:
Команду Сервис – Анализ данных. В диалоговом окне выберем инструмент Регрессия, а затем ОК. В поле Входной интервал У введем адрес значений У из заданной таблицы. В поле Входной интервал Х – адрес значений Х.
Данные регрессионного анализа:
Запишем модель регрессии в линейной форме:
У=104,16 – 0,48Х1 – 0,59Х2 + 2,25Х3 + 7,55Х4
Оценим значимость факторов с помощью Т –критерия Стьюдента, для этого, определим его табличное значение при уровне значимости 0,05.
к =
n-m-1=45-4-1=40 t-кр.таб=2.0211
Сравним расчетные значения с табличным по модулю:
│t X1= -2.334│ > t –табл. = 2,021,
следовательно фактор Х1(плотность) является статистически значимым, и статистически значимым признается влияние плотности колготок на их цену.
│t X2= -1,763│< t –табл. = 2,021,
следовательно фактор Х2 – содержание полиамида – является статистически незначимым.
│t X3= 3,269 │> t –табл. = 2,021,
следовательно фактор Х3 – содержание лайкры – является статистически значимым, и статистически значимым признается влияние содержания лайкры в колготках на их цену.
│t X4= 0,966 │< t –табл. = 2,021,
следовательно фактор Х4 – фирма-производитель – является статистически незначимым.
Оценка статистической значимости уравнения регрессии в целом осуществляется по F – критерию Фишера: Fтабл.= 2,61
Так как Fрасч. > Fтабл.(9,59 > 2.61), то уравнение регрессии можно признать статистически значимым (адекватным).
Оценка общего качества уравнения регрессии происходит с использованием коэффициента детерминации.
Так как R=0.489, то 48,9% вариации результативного показателя – цены колготок – объясняется вариацией факторных признаков, включенных в модель регрессии – плотность, содержание лайкры и полиамида, фирмы – производителя.
3.Постройте уравнение множественной регрессии только со статистически значимыми факторами. Рассчитайте доверительный интервал для каждого наблюдения, (уровень значимости примите равным 5%). Укажите торговые точки, в которых цены завышены.
№ | prise | DEN | lykra |
Y
|
X1
|
X3
|
|
1 | 49,36 | 20 | 14 |
2 | 22,51 | 20 | 3 |
3 | 22,62 | 20 | 3 |
4 | 59,89 | 20 | 17 |
5 | 71,94 | 30 | 21 |
6 | 71,94 | 30 | 21 |
7 | 89,9 | 30 | 15 |
8 | 74,31 | 40 | 13 |
9 | 77,69 | 40 | 10 |
10 | 60,26 | 40 | 14 |
11 | 111,19 | 40 | 18 |
12 | 73,56 | 40 | 14 |
13 | 84,61 | 40 | 16 |
14 | 49,9 | 40 | 18 |
15 | 89,9 | 40 | 15 |
16 | 96,87 | 50 | 15 |
17 | 39,99 | 60 | 2 |
18 | 49,99 | 60 | 24 |
19 | 49,99 | 70 | 17 |
20 | 49,99 | 70 | 10 |
21 | 49,99 | 70 | 24 |
22 | 49,99 | 80 | 8 |
23 | 129,9 | 80 | 42 |
24 | 84 | 40 | 18 |
25 | 61 | 20 | 14 |
26 | 164,9 | 30 | 30 |
27 | 49,9 | 40 | 18 |
28 | 89,9 | 30 | 15 |
29 | 129,9 | 80 | 42 |
30 | 89,9 | 40 | 14 |
31 | 105,5 | 40 | 15 |
32 | 79,9 | 15 | 12 |
33 | 99,9 | 20 | 12 |
34 | 99,9 | 30 | 25 |
35 | 119,9 | 20 | 12 |
36 | 109,9 | 20 | 14 |
37 | 59,9 | 20 | 14 |
38 | 79,9 | 40 | 18 |
39 | 82,9 | 20 | 14 |
40 | 111,8 | 40 | 18 |
41 | 83,6 | 40 | 18 |
42 | 60 | 20 | 14 |
43 | 80 | 40 | 18 |
44 | 90 | 50 | 24 |
45 | 120 | 70 | 26 |
Эта операция проводится с помощью инструмента анализа данных Регрессия. В диалоговом окне при заполнении параметра входной интервал Х следует указать все столбцы.
Уравнение регрессии в линейной форме:
У = 49,89 – 0,37Х1 + 2,65Х3.
Уравнение статистически значимо. Каждый факторный признак характеризует влияние на общую стоимость колготок.
Для нахождения доверительного интервала воспользуемся формулой:
У = а ± ∆а
У = в ± ∆в
а=49,89; в1= -0,37;в3= 2,65
∆в=mв*tтаб.
Коэффициент Стьюдента для k =42 и уровня значимости 0,05 равен 2,0211.
∆а=9,45
∆в=0,208*2,0211=0,420
∆в3=0,489*2,0211=0,988
Цены завышены во всех точках, кроме точек под номерами 1,2,3,14,17.
4. Представим графически исходные данные:
Представим графически предсказанные значения: