По территориям Волго-Вятского, Центрально-Черноземного и Поволжского районов известны данные за ноябрь 1998 г.
Район | Потребительские расходы в расчете на душу населения тыс. руб. у | Средняя заработная плата и выплаты социального характера, тыс. руб., х |
Волго-Вятский район
|
||
Респ. Марий Эл | 302 | 554 |
Респ. Мордовия | 360 | 560 |
Чувашская респ. | 310 | 545 |
Кировская обл. | 415 | 672 |
Нижегородская обл. | 452 | 496 |
Центрально-Черноземный
|
||
Белгородская обл. | 502 | 777 |
Воронежская обл. | 355 | 632 |
Курская обл. | 416 | 688 |
Липецкая обл. | 501 | 833 |
Тамбовская обл. | 403 | 577 |
Поволжский
|
||
Респ. Калмыкия | 208 | 584 |
Респ. Татарстан | 462 | 949 |
Астраханскаяобл. | 368 | 888 |
Волгоградская обл. | 399 | 831 |
Пензенская обл. | 342 | 562 |
Саратовская обл. | 354 | 665 |
Ульяновская обл. | 558 | 705 |
Задание
1. Постройте поле корреляции и сформируйте гипотезу о форме связи.
2. Рассчитайте параметры уравнений линейной, степенной, экспоненциальной, обратной, гиперболической парной регрессии.
3. Оцените тесноту связи с помощью показателей корреляции и детерминации.
4. Рассчитайте коэффициент эластичности.
5. Оцените качество уравнений с помощью средней ошибки аппроксимации.
6. Оцените статистическую надежность результатов регрессионного моделирования с помощью F-критерия Фишера. По значениям характеристик, рассчитанных в пп. 4, 5 и данном пункте, выберите лучшее уравнение регрессии и дайте его обоснование.
7. Рассчитайте ожидаемое значение результата, если прогнозное значение фактора увеличится на 7% от его среднего уровня. Определите доверительный интервал прогноза для уровня значимости a=0,05.
8. Оцените полученные результаты.
Построим поле корреляции:
В данном случае можно сформулировать гипотезу о наличии связи между расходами и заработной платы, носящей скорее всего гиперболический характер.
1.1 Построить линейную модель.
Определим линейный коэффициент парной корреляции по следующей формуле, используя данные таблицы 1 приложения.
Можно сказать, что связь между размером потребительских расходов и средней заработной платы и выплат социального характера.
Уравнение линейной регрессии имеет вид:
Значения параметров линейной модели определим, используя данные таблицы 1.
, .
Уравнение регрессии имеет вид:
Рассчитаем коэффициент детерминации:
Оценку значимости уравнения регрессии проведем с помощью F-критерия Фишера.
F> Fтабл=4,54 для α=0,05; k1
=m=1;k2
=n-m-1=15, то уравнение регрессии с вероятностью 0,95 в целом статистически значимое.
Определим среднюю ошибку:
В среднем расчетные значения ý для линейной модели отличаются от фактических значений на 4,04%.
1.2 Построение степенной модели парной регрессии
Уравнение степенной регрессии имеет вид:
Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения:
Данные приведены в таблице 2 приложения.
Обозначим Y=lgŷ, X=lgx, A=lga.
Тогда уравнение примет вид: Y=A+bX-линейное уравнение регрессии. Рассчитаем его параметры, используя данные таблицы 3.
A=0,001
Уравнение регрессии будет иметь вид: Y=0,001+0,915X
Перейдем к исходным данным уравнения, выполнив потенциирование данного уравнения:
Ŷ=10-0,001
*х0,915
Получим уравнение степенной модели регрессии: Ŷ=0,998*х0,915
Определим индекс корреляции:
Связь между показателем у и фактором х можно считать достаточно сильной. Коэффицент детерминации равен R2
=r2
XY
=0,728
Рассчитаем критерий Фишера.
F> Fтабл=4,54 для α=0,05; k1
=m=1;k2
=n-m-1=15
Средняя относительная ошибка
В среднем расчетные значения ý для степенной модели отличаются от фактических значений на 1,28%.
1.3 Построение экспоненциальной функции
Ŷ=аbx
Для построения этой модели необходимо провести линериаризацию переменных. Для этого осуществим логарифмирование обеих частей уравнения.
Lgŷ=lga+xlgb
Обозначим Y=lgŷ, B=lgb, A=lga
Получим линейное уравнение регрессии:
Y=A+Bx
Рассчитаем его параметры, используя данные таблицы 4 приложения.
, .
Перейдем к исходным данным уравнения, выполнив потенциирование данного уравнения:
Ŷ=100,026
*(100,004
)x
=1,06*1,01x
Определим индекс корреляции:
Связь между показателем у и фактором х можно считать недостаточно сильной. Коэффицент детерминации равен R2
=r2
XY
=0,404
Рассчитаем критерий Фишера.
F<Fтабл=4,54 для α=0,05; k1
=m=1;k2
=n-m-1=15
Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т.к. F> Fтабл.
Средняя относительная ошибка
В среднем расчетные значения ý для экпоненциальной модели отличаются от фактических значений на 5,16%.
1.4 Построение гиперболической функции
Уравнение гиперболической функции:
Ŷ=a+b/x
Проведем линеаризацию модели путем замены Х=1/х. В результате получим линейное уравнение ŷ=a+bX
Рассчитаем его параметры по данным таблицы 5.
, .
Получим следующее уравнение гиперболической модели:
Ŷ=31,001+215709,49/х
Определим индекс детерминации:r2
=0,951
Вариация результата Y на 95,1% объясняется вариацией фактора Х.
Рассчитаем критерий Фишера.
F>Fтабл=4,54 для α=0,05; k1
=m=1;k2
=n-m-1=15
Средняя относительная ошибка: 0,067*44,106=2,955%
В среднем расчетные значения ý для гиперболической модели отличаются от фактических значений на 2,955%.
1.5 Выбор лучшей модели
Для выбора лучшей модели построим сводную таблицу результатов
Коэффициент детерминации | F-критерий Фишера | Индекс корреляции | Средняя относительная ошибка | |
Линейная | 0,346 | 7,9 | 0,588 | 4,04 |
Степенная | 0,728 | 40,2 | 0,924 | 1,28 |
Экспоненциальная | 0,636 | 0,404 | 10,17 | 5,16 |
Гиперболическая | 0,951 | 291,1 | 0,975 | 2,955 |
Наибольшее значение коэффициента детерминации и критерия Фишера имеет гиперболическая модель. Она же имеет практически наименьшую среднюю относительную ошибку, значит, ее можно взять в качестве лучшей для построения прогноза.
1.6 Расчет прогнозного значения результативного показателя.
.
Подставим значение xр
в уравнение гиперболической регрессии:
Ŷ=31,001+215709,49/х
Доверительный интервал прогноза для уровня значимости a
определяется в виде:
где
Рассчитаем необходимые величины:
;
;
; ;
.
В результате доверительный интервал прогноза для уровня значимости 0,05 равен:
505,8-0,275*145,8 .
465,7
8. Полученные результаты, в целом удовлетворительные. Модель гиперболической парной регрессии описывает реальную зависимость рассматриваемыми показателями.