Смысл регрессионного анализа – построение функциональных зависимостей между двумя группами переменных величин Х1
, Х2
, … Хр
и Y. При этом речь идет о влиянии переменных Х (это будут аргументы функций) на значения переменной Y (значение функции). Переменные Х мы будем называть факторами, а Y – откликом.
Наиболее простой случай – установление зависимости одного отклика y от одного фактора х. Такой случай называется парной (простой) регрессией.
Парная регрессия
– уравнение связи двух переменных у
иx
:
,
где у
– зависимая переменная (результативный признак);
х –
независимая, объясняющая переменная (признак-фактор).
Различают линейные
и нелинейные
регрессии.
Линейная регрессия:.
Нелинейные регрессии
делятся на два класса: регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам, и регрессии, нелинейные по оцениваемым параметрам.
Регрессии, нелинейные по объясняющим переменным:
• полиномы разных степеней
•равносторонняя гипербола
Регрессии, нелинейные по оцениваемым параметрам:
• степенная
;
• показательная
• экспоненциальная
Построение уравнения регрессии сводится к оценке ее параметров. Для оценки параметров регрессий, линейных по параметрам, используют метод наименьших квадратов (МНК).
МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака у
от теоретических минимальна, т.е.
Для линейных и нелинейных уравнений, приводимых к линейным, решается следующая система относительно а
и b
:
Можно воспользоваться готовыми формулами, которые вытекают из этой системы:
Тесноту связи изучаемых явлений оценивает линейный коэффициент парной корреляции
для линейной регрессии
и индекс корреляции - для нелинейной регрессии ():
Оценку качества построенной модели даст коэффициент (индекс) детерминации, а также средняя ошибка аппроксимации.
Средняя ошибка аппроксимации
– среднее отклонение расчетных значений от фактических:
Допустимый предел значений – не более 8 – 10%.
Средний коэффициент эластичности
показывает, на сколько процентов в среднем по совокупности изменится результат у
от своей средней величины при изменении фактора x
на 1% от своего среднего значения:
Задача дисперсионного анализа
состоит в анализе дисперсии зависимой переменной:
где – общая сумма квадратов отклонений;
– сумма квадратов отклонений, обусловленная регрессией («объясненная» или «факторная»);
–остаточная сумма квадратов отклонений.
Долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака у
характеризует коэффициент (индекс) детерминации
R
2
:
Коэффициент детерминации – квадрат коэффициента или индекса корреляции.
F
-тест –
оценивание качества уравнения регрессии – состоит в проверке гипотезы Но
о статистической незначимости уравнения регрессии
и показателя тесноты связи.
Для этого выполняется сравнение фактического Fфакт
и критического (табличного) Fтабл
значений F
-критерия Фишера.
F
факт
определяется из соотношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы:
п –
число единиц совокупности;
т
– число параметров при переменных х.
Fтабл
– это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости а.
Уровень значимости а – вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно а
принимается равной 0,05 или 0,01.
Если Fтабл
< Fфакт
, то H0
– гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если F
табл
>
Fфакт
, то гипотеза Н0
не отклоняется и признается статистическая незначимость, ненадежность уравнения регрессии.
Для оценки статистической значимости коэффициентов регрессии и корреляции
рассчитываются t
-критерий Стьюдента
и доверительные интервалы
каждого из показателей. Выдвигается гипотеза Н0
о случайной природе показателей, т.е. о незначимом их отличии от нуля. Оценка значимости коэффициентов регрессии и корреляции с помощью f-критерия Стьюдента проводится путем сопоставления их значений с величиной случайной ошибки:
Случайные ошибки
параметров линейной регрессии и коэффициента корреляции определяются по формулам:
Сравнивая фактическое и критическое (табличное) значения t-статистики – tтабл
и tфакт
– принимаем или отвергаем гипотезу Hо
.
Связь между F-критерием Фишера и t-статистикой Стьюдента выражается равенством
Если tтабл
< tфакт
, то Hо отклоняется, т.е. а,
b
и не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х.
Если tтабл
> tфакт
, то гипотеза Но
не отклоняется и признается случайная природа формирования a
,
b
или .
Для расчета доверительного интервала определяем предельную ошибку
∆ для каждого показателя:
Формулы для расчета доверительных интервалов
имеют следующий вид:
Если в границы доверительного интервала попадает ноль, т.е. нижняя граница отрицательна, а верхняя положительна, то оцениваемый параметр принимается нулевым, так как он не может одновременно принимать и положительное, и отрицательное значения.
Прогнозное значение
определяется путем подстановки в уравнение регрессии соответствующего (прогнозного) значения .
Вычисляется средняя стандартная ошибка прогноза
:
где
и строится доверительный интервал прогноза:
где
Задача:
По 22 регионам страны изучается зависимость розничной продажи телевизоров, y от среднедушевых денежных доходов в месяц, x (табл. 1):
№ региона | X | Y |
1,000 | 2,800 | 28,000 |
2,000 | 2,400 | 21,300 |
3,000 | 2,100 | 21,000 |
4,000 | 2,600 | 23,300 |
5,000 | 1,700 | 15,800 |
6,000 | 2,500 | 21,900 |
7,000 | 2,400 | 20,000 |
8,000 | 2,600 | 22,000 |
9,000 | 2,800 | 23,900 |
10,000 | 2,600 | 26,000 |
11,000 | 2,600 | 24,600 |
12,000 | 2,500 | 21,000 |
13,000 | 2,900 | 27,000 |
14,000 | 2,600 | 21,000 |
15,000 | 2,200 | 24,000 |
16,000 | 2,600 | 34,000 |
17,000 | 3,300 | 31,900 |
19,000 | 3,900 | 33,000 |
20,000 | 4,600 | 35,400 |
21,000 | 3,700 | 34,000 |
22,000 | 3,400 | 31,000 |
Задание
1. Постройте поле корреляции и сформулируйте гипотезу о форме связи.
2. Рассчитайте параметры уравнений линейной, степенной, экспоненциальной, полулогарифмической, обратной, гиперболической парной регрессий.
3. Оцените тесноту связи с помощью показателей корреляции и детерминации.
4. С помощью среднего (общего) коэффициента эластичности дайте сравнительную оценку силы связи фактора с результатом.
5. Качество уравнений оцените с помощью средней ошибки аппроксимации.
6. С помощью F-критерия Фишера определите статистическую надежность результатов регрессионного моделирования. Выберите лучшее уравнение регрессии и дайте его обоснование.
7. Рассчитайте прогнозное значение результата по линейному уравнению регрессии, если прогнозное значение фактора увеличится на 7% от его среднего уровня. Определите доверительный интервал прогноза для уровня значимости α=0,05.
8. Оцените полученные результаты, выводы оформите в аналитической записке.
1.
Поле корреляции для:
· Линейной регрессии y=a+b*x:
·
Гипотеза о форме связи:
чем больше размер среднедушевого денежного дохода в месяц (факторный признак), тем больше при прочих равных условиях розничная продажа телевизоров (результативный признак). В данной модели параметр b называется коэффициентом регрессии и показывает, насколько в среднем отклоняется величина результативного признака у при отклонении величины факторного признаках на одну единицу.
· Степенной регрессии :
Гипотеза о форме связи
: степенная функция имеет вид Y=axb
.
Параметр b степенного уравнения называется показателем эластичности и указывает, на сколько процентов изменится у при возрастании х на 1%. При х = 1 a = Y.
· Экспоненциальная регрессия :
· Равносторонняя гипербола :
Гипотеза о форме связи:
В ряде случаев обратная связь между факторным и результативным признаками может быть выражена уравнением гиперболы: Y=a+b/x.
· Обратная гипербола :
· Полулогарифмическая регрессия :
2. Рассчитайте параметры уравнений линейной, степенной, экспоненциальной, полулогарифмической, обратной, гиперболической парной регрессий.
· Рассчитаем параметры уравнений линейной парной регрессии. Для расчета параметров a и b линейной регрессии y=a+b*x решаем систему нормальных уравнений относительно a и b:
По исходным данным рассчитываем ∑y, ∑x, ∑yx, ∑x2
, ∑y2
(табл. 2):
№ региона | X | Y | XY | X^2 | Y^2 | Y^cp | Y-Y^cp | Ai |
1 | 2,800 | 28,000 | 78,400 | 7,840 | 784,000 | 25,719 | 2,281 | 0,081 |
2 | 2,400 | 21,300 | 51,120 | 5,760 | 453,690 | 22,870 | -1,570 | 0,074 |
3 | 2,100 | 21,000 | 44,100 | 4,410 | 441,000 | 20,734 | 0,266 | 0,013 |
4 | 2,600 | 23,300 | 60,580 | 6,760 | 542,890 | 24,295 | -0,995 | 0,043 |
5 | 1,700 | 15,800 | 26,860 | 2,890 | 249,640 | 17,885 | -2,085 | 0,132 |
6 | 2,500 | 21,900 | 54,750 | 6,250 | 479,610 | 23,582 | -1,682 | 0,077 |
7 | 2,400 | 20,000 | 48,000 | 5,760 | 400,000 | 22,870 | -2,870 | 0,144 |
8 | 2,600 | 22,000 | 57,200 | 6,760 | 484,000 | 24,295 | -2,295 | 0,104 |
9 | 2,800 | 23,900 | 66,920 | 7,840 | 571,210 | 25,719 | -1,819 | 0,076 |
10 | 2,600 | 26,000 | 67,600 | 6,760 | 676,000 | 24,295 | 1,705 | 0,066 |
11 | 2,600 | 24,600 | 63,960 | 6,760 | 605,160 | 24,295 | 0,305 | 0,012 |
12 | 2,500 | 21,000 | 52,500 | 6,250 | 441,000 | 23,582 | -2,582 | 0,123 |
13 | 2,900 | 27,000 | 78,300 | 8,410 | 729,000 | 26,431 | 0,569 | 0,021 |
14 | 2,600 | 21,000 | 54,600 | 6,760 | 441,000 | 24,295 | -3,295 | 0,157 |
15 | 2,200 | 24,000 | 52,800 | 4,840 | 576,000 | 21,446 | 2,554 | 0,106 |
16 | 2,600 | 34,000 | 88,400 | 6,760 | 1156,000 | 24,295 | 9,705 | 0,285 |
17 | 3,300 | 31,900 | 105,270 | 10,890 | 1017,610 | 29,280 | 2,620 | 0,082 |
19 | 3,900 | 33,000 | 128,700 | 15,210 | 1089,000 | 33,553 | -0,553 | 0,017 |
20 | 4,600 | 35,400 | 162,840 | 21,160 | 1253,160 | 38,539 | -3,139 | 0,089 |
21 | 3,700 | 34,000 | 125,800 | 13,690 | 1156,000 | 32,129 | 1,871 | 0,055 |
22 | 3,400 | 31,000 | 105,400 | 11,560 | 961,000 | 29,992 | 1,008 | 0,033 |
Итого | 58,800 | 540,100 | 1574,100 | 173,320 | 14506,970 | 540,100 | 0,000 | |
сред значение | 2,800 | 25,719 | 74,957 | 8,253 | 690,808 | 0,085 | ||
станд. откл | 0,643 | 5,417 |
Система нормальных уравнений составит:
Ур-ие регрессии: = 5,777+7,122∙x. Данное уравнение показывает, что с увеличением среднедушевого денежного дохода в месяц на 1 тыс. руб. доля розничных продаж телевизоров повышается в среднем на 7,12%.
· Рассчитаем параметры уравнений степенной парной регрессии. Построению степенной модели предшествует процедура линеаризации переменных. В примере линеаризация производится путем логарифмирования обеих частей уравнения:
где
Для расчетов используем данные табл. 3:
№ рег | X | Y | XY | X^2 | Y^2 | Yp^cp | y^cp |
1 | 1,030 | 3,332 | 3,431 | 1,060 | 11,104 | 3,245 | 25,67072 |
2 | 0,875 | 3,059 | 2,678 | 0,766 | 9,356 | 3,116 | 22,56102 |
3 | 0,742 | 3,045 | 2,259 | 0,550 | 9,269 | 3,004 | 20,17348 |
4 | 0,956 | 3,148 | 3,008 | 0,913 | 9,913 | 3,183 | 24,12559 |
5 | 0,531 | 2,760 | 1,465 | 0,282 | 7,618 | 2,827 | 16,90081 |
6 | 0,916 | 3,086 | 2,828 | 0,840 | 9,526 | 3,150 | 23,34585 |
7 | 0,875 | 2,996 | 2,623 | 0,766 | 8,974 | 3,116 | 22,56102 |
8 | 0,956 | 3,091 | 2,954 | 0,913 | 9,555 | 3,183 | 24,12559 |
9 | 1,030 | 3,174 | 3,268 | 1,060 | 10,074 | 3,245 | 25,67072 |
10 | 0,956 | 3,258 | 3,113 | 0,913 | 10,615 | 3,183 | 24,12559 |
11 | 0,956 | 3,203 | 3,060 | 0,913 | 10,258 | 3,183 | 24,12559 |
12 | 0,916 | 3,045 | 2,790 | 0,840 | 9,269 | 3,150 | 23,34585 |
13 | 1,065 | 3,296 | 3,509 | 1,134 | 10,863 | 3,275 | 26,4365 |
14 | 0,956 | 3,045 | 2,909 | 0,913 | 9,269 | 3,183 | 24,12559 |
15 | 0,788 | 3,178 | 2,506 | 0,622 | 10,100 | 3,043 | 20,97512 |
16 | 0,956 | 3,526 | 3,369 | 0,913 | 12,435 | 3,183 | 24,12559 |
17 | 1,194 | 3,463 | 4,134 | 1,425 | 11,990 | 3,383 | 29,4585 |
19 | 1,361 | 3,497 | 4,759 | 1,852 | 12,226 | 3,523 | 33,88317 |
20 | 1,526 | 3,567 | 5,443 | 2,329 | 12,721 | 3,661 | 38,90802 |
21 | 1,308 | 3,526 | 4,614 | 1,712 | 12,435 | 3,479 | 32,42145 |
22 | 1,224 | 3,434 | 4,202 | 1,498 | 11,792 | 3,408 | 30,20445 |
итого | 21,115 | 67,727 | 68,921 | 22,214 | 219,361 | 67,727 | 537,270 |
сред зн | 1,005 | 3,225 | 3,282 | 1,058 | 10,446 | 3,225 | |
стан откл | 0,216 | 0,211 |
Рассчитаем С и b:
Получим линейное уравнение: .
Выполнив его потенцирование, получим:
Подставляя в данное уравнение фактические значения х,
получаем теоретические значения результата y
.
· Рассчитаем параметры уравнений экспоненциальной парной регрессии. Построению экспоненциальной модели предшествует процедура линеаризации переменных. В примере линеаризация производится путем логарифмирования обеих частей уравнения:
где
Для расчетов используем данные табл. 4:
№ региона | X | Y | XY | X^2 | Y^2 | Yp | y^cp |
1 | 2,800 | 3,332 | 9,330 | 7,840 | 11,104 | 3,225 | 25,156 |
2 | 2,400 | 3,059 | 7,341 | 5,760 | 9,356 | 3,116 | 22,552 |
3 | 2,100 | 3,045 | 6,393 | 4,410 | 9,269 | 3,034 | 20,777 |
4 | 2,600 | 3,148 | 8,186 | 6,760 | 9,913 | 3,170 | 23,818 |
5 | 1,700 | 2,760 | 4,692 | 2,890 | 7,618 | 2,925 | 18,625 |
6 | 2,500 | 3,086 | 7,716 | 6,250 | 9,526 | 3,143 | 23,176 |
7 | 2,400 | 2,996 | 7,190 | 5,760 | 8,974 | 3,116 | 22,552 |
8 | 2,600 | 3,091 | 8,037 | 6,760 | 9,555 | 3,170 | 23,818 |
9 | 2,800 | 3,174 | 8,887 | 7,840 | 10,074 | 3,225 | 25,156 |
10 | 2,600 | 3,258 | 8,471 | 6,760 | 10,615 | 3,170 | 23,818 |
11 | 2,600 | 3,203 | 8,327 | 6,760 | 10,258 | 3,170 | 23,818 |
12 |
2,500 |
3,045 | 7,611 | 6,250 | 9,269 | 3,143 | 23,176 |
13 | 2,900 | 3,296 | 9,558 | 8,410 | 10,863 | 3,252 | 25,853 |
14 | 2,600 | 3,045 | 7,916 | 6,760 | 9,269 | 3,170 | 23,818 |
15 | 2,200 | 3,178 | 6,992 | 4,840 | 10,100 | 3,061 | 21,352 |
16 | 2,600 | 3,526 | 9,169 | 6,760 | 12,435 | 3,170 | 23,818 |
17 | 3,300 | 3,463 | 11,427 | 10,890 | 11,990 | 3,362 | 28,839 |
19 | 3,900 | 3,497 | 13,636 | 15,210 | 12,226 | 3,526 | 33,978 |
20 | 4,600 | 3,567 | 16,407 | 21,160 | 12,721 | 3,717 | 41,140 |
21 | 3,700 | 3,526 | 13,048 | 13,690 | 12,435 | 3,471 | 32,170 |
22 | 3,400 | 3,434 | 11,676 | 11,560 | 11,792 | 3,389 | 29,638 |
Итого | 58,800 | 67,727 | 192,008 | 173,320 | 219,361 | 67,727 | 537,053 |
сред зн | 2,800 | 3,225 | 9,143 | 8,253 | 10,446 | ||
стан откл | 0,643 | 0,211 |
Рассчитаем С и b:
Получим линейное уравнение:
.
Выполнив его потенцирование, получим:
Для расчета теоретических значений y
подставим в уравнение значения x
.
· Рассчитаем параметры уравнений полулогарифмической парной регрессии. Построению полулогарифмической модели предшествует процедура линеаризации переменных. В примере линеаризация производится путем замены:
где
Для расчетов используем данные табл. 5:
№ региона | X | Y | XY | X^2 | Y^2 | y^cp |
1 | 1,030 | 28,000 | 28,829 | 1,060 | 784,000 | 26,238 |
2 | 0,875 | 21,300 | 18,647 | 0,766 | 453,690 | 22,928 |
3 | 0,742 | 21,000 | 15,581 | 0,550 | 441,000 | 20,062 |
4 | 0,956 | 23,300 | 22,263 | 0,913 | 542,890 | 24,647 |
5 | 0,531 | 15,800 | 8,384 | 0,282 | 249,640 | 15,525 |
6 | 0,916 | 21,900 | 20,067 | 0,840 | 479,610 | 23,805 |
7 | 0,875 | 20,000 | 17,509 | 0,766 | 400,000 | 22,928 |
8 | 0,956 | 22,000 | 21,021 | 0,913 | 484,000 | 24,647 |
9 | 1,030 | 23,900 | 24,608 | 1,060 | 571,210 | 26,238 |
10 | 0,956 | 26,000 | 24,843 | 0,913 | 676,000 | 24,647 |
11 | 0,956 | 24,600 | 23,506 | 0,913 | 605,160 | 24,647 |
12 | 0,916 | 21,000 | 19,242 | 0,840 | 441,000 | 23,805 |
13 | 1,065 | 27,000 | 28,747 | 1,134 | 729,000 | 26,991 |
14 | 0,956 | 21,000 | 20,066 | 0,913 | 441,000 | 24,647 |
15 | 0,788 | 24,000 | 18,923 | 0,622 | 576,000 | 21,060 |
16 | 0,956 | 34,000 | 32,487 | 0,913 | 1156,000 | 24,647 |
17 | 1,194 | 31,900 | 38,086 | 1,425 | 1017,610 | 29,765 |
19 | 1,361 | 33,000 | 44,912 | 1,852 | 1089,000 | 33,351 |
20 | 1,526 | 35,400 | 54,022 | 2,329 | 1253,160 | 36,895 |
21 | 1,308 | 34,000 | 44,483 | 1,712 | 1156,000 | 32,221 |
22 | 1,224 | 31,000 | 37,937 | 1,498 | 961,000 | 30,406 |
Итого | 21,115 | 540,100 | 564,166 | 22,214 | 14506,970 | 540,100 |
сред зн | 1,005 | 25,719 | 26,865 | 1,058 | 690,808 | |
стан откл | 0,216 | 5,417 |
Рассчитаем a и b:
Получим линейное уравнение:
.
· Рассчитаем параметры уравнений обратной парной регрессии. Для оценки параметров приведем обратную модель к линейному виду, заменив , тогда
Для расчетов используем данные табл. 6:
№ региона | X | Y | XY | X^2 | Y^2 | Y^cp |
1 | 2,800 | 0,036 | 0,100 | 7,840 | 0,001 | 24,605 |
2 | 2,400 | 0,047 | 0,113 | 5,760 | 0,002 | 22,230 |
3 | 2,100 | 0,048 | 0,100 | 4,410 | 0,002 | 20,729 |
4 | 2,600 | 0,043 | 0,112 | 6,760 | 0,002 | 23,357 |
5 | 1,700 | 0,063 | 0,108 | 2,890 | 0,004 | 19,017 |
6 | 2,500 | 0,046 | 0,114 | 6,250 | 0,002 | 22,780 |
7 | 2,400 | 0,050 | 0,120 | 5,760 | 0,003 | 22,230 |
8 | 2,600 | 0,045 | 0,118 | 6,760 | 0,002 | 23,357 |
9 | 2,800 | 0,042 | 0,117 | 7,840 | 0,002 | 24,605 |
10 | 2,600 | 0,038 | 0,100 | 6,760 | 0,001 | 23,357 |
11 | 2,600 | 0,041 | 0,106 | 6,760 | 0,002 | 23,357 |
12 | 2,500 | 0,048 | 0,119 | 6,250 | 0,002 | 22,780 |
13 | 2,900 | 0,037 | 0,107 | 8,410 | 0,001 | 25,280 |
14 | 2,600 | 0,048 | 0,124 | 6,760 | 0,002 | 23,357 |
15 | 2,200 | 0,042 | 0,092 | 4,840 | 0,002 | 21,206 |
16 | 2,600 | 0,029 | 0,076 | 6,760 | 0,001 | 23,357 |
17 | 3,300 | 0,031 | 0,103 | 10,890 | 0,001 | 28,398 |
19 | 3,900 | 0,030 | 0,118 | 15,210 | 0,001 | 34,844 |
20 | 4,600 | 0,028 | 0,130 | 21,160 | 0,001 | 47,393 |
21 | 3,700 | 0,029 | 0,109 | 13,690 | 0,001 | 32,393 |
22 | 3,400 | 0,032 | 0,110 | 11,560 | 0,001 | 29,301 |
Итого | 58,800 | 0,853 | 2,296 | 173,320 | 0,036 | 537,933 |
сред знач | 2,800 | 0,041 | 0,109 | 8,253 | 0,002 | |
стан отклон | 0,643 | 0,009 |
Рассчитаем a и b:
Получим линейное уравнение:
.
Выполнив его потенцирование, получим:
Для расчета теоретических значений y
подставим в уравнение
значения x
.
· Рассчитаем параметры уравнений равносторонней гиперболы парной регрессии. Для оценки параметров приведем модель равносторонней гиперболы к линейному виду, заменив , тогда
Для расчетов используем данные табл. 7:
№ региона | X=1/z | Y | XY | X^2 | Y^2 | Y^cp |
1 | 0,357 | 28,000 | 10,000 | 0,128 | 784,000 | 26,715 |
2 | 0,417 | 21,300 | 8,875 | 0,174 | 453,690 | 23,259 |
3 | 0,476 | 21,000 | 10,000 | 0,227 | 441,000 | 19,804 |
4 | 0,385 | 23,300 | 8,962 | 0,148 | 542,890 | 25,120 |
5 | 0,588 | 15,800 | 9,294 | 0,346 | 249,640 | 13,298 |
6 | 0,400 | 21,900 | 8,760 | 0,160 | 479,610 | 24,227 |
7 | 0,417 | 20,000 | 8,333 | 0,174 | 400,000 | 23,259 |
8 | 0,385 | 22,000 | 8,462 | 0,148 | 484,000 | 25,120 |
9 | 0,357 | 23,900 | 8,536 | 0,128 | 571,210 | 26,715 |
10 | 0,385 | 26,000 | 10,000 | 0,148 | 676,000 | 25,120 |
11 | 0,385 | 24,600 | 9,462 | 0,148 | 605,160 | 25,120 |
12 | 0,400 | 21,000 | 8,400 | 0,160 | 441,000 | 24,227 |
13 | 0,345 | 27,000 | 9,310 | 0,119 | 729,000 | 27,430 |
14 | 0,385 | 21,000 | 8,077 | 0,148 | 441,000 | 25,120 |
15 | 0,455 | 24,000 | 10,909 | 0,207 | 576,000 | 21,060 |
16 | 0,385 | 34,000 | 13,077 | 0,148 | 1156,000 | 25,120 |
17 | 0,303 | 31,900 | 9,667 | 0,092 | 1017,610 | 29,857 |
19 | 0,256 | 33,000 | 8,462 | 0,066 | 1089,000 | 32,564 |
20 | 0,217 | 35,400 | 7,696 | 0,047 | 1253,160 | 34,829 |
21 | 0,270 | 34,000 | 9,189 | 0,073 | 1156,000 | 31,759 |
22 | 0,294 | 31,000 | 9,118 | 0,087 | 961,000 | 30,374 |
Итого | 7,860 | 540,100 | 194,587 | 3,073 | 14506,970 | 540,100 |
сред знач | 0,374 | 25,719 | 9,266 | 0,146 | 1318,815 | |
стан отклон | 0,079 | 25,639 |
Рассчитаем a и b:
Получим линейное уравнение:
.
Получим уравнение регрессии: .
3. Оценка тесноты связи с помощью показателей корреляции и детерминации
:
· Линейная модель. Тесноту линейной связи оценит коэффициент корреляции. Был получен следующий коэффициент корреляции rxy
=b=7,122*, что говорит о прямой сильной связи фактора и результата. Коэффициент детерминации r²xy
=(0,845)²=0,715. Это означает, что 71,5% вариации результативного признака (розничнаяпродажа телевизоров, у) объясняется вариацией фактора х – среднедушевой денежный доход в месяц.
· Степенная модель. Тесноту нелинейной связи оценит индекс корреляции. Был получен следующий индекс корреляции =, что говорит о очень сильной тесной связи, но немного больше чем в линейной модели. Коэффициент детерминации r²xy
=0,7175. Это означает, что 71,75% вариации результативного признака (розничнаяпродажа телевизоров, у) объясняется вариацией фактора х – среднедушевой денежный доход в месяц.
· Экспоненциальная модель. Был получен следующий индекс корреляции ρxy
=0,8124, что говорит о том, что связь прямая и очень сильная, но немного слабее, чем в линейной и степенной моделях. Коэффициент детерминации r²xy
=0,66. Это означает, что 66% вариации результативного признака (розничнаяпродажа телевизоров, у) объясняется вариацией фактора х – среднедушевой денежный доход в месяц.
· Полулогарифмическая модель. Был получен следующий индекс корреляции ρxy
=0,8578, что говорит о том, что связь прямая и очень сильная, но немного больше чем в предыдущих моделях. Коэффициент детерминации r²xy
=0,7358. Это означает, что 73,58% вариации результативного признака (розничнаяпродажа телевизоров, у) объясняется вариацией фактора х – среднедушевой денежный доход в месяц.
· Гиперболическая модель. Был получен следующий индекс корреляции ρxy
=0,8448 и коэффициент корреляции rxy
=-0,1784 что говорит о том, что связь обратная очень сильная. Коэффициент детерминации r²xy
=0,7358. Это означает, что 73,5% вариации результативного признака (розничнаяпродажа телевизоров, у) объясняется вариацией фактора х – среднедушевой денежный доход в месяц.
· Обратная модель. Был получен следующий индекс корреляции ρxy
=0,8114 и коэффициент корреляции rxy
=-0,8120, что говорит о том, что связь обратная очень сильная. Коэффициент детерминации r²xy
=0,6584. Это означает, что 65,84% вариации результативного признака (розничнаяпродажа телевизоров, у) объясняется вариацией фактора х – среднедушевой денежный доход в месяц.
Вывод:
по полулогарифмическому уравнению получена наибольшая оценка тесноты связи: ρxy
=0,8578 (по сравнению с линейной, степенной, экспоненциальной, гиперболической, обратной регрессиями).
4. С помощью среднего (общего) коэффициента эластичности дайте сравнительную оценку силы связи фактора с результатом.
Рассчитаем коэффициент эластичности для линейной модели:
· Для уравнения прямой:y = 5,777+7,122∙x
· Для уравнениястепенноймодели :
· Для уравненияэкспоненциальноймодели
:
Для уравненияполулогарифмическоймодели
:
· Для уравнения обратной гиперболической модели
:
· Для уравнения равносторонней гиперболической модели
:
Сравнивая значения , характеризуем оценку силы связи фактора с результатом:
·
·
·
·
·
·
Известно, что коэффициент эластичности показывает связь между фактором и результатом, т.е. на сколько% изменится результат y
от своей средней величины при изменении фактора х
на 1% от своего среднего значения. В данном примере получилось, что самая большая сила связи между фактором и результатом в полулогарифмической модели, слабая сила связи в обратной гиперболической модели.
5. Оценка качества уравнений с помощью средней ошибки аппроксимации.
Подставляя в уравнение регрессии фактические значения х,
определим теоретические (расчетные) значения .
Найдем величину средней ошибки аппроксимации :
В среднем расчетные значения отклоняются от фактических на:
· Линейная регрессия. =*100%= 8,5%, что говорит о повышенной ошибке аппроксимации, но в допустимых пределах.
Качество построенной модели оценивается как хорошее, так как не превышает 8 -10%.
· Степенная регрессия. =*100%= 8,2%, что говорит о повышенной ошибке аппроксимации, но в допустимых пределах.
Качество построенной модели оценивается как хорошее, так как не превышает 8 -10%.
· Экспоненциальная регрессия. =*100%= 9%, что говорит о повышенной ошибке аппроксимации, но в допустимых пределах.
Качество построенной модели оценивается как хорошее, так как не превышает 8 -10%.
· Полулогарифмическая регрессия. =*100%= 7,9 что говорит о повышенной ошибке аппроксимации, но в допустимых пределах.
Качество построенной модели оценивается как хорошее, так как не превышает 8 -10%.
· Гиперболическая регрессия. =*100%= 9,3 что говорит о повышенной ошибке аппроксимации, но в допустимых пределах.
Качество построенной модели оценивается как хорошее, так как не превышает 8 -10%.
· Обратная регрессия. =*100%= 9,9 3 что говорит о повышенной ошибке аппроксимации, но в допустимых пределах.
Качество построенной модели оценивается как хорошее, так как не превышает 8 -10%.
6. Рассчитаем F-критерий:
· Линейная регрессия. = *19= 47,579
где =4,38<
· Степенная регрессия. =*19= 48,257
где =4,38<
· Экспоненциальная регрессия. =*19= 36,878
где =4,38<
· Полулогарифмическая регрессия. =*19= 52,9232
где =4,38<
· Гиперболическая регрессия. =*19= 47,357
где =4,38<
· Обратная регрессия. =*19= 36,627
где =4,38<
Для всех регрессий=4,38< , из чего следует, что уравнения регрессии статистически значимы.
Вывод:
остается на допустимом уровне для всех уравнений регрессий.
А | R^2 | Fфакт | |
Линейная модель | 8,5 | 0,714 | 47,500 |
Степенная модель | 8,2 | 0,718 | 48,250 |
Полулогарифмическая модель | 7,9 | 0,736 | 52,920 |
Экспоненциальная модель | 9,0 | 0,660 | 36,870 |
Равносторонняя гипербола | 9,3 | 0,714 | 47,350 |
Обратная гипербола | 9,9 | 0,453 | 15,700 |
Все уравнения регрессии достаточно хорошо описывают исходные данные. Некоторое предпочтение можно отдать полулогарифмической функции, для которой значение R^2 наибольшее, а ошибка аппроксимации – наименьшая
7. Рассчитаем прогнозное значение результата по линейному уравнению регрессии, если прогнозное значение фактора увеличится на 7% от его среднего уровня. Определим доверительный интервал прогноза для уровня значимости α=0,05:
Прогнозное значение определяется путем подстановки в уравнение регрессии соответствующего (прогнозного) значения .
5,777+7,122*2,996=27,114
где = =2,8*1,07=2,996
Средняя стандартная ошибка прогноза
:
==3,12
где = =0,697886
Предельная ошибка прогноза:
Доверительный интервал прогноза
где
=27,116,53;
27,11–6,53 = 20,58
27,11+6,53 = 33,64
Выполненный прогноз среднедушевых денежных доходов в месяц, xоказался надежным (р = 1 – α = 1 – 0,05 = 0,95), но неточным, так как диапазон верхней и нижней границ доверительного интервала составляет 2,09 раза:
= = =1,63