МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ ГОУ ВПО
ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ
КАФЕДРА СТАТИСТИКИ
КОНТРОЛЬНАЯ РАБОТА
ПО СТАТИСТИКЕ
Студентка:
Группа:
Факультет:
Зачетная книжка:
Преподаватель:
Вариант № 18
Москва
20
10
Задание
Имеются следующие выборочные данные о деятельности коммерческих банков (выборка 5%-ная механическая), млн. руб.
Номер банка п/п |
Прибыль |
Собственный капитал |
1 |
170 |
3900 |
2 |
200 |
4500 |
3 |
150 |
3000 |
4 |
90 |
2300 |
5 |
130 |
3700 |
6 |
170 |
3200 |
7 |
155 |
3780 |
8 |
190 |
4000 |
9 |
180 |
3100 |
10 |
210 |
4600 |
11 |
100 |
2200 |
12 |
220 |
5280 |
13 |
250 |
4700 |
14 |
180 |
4400 |
15 |
276 |
6500 |
16 |
220 |
5000 |
17 |
140 |
2500 |
18 |
50 |
1800 |
19 |
190 |
4200 |
20 |
210 |
5600 |
21 |
346 |
7962 |
22 |
240 |
5850 |
23 |
120 |
400 |
24 |
230 |
4900 |
25 |
350 |
8400 |
26 |
280 |
7088 |
27 |
163 |
5100 |
28 |
200 |
4300 |
29 |
260 |
6020 |
30 |
270 |
4800 |
ЗАДАНИЕ 1
По исходным данным:
1.Постройте статистический ряд распределения банков по признаку прибыль, образовав пять групп с равными интервалами.
2.Постойте графики полученного ряда распределения, графически определите значение моды и медианы.
3.Рассчитайте характеристики интервального ряда распределения: среднюю арифметическую, среднее квадратическое отклонение, коэффициент вариации, моду и медиану.
4.Вычислите среднюю арифметическую по исходным данным, сравните ее с аналогичным показателем, рассчитанным в п.3 для интервального ряда распределения. Объясните причину их расхождения.
Сделайте выводы по результатам выполнения задания.
Выполнение Задания 1
1.1 Построение интервального ряда распределения банков по объему прибыли
Для построения статистического ряда, характеризующего распределение банков по прибыли, необходимо вычислить величину и границы интервалов ряда.
При построении ряда с равными интервалами величина интервала h
определяется по формуле
,
(1)
где – наибольшее и наименьшее значения признака в исследуемой совокупности,
k
-
число групп интервального ряда.
Определение величины интервала по формуле (1) при заданных k
= 5, xmax
= 350 млн руб., xmin
= 50 млн руб.:
h=(350-50)/5=60 млн руб.
При h
= 60 млн руб. границы интервалов ряда распределения имеют следующий вид (табл. 2)
Таблица 2
Номер группы |
Нижняя граница, млн руб. |
Верхняя граница, млн руб. |
1 |
50 |
110 |
2 |
110 |
170 |
3 |
170 |
230 |
4 |
230 |
290 |
5 |
290 |
350 |
Процесс группировки единиц совокупности по признаку прибыль представлен во вспомогательной (разработочной) таблице 3
Таблица 3
Разработочная таблица для построения статистического ряда распределения и аналитической группировки
Группы банков по прибыли, млн руб. |
Номер банка |
Прибыль, млн руб. |
Собственный капитал, млн руб. |
1 |
2 |
3 |
4 |
50-110 |
4 |
90 |
2300 |
11 |
100 |
2200 |
|
18 |
50 |
1800 |
|
Всего |
3 |
240 |
6300 |
110-170 |
3 |
150 |
3000 |
5 |
130 |
3700 |
|
7 |
155 |
3780 |
|
17 |
140 |
2500 |
|
23 |
120 |
400 |
|
27 |
163 |
5100 |
|
Всего |
6 |
858 |
18480 |
170-230 |
1 |
170 |
3900 |
2 |
200 |
4500 |
|
6 |
170 |
3200 |
|
8 |
190 |
4000 |
|
9 |
180 |
3100 |
|
10 |
210 |
4600 |
|
12 |
220 |
5280 |
|
14 |
180 |
4400 |
|
16 |
220 |
5000 |
|
19 |
190 |
4200 |
|
20 |
210 |
5600 |
|
28 |
200 |
4300 |
|
Всего |
12 |
2340 |
52080 |
230-290 |
13 |
250 |
4700 |
15 |
276 |
6500 |
|
22 |
240 |
5850 |
|
24 |
230 |
4900 |
|
26 |
280 |
7088 |
|
29 |
260 |
6020 |
|
30 |
270 |
4800 |
|
Всего |
7 |
1806 |
39858 |
290-350 |
21 |
346 |
7962 |
25 |
350 |
8400 |
|
Всего |
2 |
696 |
16362 |
ИТОГО |
30 |
5940 |
133080 |
На основе групповых итоговых строк «Всего» табл. 3 формируется итоговая таблица 4.
Таблица 4
Распределение банков по прибыли
Номер группы |
Группы банков по прибыли, млн руб., |
Число банков, f
|
1 |
50-110 |
3 |
2 |
110-170 |
6 |
3 |
170-230 |
12 |
4 |
230-290 |
7 |
5 |
290-350 |
2 |
Итого |
30 |
Помимо частот групп в абсолютном выражении в анализе интервальных рядов используются ещё три характеристики ряда, приведенные в графах 4 - 6 табл. 1.4. Это частоты групп в относительном выражении, накопленные (кумулятивные) частоты Sj
, получаемые путем последовательного суммирования частот всех предшествующих (j-1) интервалов, и накопленные частости, рассчитываемые по формуле .
Таблица 5
Структура банков по прибыли
№ группы |
Группы банков по прибыли, млн руб. |
Число банков, fj
|
Накопленная частота, Sj
|
Накопленная частоcть, % |
|
в абсолютном выражении |
в % к итогу |
||||
1 |
2 |
3 |
4 |
5 |
6 |
1 |
50-110 |
3 |
10 |
3 |
10,0 |
2 |
110-170 |
6 |
20 |
9 |
30,0 |
3 |
170-230 |
12 |
40 |
21 |
70,0 |
4 |
230-290 |
7 |
23,3 |
28 |
93,3 |
5 |
290-350 |
2 |
6,7 |
30 |
100,0 |
Итого |
30 |
100,0 |
Вывод.
Анализ статистического ряда распределения изучаемой совокупности банков показывает, что распределение банков по объему прибыли не является равномерным: преобладают банки с прибылью от 170 млн руб. до 230 млн руб. (это 12 банков, доля которых составляет 40%); 30% банков имеют прибыль менее 170 млн руб., а 70% – менее 230 млн руб.
1.2 Нахождение моды и медианы полученного интервального ряда распределения графическим методом и путем расчетов
Мода и медиана являются структурными средними величинами, характеризующими (наряду со средней арифметической) центр распределения единиц совокупности по изучаемому признаку.
Мода Мо для дискретного ряда – это значение признака, наиболее часто встречающееся у единиц исследуемой совокупности. В интервальном вариационном ряду модой приближенно считается центральное значение модального интервала (имеющего наибольшую частоту). Более точно моду можно определить графическим методом по гистограмме ряда (рис.1).
Рис. 1 Определение моды графическим методом
Для определения моды графическим способом на гистограмме распределения правую вершину модального прямоугольника соединяют с правым верхним углом предыдущего прямоугольника, а левую вершину модального прямоугольника – с левым верхним углом последующего прямоугольника. Абсцисса точки пересечения этих прямых будет модой распределения.
Конкретное значение моды для интервального ряда рассчитывается по формуле:
(3)
где хМo
– нижняя граница модального интервала,
h –величина модального интервала,
fMo
– частота модального интервала,
fMo-1
– частота интервала, предшествующего модальному,
fMo+1
– частота интервала, следующего за модальным.
Согласно табл. 3 модальным интервалом построенного ряда является интервал 170 – 230 млн. руб., так как его частота максимальна (f3
= 12).
Расчет моды по формуле (3):
Mo=170+60*((12-6)/((12-6)+(12-7)))=202,727 млн руб.
Вывод.
Для рассматриваемой совокупности банков наиболее распространенный объем прибыли характеризуется средней величиной 202,727 млн руб.
Медиана Ме – это значение признака, приходящееся на середину ранжированного ряда. По обе стороны от медианы находится одинаковое количество единиц совокупности.
Медиану можно определить графическим методом по кумулятивной кривой (рис. 2). Кумулята строится по накопленным частотам (табл. 5, графа 5).
Для определения медианы графическим способом высоту наибольшей ординаты кумуляты, которая соответствует общей численности, делят пополам. Через полученную точку проводят прямую, параллельную оси абсцисс до пересечения ее с кумулятой. Абсцисса точки пересечения является медианной величиной.
Рис. 2. Определение медианы графическим методом
Конкретное значение медианы для интервального ряда рассчитывается по формуле:
, (4)
где хМе
– нижняя граница медианного интервала,
h – величина медианного интервала,
– сумма всех частот,
fМе
– частота медианного интервала,
SMе-1
– кумулятивная (накопленная) частота интервала, предшествующего медианному.
Для расчета медианы необходимо, прежде всего, определить медианный интервал, для чего используются накопленные частоты (или частости) из табл. 5 (графа 5). Так как медиана делит численность ряда пополам, она будет располагаться в том интервале, где накопленная частота впервые равна полусумме всех частот или превышает ее (т.е. все предшествующие накопленные частоты меньше этой величины).
В демонстрационном примере медианным интервалом является интервал 170 – 230 млн. руб., так как именно в этом интервале накопленная частота Sj
= 21 впервые превышает величину, равную половине численности единиц совокупности
(=).
Расчет значения медианы по формуле (4):
Ме=170+60*((30/2-9)/12)=200 млн руб.
Вывод.
В рассматриваемой совокупности банков половина банков имеют в среднем объем прибыли не более 200 млн руб., а другая половина – не менее 200 млн руб.
1.3 Расчет характеристик интервального
ряда распределения
Для расчета характеристик ряда распределения , σ
,
σ
2
, Vσ
на основе табл. 5 строится вспомогательная таблица 6 ( – середина j-го интервала).
Таблица 6
Расчетная таблица для нахождения характеристик ряда распределения
Группы банков по объему прибыли, млн руб. |
Середина интервала, |
Число банков, fj
|
|
|
|
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
50-110 |
80 |
3 |
240 |
-117,333 |
13924,000 |
41772 |
110-170 |
140 |
6 |
840 |
-57,333 |
3364,000 |
20184 |
170-230 |
200 |
12 |
2400 |
2,667 |
4,000 |
48 |
230-290 |
260 |
7 |
1820 |
62,667 |
3844,000 |
26908 |
290-350 |
320 |
2 |
640 |
112,667 |
14884,000 |
29768 |
Итого |
30 |
5940 |
118680 |
Расчет средней арифметической взвешенной: (5)
=5940/30=198 млн руб.
Расчет среднего квадратического отклонения:
(6)
σ=118680/30=62,897 млн руб.
Расчет дисперсии:
σ2
=61,641 2=3956
Расчет коэффициента вариации:
(7)
V
σ=62,897*100/198=31,77 %
Вывод.
Анализ полученных значений показателей и σ
говорит о том, что средний объем прибыли банков составляет 198 млн руб., отклонение от среднего объема в ту или иную сторону составляет в среднем 62,897 млн руб. (или 31,77 %), наиболее характерные значения объема прибыли находятся в пределах от 135,103 млн руб. до 260,897 млн руб. (диапазон ).
Значение Vσ
= 31,77 % не превышает 33%, следовательно, вариация кредитных вложений в исследуемой совокупности банков незначительна и совокупность по данному признаку качественно однородна.
Расхождение между значениями , Мо
и Ме
незначительно (=198 млн руб., Мо
=202,727 млн руб., Ме
=200 млн руб.), что подтверждает вывод об однородности совокупности банков. Таким образом, найденное среднее значение объема прибыли банков (198 млн руб.) является типичной, надежной характеристикой исследуемой совокупности банков.
1.4 Вычисление средней арифметической по исходным данным
Для расчета применяется формула средней арифметической простой:
(8)
=5940/30=198 млн руб.
Причина расхождения средних величин, рассчитанных по формулам (8) и (5), заключается в том, что по формуле (8) средняя определяется по фактическим значениям исследуемого признака для всех 30-ти банков, а по формуле (5) средняя вычисляется для интервального ряда, когда в качестве значений признака берутся середины интервалов и, следовательно, значение средней будет менее точным (за исключением случая равномерного распределения значений признака внутри каждой группы).
ЗАДАНИЕ 2
По исходным данным:
1. Установите наличие и характер связи между признаками – прибыль и собственный капитал:
а) аналитической группировки;
б) корреляционной таблицы.
2. Измерьте тесноту корреляционной связи между названными признаками с использованием коэффициентов детерминации и эмпирического корреляционного отношения.
Сделайте выводы по результатам выполнения задания.
Выполнение Задания 2
2.1 Установление наличия и характера связи между признаками прибыль и собственный капитал методами аналитической группировки и корреляционной таблицы
а. Применение метода аналитической группировки
Используя разработочную таблицу 3, строим аналитическую группировку, характеризующую зависимость между факторным признаком Х
– Прибыль
и результативным признаком Y
– Собственный капитал
. Макет аналитической таблицы имеет следующий вид (табл. 7):
Таблица 7
Зависимость суммы прибыли банков от объема кредитных вложений
Номер группы |
Группы банков по объему прибыли, млн руб. |
Число банков |
Собственный капитал, млн руб. |
|
всего |
в среднем на один банк |
|||
1 |
||||
2 |
||||
3 |
||||
4 |
||||
5 |
||||
Итого |
Групповые средние значения получаем из таблицы 3 (графа 4), основываясь на итоговых строках «Всего». Построенную аналитическую группировку представляет табл. 8.
Таблица 8
Зависимость суммы прибыли банков от объема кредитных вложений
Номер группы |
Группы банков по объему прибыли, млн руб., х
|
Число банков, fj
|
Собственный капитал, млн руб. |
|
всего |
в среднем на один банк, |
|||
1
|
2
|
3
|
4
|
5=4:3
|
1 |
50-100 |
3 |
6300 |
2100 |
2 |
110-170 |
6 |
18480 |
3080 |
3 |
170-230 |
12 |
52080 |
4340 |
4 |
230-290 |
7 |
39858 |
5694 |
5 |
290-350 |
2 |
16362 |
8181 |
Итого |
30 |
133080 |
4436 |
Вывод
. Анализ данных табл. 8 показывает, что с увеличением объема прибыли от группы к группе систематически возрастает и объем собственного капитала по каждой группе банков, что свидетельствует о наличии прямой корреляционной связи между исследуемыми признаками.
б. Применение метода корреляционной таблицы.
Корреляционная таблица представляет собой комбинацию двух рядов распределения. Строки таблицы соответствуют группировке единиц совокупности по факторному признаку Х
, а графы – группировке единиц по результативному признаку Y
. На пересечении j
-ой строки и k
-ой графы указывается число единиц совокупности, входящих в j
-ый интервал по факторному признаку и в k
-ый интервал по результативному признаку. Концентрация частот около диагонали построенной таблицы свидетельствует о наличии корреляционной связи между признаками. Связь прямая, если частоты располагаются по диагонали, идущей от левого верхнего угла к правому нижнему. Расположение частот по диагонали от правого верхнего угла к левому нижнему говорит об обратной связи.
Для построения корреляционной таблицы необходимо знать величины и границы интервалов по двум признакам X
и Y
. Величина интервала и границы интервалов для факторного признака Х
– Прибыль
известны из табл. 8. Для результативного признака Y
– Собственный капитал
величина интервала определяется по формуле (1) при k
= 5
, у
max
= 8400 млн руб., у
min
= 400 млн руб.:
h=(8400-400)/5=1600 млн руб.
Границы интервалов ряда распределения результативного признака Y
имеют следующий вид (табл. 9):
Таблица 9
Номер группы |
Нижняя граница, млн руб. |
Верхняя граница, млн руб. |
1 |
400 |
2000 |
2 |
2000 |
3600 |
3 |
3600 |
5200 |
4 |
5200 |
6800 |
5 |
6800 |
8400 |
Подсчитывая с использованием принципа полуоткрытого интервала [ ) число банков, входящих в каждую группу (частоты групп), получаем интервальный ряд распределения результативного признака (табл. 10).
Таблица 10
Распределение банков по сумме прибыли
Группы банков по объему собственного капитала, млн. руб., х
|
Число банков, fj
|
400 – 2000 |
2 |
2000 – 3600 |
6 |
3600 – 5200 |
14 |
5200 – 6800 |
5 |
6800 - 8400 |
3 |
Итого |
30 |
Используя группировки по факторному и результативному признакам, строим корреляционную таблицу (табл. 11).
Таблица 11
Корреляционная таблица зависимости суммы прибыли банков от объема кредитных вложений
Группы банков по прибыли, млн руб. |
Группы банков по объему собственного капитала, млн руб. |
|||||
400-2000 |
2000-3600 |
3600-5200 |
5200-6800 |
6800-8400 |
Итого |
|
50-110 |
1 |
2 |
3 |
|||
110-170 |
1 |
2 |
3 |
6 |
||
170-230 |
2 |
8 |
2 |
12 |
||
230-290 |
3 |
3 |
1 |
7 |
||
290-350 |
2 |
2 |
||||
Итого |
2 |
6 |
14 |
5 |
3 |
30 |
Вывод
. Анализ данных табл. 11 показывает, что распределение частот групп произошло вдоль диагонали, идущей из левого верхнего угла в правый нижний угол таблицы. Это свидетельствует о наличии прямой корреляционной связи между объемом кредитных вложений и суммой прибыли банков.
2.2 Измерение тесноты корреляционной связи с использованием коэффициента детерминации и эмпирического корреляционного отношения
Для измерения тесноты связи между факторным и результативным признаками рассчитывают специальные показатели – эмпирический коэффициент детерминации и эмпирическое корреляционное отношение Эмпирический коэффициент детерминации оценивает, насколько вариация результативного признака Y
объясняется вариацией фактора Х
(остальная часть вариации Y
объясняется вариацией прочих факторов). Показатель рассчитывается как доля межгрупповой дисперсии в общей дисперсии по формуле
, (9)
где – общая дисперсия признака Y
,
– межгрупповая (факторная) дисперсия признака Y
.
Значения показателя изменяются в пределах . При отсутствии корреляционной связи между признаками Х
и Y
имеет место равенство =0
, а при наличии функциональной связи между ними - равенство =1
.
Общая дисперсия
характеризует вариацию результативного признака, сложившуюся под влиянием всех действующих на Y
факторов (систематических и случайных). Этот показатель вычисляется по формуле
(10)
где yi
– индивидуальные значения результативного признака;
– общая средняя значений результативного признака;
n
– число единиц совокупности.
Общая средняя вычисляется как средняя арифметическая простая по всем единицам совокупности:
(11)
или как средняя взвешенная по частоте групп интервального ряда:
(12)
Для вычисления удобно использовать формулу (11), т.к. в табл. 8 (графы 3 и 4 итоговой строки) имеются значения числителя и знаменателя формулы.
Расчет по формуле (11):
=133080/30=4436 млн руб.
Для расчета общей дисперсии применяется вспомогательная таблица 12.
Таблица 12
Вспомогательная таблица для расчета общей дисперсии
Номер банка п/п |
Собственный капитал, млн руб. |
|
|
|
1
|
2
|
3
|
4
|
5
|
1 |
3900 |
-536 |
287296 |
15210000 |
2 |
4500 |
64 |
4096 |
20250000 |
3 |
3000 |
-1436 |
2062096 |
9000000 |
4 |
2300 |
-2136 |
4562496 |
5290000 |
5 |
3700 |
-736 |
541696 |
13690000 |
6 |
3200 |
-1236 |
1527696 |
10240000 |
7 |
3780 |
-656 |
430336 |
14288400 |
8 |
4000 |
-436 |
190096 |
16000000 |
9 |
3100 |
-1336 |
1784896 |
9610000 |
10 |
4600 |
164 |
26896 |
21160000 |
11 |
2200 |
-2236 |
4999696 |
4840000 |
12 |
5280 |
844 |
712336 |
27878400 |
13 |
4700 |
264 |
69696 |
22090000 |
14 |
4400 |
-36 |
1296 |
19360000 |
15 |
6500 |
2064 |
4260096 |
42250000 |
16 |
5000 |
564 |
318096 |
25000000 |
17 |
2500 |
-1936 |
3748096 |
6250000 |
18 |
1800 |
-2636 |
6948496 |
3240000 |
19 |
4200 |
-236 |
55696 |
17640000 |
20 |
5600 |
1164 |
1354896 |
31360000 |
21 |
7962 |
3526 |
12432676 |
63393444 |
22 |
5850 |
1414 |
1999396 |
34222500 |
23 |
400 |
-4036 |
16289296 |
160000 |
24 |
4900 |
464 |
215296 |
24010000 |
25 |
8400 |
3964 |
15713296 |
70560000 |
26 |
7088 |
2652 |
7033104 |
50239744 |
27 |
5100 |
664 |
440896 |
26010000 |
28 |
4300 |
-136 |
18496 |
18490000 |
29 |
6020 |
1584 |
2509056 |
36240400 |
30 |
4800 |
364 |
132496 |
23040000 |
Итого |
133080 |
0 |
90670008 |
681012888 |
Расчет общей дисперсии по формуле (10):
=90670008/30=3022333,6
Общая дисперсия может быть также рассчитана по формуле
,
где – средняя из квадратов значений результативного признака,
– квадрат средней величины значений результативного признака.
Для демонстрационного примера
=681012888/30=22700429,6
=19678096
Тогда
=-=22700429,6-19678096=3022333,6
Межгрупповая дисперсия измеряет систематическую вариацию результативного признака, обусловленную влиянием признака-фактора Х
(по которому произведена группировка). Воздействие фактора Х
на результативный признак Y
проявляется в отклонении групповых средних от общей средней . Показатель вычисляется по формуле
, (13)
где –групповые средние,
– общая средняя,
–число единиц в j-ой группе,
k
– число групп.
Для расчета межгрупповой дисперсии строится вспомогательная таблица 13 При этом используются групповые средние значения из табл. 8 (графа 5).
Таблица 13
Вспомогательная таблица для расчета межгрупповой дисперсии
Группы банков по прибыли, млн руб. |
Число банков, |
Среднее значение в группе |
|
|
1
|
2
|
3
|
4
|
5
|
50-110 |
3 |
2100 |
-2336 |
16370688 |
110-170 |
6 |
3080 |
-1356 |
11032416 |
170-230 |
12 |
4340 |
-96 |
110592 |
230-290 |
7 |
5694 |
1258 |
11077948 |
290-350 |
2 |
8181 |
3745 |
28050050 |
Итого |
30 |
66641694 |
Расчет межгрупповой дисперсии по формуле (11):
=66641694/30=2221389,8
Расчет эмпирического коэффициента детерминации по формуле (9):
=2221389,8/3022333,6=0,735 или 73,5%
Вывод.
75,3% вариации суммы прибыли банков обусловлено вариацией объема прибыли, а 24,7% – влиянием прочих неучтенных факторов.
Эмпирическое корреляционное отношение оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле
(14)
Значение показателя изменяются в пределах . Чем ближе значение к 1, тем теснее связь между признаками. Для качественной оценки тесноты связи на основе служит шкала Чэддока (табл. 14):
Таблица 14
Шкала Чэддока
|
0,1 – 0,3 |
0,3 – 0,5 |
0,5 – 0,7 |
0,7 – 0,9 |
0,9 – 0,99 |
Характеристика силы связи |
Слабая |
Умеренная |
Заметная |
Тесная |
Весьма тесная |
Расчет эмпирического корреляционного отношения по формуле (14):
=0,857 или 85,7 %
Вывод
. Согласно шкале Чэддока связь между объемом прибыли и суммой собственного капитала банков является тесной.
ЗАДАНИЕ 3
По результатам выполнения задания 1 с вероятностью 0,683 определите:
1. Ошибку выборки средней прибыли и границы, в которых будет находиться средний размер прибыли в генеральной совокупности.
2. Ошибку выборки доли банков с прибылью 230 и более млн. руб. и границы, в которых будет находиться генеральная доля.
Выполнение Задания 3
3.1 Определение ошибки выборки для средней прибыли банков и границ, в которых будет находиться средний размер прибыли в генеральной совокупности
Применение выборочного метода наблюдения всегда связано с установлением степени достоверности оценок показателей генеральной совокупности, полученных на основе значений показателей выборочной совокупности. Достоверность этих оценок зависит от репрезентативности выборки, т.е. от того, насколько полно и адекватно представлены в выборке статистические свойства генеральной совокупности. Как правило, генеральные и выборочные характеристики не совпадают, а отклоняются на некоторую величину ε
, которую называют ошибкой выборки (ошибкой репрезентативности).
Значения признаков единиц, отобранных из генеральной совокупности в выборочную, всегда случайны, поэтому и статистические характеристики выборки случайны, следовательно, и ошибки выборки также случайны. Ввиду этого принято вычислять два вида ошибок - среднюю и предельную .
Средняя ошибка выборки - это среднее квадратическое отклонение всех возможных значений выборочной средней от генеральной средней, т.е. от своего математического ожидания M[].
Величина средней ошибки выборки рассчитывается дифференцированно (по различным формулам) в зависимости от вида и способа отбора единиц из генеральной совокупности в выборочную.
Для собственно-случайной и механической выборки с бесповторным способом отбора средняя ошибка выборочной средней определяется по формуле
(15)
где – общая дисперсия выборочных значений признаков,
N
– число единиц в генеральной совокупности,
n
– число единиц в выборочной совокупности.
Предельная ошибка выборки определяет границы, в пределах которых будет находиться генеральная средняя:
,
, (16)
где – выборочная средняя,
– генеральная средняя.
Границы задают д
оверительный интервал генеральной средней, т.е. случайную область значений, которая с вероятностью Р
гарантированно содержит значение генеральной средней. Эту вероятность Р
называют доверительной вероятностью или уровнем надёжности.
В экономических исследованиях чаще всего используются доверительные вероятности Р= 0.954, Р= 0.997,
реже Р= 0,683.
В математической статистике доказано, что предельная ошибка выборки Δ
кратна средней ошибке µ с коэффициентом кратности t (называемым также коэффициентом доверия), который зависит от значения доверительной вероятности Р.
Для предельной ошибки выборочной средней это теоретическое положение выражается формулой
(17)
Значения t
вычислены заранее для различных доверительных вероятностей Р
и протабулированы (таблицы функции Лапласа Ф
). Для наиболее часто используемых уровней надежности Р
значения t
задаются следующим образом (табл. 15):
Таблица 15
Доверительная вероятность P
|
0,683 |
0,866 |
0,954 |
0,988 |
0,997 |
0,999 |
Значение t
|
1,0 |
1,5 |
2,0 |
2,5 |
3,0 |
3,5 |
По условию выборочная совокупность насчитывает 30 банков, выборка 5% механическая, следовательно, г
енеральная совокупность включает 600 банков. Выборочная средняя , дисперсия определены в Задании 1. Значения параметров, необходимых для решения задачи, представлены в табл. 16:
Таблица 16
Р
|
t
|
n
|
N
|
|
|
0,683 |
1 |
30 |
600 |
198 |
3956 |
Расчет средней ошибки выборки по формуле (15):
млн руб.
Расчет предельной ошибки выборки по формуле (17):
млн руб.
Определение по формуле (16) доверительного интервала для генеральной средней:
Вывод.
На основании проведенного выборочного обследования коммерческих банков региона с вероятностью 0,683 можно утверждать, что для генеральной совокупности банков средний объем прибыли находится в пределах от 186,807 млн руб. до 209,193 млн руб.
3.2 Определение ошибки выборки для доли банков с прибылью 230 млн руб. и более, а также границ, в которых будет находиться генеральная доля
Доля единиц выборочной совокупности, обладающих тем или иным заданным свойством, выражается формулой
(18)
где m
– число единиц совокупности, обладающих заданным свойством;
n
– общее число единиц в совокупности.
Для собственно-случайной и механической выборки с бесповторным способом отбора предельная ошибка выборки доли единиц, обладающих заданным свойством, рассчитывается по формуле
(19)
где w
– доля единиц совокупности, обладающих заданным свойством;
(1-
w
)
– доля единиц совокупности, не обладающих заданным свойством,
N
– число единиц в генеральной совокупности,
n
– число единиц в выборочной совокупности.
Предельная ошибка выборки определяет границы, в пределах которых будет находиться генеральная доля р
единиц, обладающих заданным свойством:
(20)
По условию Задания 3 исследуемым свойством является равенство или превышение прибыли банка величины 230 млн руб.
Число банков с заданным свойством определяется из табл. 3 (графа 3):
m
=9
Расчет выборочной доли по формуле (18):
w=9/30=0,3
Расчет по формуле (19) предельной ошибки выборки для доли:
=0,082
Определение по формуле (20) доверительного интервала генеральной доли:
0,3-0,0820,3+0,082
0,218 0,382
или
21,8% 38,2%
Вывод.
С вероятностью 0,683 можно утверждать, что в генеральной совокупности банков доля банков с прибылью 230 млн руб. и выше будет находиться в пределах от 21.8% до 38,2%.
Задание 4
Имеются следующие данные о динамике задолженности организации по кредитам банков:
Год |
Задолженность по кредитам, млрд руб. |
1 |
960 |
2 |
1800 |
3 |
2400 |
4 |
3500 |
5 |
4200 |
Определите:
1. Среднегодовую задолженность организации по кредиту.
2. Абсолютные и относительные изменения задолженности (Цепные и базисные абсолютные приросты, темпы роста, темпы прироста).
Рассчитанные показатнли представьте в таблице.
3. Среднегодовые темпы роста и прироста задолженности.
4. Осуществите прогноз задолженности организаций по кредитам банков при условии, что среднегодовой темп сохранится на прежнем уровне еще в течении двух лет.
5. Постройте график динамики задолженности.
Сделайте выводы
Выполнение Задания 4
1. Для интервального ряда динамики средний уровень исчисляется по формуле средней арифметической простой:
y=Σy/n (21)
y=(960+1800+2400+3500+4200)/5=2572
2. Рассчитываем абсолютные и относительные изменения задолженности
Абсолютный прирост (Δy) — это разность между последующим уровнем ряда и предыдущим (или базисным).
Абсолютный прирост (Δy) цепной и базисный рассчитываем по формулам (22) и (23) соответственно:
Δy
i
=y
i
-y
i-1
(22)
Δyi=yi-y0 (23)
Темп роста (Тр) — отношение уровней ряда динамики, которое выражается в коэффициентах и процента. Цепной темп роста исчисляют отношением последующего уровня к предыдущему:
Тц=y
i
/y
i-1
(24);
базисный - отношением каждого последующего уровня к одному уровню, принятому за базу сравнения:
Тб=y
i
/y
0
(25).
Темп прироста Тпр определяется как разность между темпами роста и единицей, если темпы роста выражены в коэффициентах: Тпр=Тр-1; или как разность между темпами роста 100%, если темпы роста выражены в процентах: Тпр=Тр-100%.
Таблица 17
Год |
Задолженность по кредитам, млрд руб. |
Абсолютные приросты, млрд руб. |
Темпы роста, % |
Темпы прироста,% |
|||
Цепные |
Базисные |
Цепные |
Базисные |
Цепные |
Базисные |
||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
1 |
960 |
- |
- |
- |
100 |
- |
- |
2 |
1800 |
840 |
840 |
187,5 |
187,5 |
87,5 |
87,5 |
3 |
2400 |
600 |
1440 |
133,3 |
250,0 |
33,3 |
150 |
4 |
3500 |
1100 |
2540 |
145,8 |
364,6 |
45,8 |
264,6 |
5 |
4200 |
700 |
3240 |
120,0 |
437,5 |
20,0 |
337,5 |
Итого |
12860 |
3240 |
3. Среднегодовой темп роста исчисляется по формуле средней геометрической из цепных коэффициентов роста:
где n — число коэффициентов;
П — знак произведения.
Тр= 1,875*1,333*1,458*1,200 = 1,446 (144,6 %)
Среднегодовой темп прироста исчисляется следующим образом
Тпр=Тр-100%=144,6-100=44,6%
4. Прогноз задолженности организаций по кредитам банков при условии, что среднегодовой темп сохранится на прежнем уровне еще в течение двух лет.
Прогнозирование осуществим методом экстраполяции. Составим уравнение прямой, представляющее собой трендовую модель: .
Расчетные значения представим в таблице 18.
Таблица 18
Год |
Задолженность по кредитам, млрд. руб. |
t
|
t2
|
y*t
|
1 |
960 |
-2 |
4 |
-1920 |
2 |
1800 |
-1 |
1 |
-1800 |
3 |
2400 |
0 |
0 |
0 |
4 |
3500 |
1 |
1 |
3500 |
5 |
4200 |
2 |
4 |
8400 |
Итого |
12860 |
0 |
10 |
8180 |
Следовательно , . Таким образом, уравнение трендовой модели, будет иметь вид: .
На основе уравнения при t
=6
и t
= 7
можно определить ожидаемую задолженность в течение следующих двух лет, млрд. руб.:
;
.
5. График динамики задолженности (рис. 3).
Рис. 3. График динамики задолженности
Вывод.
Исходя из полученнного графика можно утверждать что задолженность организаций по кредитам банков имеет положительную тенденцию.
Список литературы
1.
Практикум по статистике: Учеб. пособие для вузов / Под ред. В.М. Симчеры / ВЗФЭИ. – М.: ЗАО «Финстатинформ», 1999.- 259 с.
2.
Гусаров В.М. Статистика: Учеб. пособие для вузов.- М.: ЮНИТИ – ДАНА, 2001.- 463 с.
3.
Теория статистики: Учебник/ Под ред. проф. Г.Л. Громыко.- М.: ИНФРА – М, 2000.- 414с.
4.
Башкатова Б.И. Социально – экономическая статистика.- М.: ЮНИТИ, 2002.- 418 с.