1. Таблица с исходными данными, включающая: название страны (РФ), факторный (Уровень заболеваемости (на 1000 человек населения)), результативный (Ожидаемая продолжительность жизни) признак и признак для выполнения п. 3 (Уровень заболеваемости (на 1000 человек населения): болезни органов дыхания).
| Название региона |
Уровень заболеваемости (на 1000 человек населения) |
Ожидаемая продолжительность жизни при рождении всего |
Уровень заболеваемости (на 1000 человек населения): болезни органов дыхания |
| Российская Федерация
|
744,90
|
65,07 |
294,00
|
| Центральный ф. д.
|
720,90
|
65,81
|
318,40
|
| Белгородская область |
806,10 |
68,26 |
271,30 |
| Брянская область |
741,80 |
64,62 |
299,60 |
| Владимирская область |
920,90 |
63,18 |
399,30 |
| Воронежская область |
548,30 |
66,19 |
210,10 |
| Ивановская область |
850,60 |
62,42 |
394,30 |
| Калужская область |
816,30 |
64,56 |
342,00 |
| Костромская область |
692,80 |
62,39 |
321,20 |
| Курская область |
649,60 |
65,35 |
240,80 |
| Липецкая область |
714,20 |
65,85 |
318,80 |
| Московская область |
624,90 |
65,26 |
307,00 |
| Орловская область |
821,70 |
65,23 |
304,10 |
| Рязанская область |
641,60 |
63,91 |
245,50 |
| Смоленская область |
777,20 |
62,34 |
331,80 |
| Тамбовская область |
721,10 |
65,47 |
310,60 |
| Тверская область |
754,10 |
61,53 |
339,60 |
| Тульская область |
822,70 |
63,03 |
372,00 |
| Ярославская область |
937,00 |
63,46 |
398,40 |
| г. Москва |
711,70 |
69,64 |
333,60 |
| Северо-Западный ф. о.
|
749,90
|
63,43
|
313,60
|
| Республика Карелия |
1057,30 |
60,81 |
437,70 |
| Республика Коми |
984,80 |
61,67 |
439,80 |
| Архангельская область |
930,30 |
62,11 |
384,80 |
| Вологодская область |
808,20 |
62,47 |
369,50 |
| Калининградская область |
668,90 |
61,68 |
255,30 |
| Ленинградская область |
524,70 |
61,74 |
232,30 |
| Мурманская область |
817,30 |
63,2 |
351,30 |
| Новгородская область |
817,40 |
60,84 |
348,20 |
| Псковская область |
606,10 |
60,86 |
276,20 |
| г. Санкт-Петербург |
682,80 |
66,49 |
266,60 |
| Южный ф.о.
|
651,80
|
67,49
|
237,00
|
| Республика Адыгея |
657,80 |
67,51 |
199,00 |
| Республика Дагестан |
844,80 |
72,33 |
230,40 |
| Республика Ингушетия |
485,80 |
75,13 |
130,30 |
| Кабардино-Балкарская Республика |
354,40 |
68,7 |
120,60 |
| Республика Калмыкия |
688,80 |
66,18 |
317,50 |
| Карачаево-Черкесская Республика |
506,20 |
68,1 |
180,60 |
| Республика Северная Осетия – Алания |
569,50 |
68,47 |
203,20 |
| Чеченская Республика |
… |
69,06 |
… |
| Краснодарский край |
570,30 |
67,33 |
202,90 |
| Ставропольский край |
485,50 |
67,14 |
223,30 |
| Астраханская область |
728,60 |
65,36 |
274,00 |
| Волгоградская область |
776,20 |
66,43 |
288,70 |
| Ростовская область |
776,20 |
66,47 |
294,90 |
| Приволжский ф.о.
|
799,60
|
65,29
|
303,10
|
| Республика Башкортостан |
797,60 |
66,39 |
277,40 |
| Республика Марий Эл |
768,30 |
63,99 |
265,00 |
| Республика Мордовия |
696,80 |
66,28 |
235,50 |
| Республика Татарстан |
760,80 |
67,84 |
276,70 |
| Удмуртская Республика |
912,80 |
64,34 |
396,00 |
| Чувашская Республика |
820,90 |
66,09 |
274,00 |
| Кировская область |
706,30 |
63,71 |
307,90 |
| Нижегородская область |
762,40 |
64,03 |
317,20 |
| Оренбургская область |
908,50 |
65,35 |
308,00 |
| Пензенская область |
852,10 |
65,67 |
317,90 |
| Пермская область |
834,30 |
62,31 |
330,00 |
| Самарская область |
844,00 |
65,59 |
335,70 |
| Саратовская область |
675,70 |
65,46 |
263,10 |
| Ульяновская область |
877,10 |
65,25 |
320,40 |
| Уральский ф. о.
|
774,10
|
64,79
|
304,80
|
| Курганская область |
843,10 |
63,87 |
272,30 |
| Свердловская область |
685,80 |
63,97 |
275,20 |
| Тюменская область |
897,30 |
66,07 |
350,90 |
| Челябинская область |
750,60 |
64,78 |
308,30 |
| Сибирский ф. о.
|
776,60
|
63,17
|
274,40
|
| Республика Алтай |
876,70 |
60,24 |
242,40 |
| Республика Бурятия |
610,70 |
61,25 |
213,80 |
| Республика Тыва |
637,30 |
54,31 |
189,20 |
| Республика Хакасия |
783,70 |
60,75 |
239,40 |
| Алтайский край |
969,90 |
66,05 |
326,20 |
| Красноярский край |
759,20 |
63,03 |
261,70 |
| Иркутская область |
837,80 |
60,68 |
312,10 |
| Кемеровская область |
741,70 |
61,86 |
267,70 |
| Новосибирская область |
685,90 |
65,83 |
270,00 |
| Омская область |
830,40 |
66,01 |
300,00 |
| Томская область |
764,10 |
64,44 |
229,50 |
| Читинская область |
620,30 |
60,24 |
224,40 |
| Дальневосточный ф. о.
|
758,60
|
62,42
|
292,30
|
| Республика Саха (Якутия) |
847,70 |
63,96 |
326,60 |
| Приморский край |
727,90 |
63,07 |
269,90 |
| Хабаровский край |
715,90 |
61,85 |
289,60 |
| Амурская область |
617,60 |
61,26 |
242,90 |
| Камчатская область |
866,00 |
63 |
357,50 |
| Магаданская область |
942,60 |
63,03 |
372,80 |
| Сахалинская область |
932,10 |
61,44 |
333,20 |
| Еврейская автономная область |
620,30 |
60,8 |
215,10 |
| Чукотский автономный округ |
1296,80 |
59,1 |
620,30 |
Уровень заболеваемости
населения – отношение числа больных с впервые в жизни установленным диагнозом к среднегодовой численности населения.
Ожидаемая продолжительность жизни при рождении
– число лет, которое в среднем предстояло бы прожить одному человеку из некоторого гипотетического поколения родившихся при условии, что на протяжении всей жизни этого поколения уровень смертности в каждом возрасте останется таким, как в годы, для которых вычислен показатель. Ожидаемая продолжительность жизни является наиболее адекватной обобщающей характеристикой современного уровня смертности во всех возрастах.
2. Аналитическая группировка, характеризующая зависимость между факторным и результативным признаком
Таблица 1
| Уровень заболеваемости (на 1000 человек) |
Число регионов, входящих в группу |
Численность населения |
Средняя ожидаемая продолжительность жизни при рождении |
Общая продолжительность жизни при рождение |
Изменение средней ожидаемой жизни при рождение по сравнению с группой с минимальной ожидаемой продолжительностью жизни при рождение |
| 485,5–624,9 |
12 |
23973,4 |
64,91 |
843,77 |
118,2 |
| 624,9–696,8 |
10 |
20281,1 |
64,11 |
769,36 |
129,0 |
| 696,8–760,8 |
11 |
34529,2 |
64,51 |
838,61 |
139,4 |
| 760,8–820,9 |
12 |
24452,0 |
64,30 |
900,26 |
148,0 |
| 820,9–866 |
10 |
20481,7 |
64,51 |
774,1 |
164,4 |
| 866–1057,3 |
11 |
17667,9 |
63,31 |
823 |
75,0 |
| Итого: |
66 |
141385,3 |
385,65 |
4949,1 |
774,0 |
| № группы |
|
|
|
V |
Выводы об однородности данных в группах |
| 1 |
64,91 |
4,22 |
17,83 |
6,50% |
Коэффициент вариации V=σ/x * 100% < 17% следовательно данные абсолютно однородны |
| 2 |
64,11 |
3,39 |
11,46 |
5,28% |
|
| 3 |
64,51 |
2,30 |
5,29 |
3,57% |
|
| 4 |
64,30 |
2,17 |
4,70 |
3,37% |
|
| 5 |
64,51 |
2,82 |
7,96 |
4,37% |
|
| 6 |
63,31 |
1,91 |
3,66 |
3,02% |
|
| 385,65 |
Вывод: Таблица №1 отражает определенную зависимость между уровнем заболеваемости и ожидаемой продолжительностью жизни при рождение всего, зависимость прямая и так как количество регионов в группе сопоставимо (данные однородны).
3. Аналитическая группировка, характеризующая зависимость между территориальным и результативным признаком
Таблица 2
| Название федерального округа |
Кол-во регионов |
Численность населения |
Средняя продолжительность жизни при рождении |
Изменение средней ожидаемой жизни при рождение по сравнению с группой с минимальной ожидаемой продолжительностью жизни при рождение |
| Центральный |
17 |
37545,8 |
64,59 |
104,3 |
| Северо-Западный |
10 |
13731 |
62,19 |
100,4 |
| Южный |
13 |
22820,8 |
68,26 |
110,2 |
| Приволжский |
14 |
30710,2 |
65,16 |
105,2 |
| Уральский |
4 |
12279,2 |
64,67 |
104,4 |
| Сибирский |
12 |
19794,2 |
62,06 |
100,2 |
| Дальневосточный |
9 |
6593 |
61,95 |
103,5 |
| Итого: |
79 |
143474,2 |
448,89 |
728,2 |
| № группы |
|
|
|
V |
Выводы об однородности данных в группах |
| 1 |
64,59 |
2,05 |
4,19 |
3,17% |
Коэффициент вариации V=σ/x * 100% < 17% следовательно данные абсолютно однородны |
| 2 |
62,19 |
1,61 |
2,58 |
2,58% |
|
| 3 |
68,26 |
2,58 |
6,66 |
3,78% |
|
| 4 |
65,16 |
1,33 |
1,78 |
2,05% |
|
| 5 |
64,67 |
0,88 |
0,78 |
1,36% |
|
| 6 |
62,06 |
3,21 |
10,28 |
5,17% |
|
| 7 |
61,95 |
1,40 |
1,97 |
0,02% |
4. Построить вариационный ряд, характеризующий распределение регионов(стран) по величине признака, указанного в варианте (Уровень заболеваемости (на 1000 человек населения) болезни органов дыхания)
| Группа регионов по уровню заболеваемости (на 1000 человек населения): болезни органов дыхания% |
Число регионов в группе |
Среднее значение исследуемого признака |
||
| 1 |
180,6 |
230,4 |
12 |
210,125 |
| 2 |
230,4 |
266,6 |
12 |
249,208 |
| 3 |
266,6 |
277,4 |
11 |
273,155 |
| 4 |
277,4 |
317,2 |
14 |
303,692 |
| 5 |
317,2 |
348,2 |
14 |
328,179 |
| 6 |
348,2 |
439,8 |
14 |
383,750 |
| Итого: |
77 |
|||
Анализ однородности данных в группах
| № группы |
|
|
|
V |
Выводы об однородности данных в группах |
| 1 |
210,13 |
15,10 |
227,97 |
7,19% |
Коэффициент вариации V=σ/x * 100% < 17% следовательно данные абсолютно однородны |
| 2 |
249,21 |
11,83 |
139,88 |
4,75% |
|
| 3 |
273,16 |
3,01 |
9,09 |
1,10% |
|
| 4 |
303,69 |
8,32 |
69,27 |
2,74% |
|
| 5 |
328,18 |
3,02 |
9,12 |
0,92% |
|
| 6 |
383,75 |
27,67 |
765,85 |
7,21% |
Для построенного ряда определим:
· показатели центра распределения
· показатели вариации
· показатели дифференциации и концентрации
· показатели формы распределения
По результатам расчетов сделаем вывод о характере распределения регионов по величине признака.
Показатели центра распределения:
К показателям центра распределения относятся: средняя арифметическая, мода и медиана.
| Номер группы |
1 |
2 |
3 |
4 |
5 |
6 |
| Центр интервала, x
|
205,5 |
248,5 |
272 |
297,3 |
332,7 |
394 |
| Число регионов в группе, f |
12 |
12 |
11 |
14 |
14 |
14 |
Средняя арифметическая
–
%
Мода
– наиболее часто встречающееся значение признака. Так как данный ряд имеет неравные интервалы, то модальным будет интервал с максимальной плотностью распределения.
| Номер интервала (группы) |
1
|
2
|
3
|
4
|
5
|
6
|
| Плотность распределения, p |
0,24 |
0,33 |
1,02 |
0,35 |
0,45 |
0,15 |
| Длина интервала, i |
49,8 |
36,2 |
10,8 |
39,8 |
31 |
91,6 |
| Накопленная частота, F |
12 |
24 |
34 |
38 |
52 |
66 |
Мода находится в 3 интервале (наибольшая плотность распределения, равная 1,02, соответствует именно ему). Конкретное значение моды определяется по формуле:
Медиана
соответствует варианту, стоящему в середине ранжированного ряда. Положение медианы определяется её номером:
Следовательно, медианным является 5-ый интервал 317,2–348,2. Численное же значение медианы определяется по формуле:
319,414%
ВЫВОД: в качестве показателя центра распределения можно выбрать любой из полученных показателей, т. к. их численные значения примерно равны.
Показатели вариации (колеблемости) признака:
Абсолютные показатели:
Размах колебаний (размах вариации):
R=Xmax-Xmin
R= 439,8–180,6 = 259,2
Для расчета показателей вариации построим дополнительную таблицу:
| Группа регионов по уровню заболеваемости (на 1000 человек населения): болезни органов дыхания |
Число регионов, f |
x' |
x' * f |
d =| x' – x | |
d*f |
d2
|
|
| 180,6 |
230,4 |
12 |
90,3 |
1083,6 |
205,49 |
2465,88 |
506713,68 |
| 230,4 |
266,6 |
12 |
115,2 |
1382,4 |
180,59 |
2167,08 |
391352,98 |
| 266,6 |
277,4 |
11 |
133,3 |
1466,3 |
162,49 |
1787,39 |
290433,00 |
| 277,4 |
317,2 |
14 |
138,7 |
1941,8 |
157,09 |
2199,26 |
345481,75 |
| 317,2 |
348,2 |
14 |
158,6 |
2220,4 |
137,19 |
1920,66 |
263495,35 |
| 348,2 |
439,8 |
14 |
174,1 |
2437,4 |
121,69 |
1703,66 |
207318,39 |
| Итого: |
77 |
10531,9 |
964,54 |
12243,93 |
2004795,14 |
||
Среднее линейное отклонение:
Дисперсия:
Среднее квадратичное отклонение:
%
Среднее линейное и среднее квадратическое отклонения показывают, на сколько в среднем отличаются индивидуальные значения признака от среднего его значения.
Квартильное отклонение:
Квартиль – значения признака, которые делят ранжированный ряд на четыре равные по численности части.
Сначала определим положение квартилей:
Это 2 ой интервал 230,4 – 266,6
Это 3 ий интервал 266,6 – 277,4
Это 4 интервал 277,4 – 317,2
Теперь найдём значение квартилей:
, где
xQ
– нижняя граница интервала, в котором находится квартиль
SQ
-1
– накопленная частота интервала, предшествующего тому, в котором находится квартиль
fQ
– частота интервала, в котором находится квартиль
Итак,
Квартильное отклонение применяется вместо размаха вариации, чтобы избежать недостатков, связанных с использованием крайних значений.
Относительные показатели вариации:
Коэффициент осцилляции:
Коэффициент вариации:
Вывод: совокупность данных является однородной, т. к. коэффициент вариации не превышает 33%.
Относительное линейное отклонение:
Относительный показатель квартильной вариации:
Показатели дифференциации и концентрации:
Для оценки дифференциации используем фондовый коэффициент дифференциации и коэффициент децильной дифференциации.
Фондовый коэффициент дифференциации.
8 регионов – 10% от общего числа регионов.
Среднее значение признака для 10% самых мелких единиц совокупности (180,6; 189,2; 199; 202,9; 210,1; 213,8; 215,1; 223,3; 224,4; 229,5):
208,28
Среднее значение признака для 10% самых крупных единиц совокупности (369,5; 372; 372,8; 384,4; 394,3; 396; 398,4; 399,3; 437,7; 439,8):
396,46
Коэффициент децильной дифференциации
.
– номер первой децили. Она находится в 1-ом интервале 180,6 – 230,4
– номер девятой децили. Она находится в 5-ом интервале 317,2 – 348,2
Вывод: наименьший показатель признака 10% регионов с наибольшими значениями по уровню заболеваемости на 1000 человек населения: болезни органов дыхания в 5,48 раза выше наивысшего показателя уровня заболеваемости на 1000 человек населения: болезни органов дыхания 10% регионов с наименьшими значениями признака.
Для оценки концентрации единиц по значению признака используем коэффициент концентрации Джинни и коэффициент Герфендаля.
Коэффициент Джинни:
Концентрацию можно считать несущественной, т. к. 0,08<0,3
Коэффициент Герфендаля (фактический):
= 0,179
Коэффициент Герфендаля при равномерном распределении:
, где 6 – число интервалов;
Сравним фактическое значение коэффициента Герфендаля с рассчитанным значением коэффициента для равномерного распределения. Т.к. 0,179 > 0,167, то концентрация очень высокая.
Показатели формы распределения.
Относительный показатель асимметрии:
Величина показателя асимметрии положительна, следовательно асимметрия правосторонняя.
Рассчитаем показатель асимметрии другим способом:
523514,77
2,62
Средняя квадратическая ошибка асимметрии:
Вывод: с вероятностью 99,7% асимметрия существенна (так как 9,70 > 3) и распределение признака в генеральной совокупности не является симметричным. Вследствие несимметричности распределения показатели эксцесса не рассчитываются.