1.
2. Составной частью сводной обработки данных статистического наблюдения является построение рядов распределения. Цель его – выявление основных свойств и закономерностей исследуемой статистической совокупности. В зависимости от того, является ли признак, взятый за основу группировки, качественным или количественным, различают два типа рядов распределения – атрибутивное и вариационное. Ряды распределения, построенные по качественным признакам, называют атрибутивными. Примером атрибутивных рядов может служить распределение населения по полу, характеру труда, национальности, профессии и т.д. Ряды распределения, построенные по количественному признаку, называют вариационными. Величины того или иного количественного признака у отдельных единиц совокупности более или менее различаются между собой. Такое различие в величине признака носит название вариации.
Для целей анализа и сравнительной характеристики различных рядов распределения применяются обобщающие показатели вариационного ряда. Система таких показателей может быть наглядно представлена при сравнении особенностей нескольких рядов распределения. Пример:
|
На данном рисунки кривые распределения 1 и 2 имеют одинаковый размах вариации и характер распределения частот, но отличаются величиной варьирующего признака, являющегося центром группирования (это отмечено на оси Х).
Характеристики центра группирования составляют одну из групп обобщающих показателей. В качестве них используют среднюю арифметическую, медиану и моду.
На этом же рисунки кривые распределения 3 и 4 имеют один и тот же центр группирования и симметричное расположение частот вокруг него, но отличаются пределами вариации. По этому можно сказать, что кроме показателей центра группирования, для характеристики особенностей распределения необходимо показатели степени вариации. Эти две группы показателей – имеют особое значение при принятии решения в управлении.
Ряды распределения могут иметь один и тот же центр группирования, одинаковые пределы варьирования признака, симметричный характер расположения частот, но разную степень вытянутости вдоль оси ординат, которая характеризуется показателями эксцесса. Сравнение различных распределений показывает, что они могут отличаться характером распределения частот относительно центра; степень отклонения распределения частот от симметричной формы характеризуется показателями ассиметрии. Показатели эксцесса и ассиметрии характеризую форму распределения.
Таким образом, в зависимости от характеризуемых особенностей распределения обобщающие показатели можно разбить на три группы:
1. показатели центра распределения (центра группировки);
2. показатели степени вариации;
3. показатели формы распределения.
Графическое изображение рядов распределения облегчает их анализ и позволяет судить о форме распределения. Для графического изображения дискретного ряда применяют полигон распределения. Для его построения на оси абсцисс отмечают точки, соответствующие величине вариантов значений признака, из них восстанавливаются перпендикуляры, длина которых соответствует частоте (частости) этих вариантов по принятому масштабу на оси ординат. Вершины перпендикуляров в последовательном порядке соединяются отрезками прямых. Для замыкания полигона крайние вершины соединяются с точками на оси абсцисс, отстоящими на одно значение в принятом масштабе (от Хмах и Хмin). Такое построение полигона облегчает восприятие его графического изображения.
Пример построения полигона:
(распределение рабочих по квалификации)
Во – первых необходима создать таблицу данных.
Хi тарифный разряд раб
очего |
Тi число рабочих имеющих этот разряд | Wiчастость | Si накопленная частота |
2 | 1 | 0.05 | 1 |
3 | 5 | 0.25 | 6 |
4 | 8 | 0.40 | 14 |
5 | 4 | 0.20 | 18 |
6 | 2 | 0.10 | 20 |
Итого | 20 | 1,00 |
Для графического изображения интервальных вариационных рядов применяются гистограммы. Она строится так: на оси абсцисс откладываются равные отрезки, которые в принятом масштабе соответствуют величине интервалов вариационного ряда. На отрезках строят прямоугольники, площади которых пропорциональны частотам (или частностям) интервала.
Как и в прошлый раз для построения необходима таблица данных.
Размер прибыли Х | Число банков Т | Накопленная частота |
1 | 2 | 3 |
3,7 – 4,6 | 2 | 2 |
4,6 – 5,5 | 4 | 6 |
5,5 – 6,4 | 6 | 12 |
6,4 – 7,3 | 5 | 17 |
7,3 – 8,1 | 3 | 20 |
Итого | 20 |
Сама гистограмма:
|
Гистограмма может быть преобразована в полигон распределения, если середины верхних сторон прямоугольников соединяются отрезками прямых. Две крайние точки прямоугольников замыкаются по оси абсцисс на середины интервалов, в которых частоты (частности) равны нулю. При построении гистограммы для вариационного ряда с неравными интервалами следует по оси ординат наносить показатели плотности интервалов (абсолютные или относительные). В этом случае высоты прямоугольников гистограммы будут соответствовать величине плотности распределения.
При увеличении числа наблюдений из одной и той же совокупности увеличивается число групп интервального ряда, что приводит к уменьшению величины интервала. При этом ломанная линия имеет тенденцию превращения в плавную кривую, которую называют кривой распределения. Кривая распределения характеризует в обобщенном виде вариацию признака и закономерности распределения частот внутри однокачественной совокупности.
В ряде случаев для изображения вариационного рядов используется кумулятивная кривая (кумуля). Для её построения необходимо рассчитать накопленные частоты и частности. Накопленные частоты показывают, сколько единиц совокупности имеют значения признака не больше, чем рассматриваемое значение, и определяются последовательным суммированием частот интервалов.
Пример построения кумулятивной кривой. Применяем ту же таблице, что и в примере с гистограммой (распределение коммерческих банков по размеру прибыли).
При построении кумуляты интервального ряда распределения нижней границе первого интервала соответствует частота, равная нулю, а верхней границе – вся частота данного интервала. Верхней границе второго интервала соответствует накопленная частота, равная сумме частот первых двух интервалов, и т.д.
Изображение вариоционного ряда в виде кумуляты особенно удобно при сравнении вариационных рядов, а также в экономических исследованиях, в састности для анализа концентрации производства.