Учреждение образования
«ВЫСШИЙ ГОСУДАРСТВЕННЫЙ КОЛЛЕДЖ СВЯЗИ»
кафедра М и Ф
КОНСПЕКТ ЛЕКЦИЙ
по дисциплине
«ОБШАЯ ТЕОРИЯ СТАТИСТИКИ»
для студентов уровня ВО заочной формы обучения
специальностей
1-26 02 03 – Маркетинг
1-25 01 07 – Экономика и управление на предприятии
Минск 2007
Составитель Е.М. Колодная
Рецензент Л.Л. Гладков
Издание утверждено на заседании кафедры М и Ф
«20» марта 2007 г., протокол №8
Зав. кафедрой Л.Л. Гладков
ЛИТЕРАТУРА
1. Елисеева И. И., Юзбашев М. М. Общая теория статистики. – М.: Финансы и статистика, 2001.
2. Ефимова М. Р., Петрова Е. В., Румянцев В. Н. Общая теория статистики. – М.: ИНФРА-М, 1997.
3. Ряузов Н. Н. Общая теория статистики. – М.: Финансы и статистика, 1984.
4. Гусев Н. Ю. Статистика: основы методологии: Учебное пособие. – М.: Издательство АСВ, 1998.
5. Сиденко А. В., Попов Г. Ю., Матвеева В. М. Статистика: Учебник. – М.: Дело и Сервис, 2000.
1 РЯДЫ РАСПРЕДЕЛЕНИЯ. СРЕДНИЕ ВЕЛИЧИНЫ. ПОКАЗАТЕЛИ ВАРИАЦИИ И ДРУГИЕ ХАРАКТЕРИСТИКИ РЯДОВ РАСПРЕДЕЛЕНИЯ. СТАТИСТИЧЕСКИЕ ГРАФИКИ
1.1 Построение рядов распределения
Ряд распределения
- упорядоченное распределение единиц совокупности на группы по какому-либо варьирующему признаку. Имеет два элемента: варианты
(значение группировочного признака) и частоты
(число единиц с данным вариантом). В атрибутивных рядах варианты выражаются словом, а в вариационных - числом.
Вариационные ряды распределения делятся на:
- дискретные
(в качестве вариант выступают дискретные числа);
- интервальные
(в качестве вариант выступают числовые интервалы).
Для построения дискретного ряда распределения необходимо перечислить все наблюдаемые значения признака (варианты) в порядке возрастания их числовых значение и соответствующие им частоты.
Для построения интервального ряда распределения необходимо записать последовательность интервалов и соответствующие им частоты (в качестве частоты, соответствующей интервалу, принимают сумму частот вариант, попавших в этот интервал).
При построении интервальных вариационных рядов распределения предварительно требуется решить вопрос относительно:
а) числа образуемых групп;
б) интервалов групп.
Однозначного ответа на вопрос о числе групп нет. Самый простой ответ - число групп не должно быть слишком большим (не более 15-16) и слишком малым (не менее 3-х). Чаще оптимальным является число 5-6. Математическое правило определения числа групп выражается формулой:
,
где - число групп;
- число единиц совокупности.
Интервалы различают равные и неравные. Величина равного интервала определяется по формуле:
,
где - размер интервала;
- максимальное значение признака;
- минимальное значение признака;
- число образуемых групп.
1.2 Средние величины
Средней величиной
называют обобщающий показатель, который характеризует типичный уровень варьирующего признака в расчете на единицу совокупности в конкретных условиях места и времени.
Существует два класса средних - степенные и структурные
.
К степенным средним
относятся средняя арифметическая, средняя гармоническая, средняя геометрическая, средняя квадратическая и средняя кубическая.
Средняя арифметическая
:
простая
;
взвешенная
,
где - веса (или частоты), показывающие число одинаковых значений признака (вариант).
Для расчета средней арифметической в интервальном ряду распределения, его необходимо преобразовать в дискретный ряд. За дискретное число принимают простую арифметическую среднюю из нижнего и верхнего значений интервала. Если первый или последний интервал открытые - их предварительно закрывают, т.е. находят в первой группе начальное значение интервала, а в последнем - верхнее значение интервала. При этом обычно применяется такой способ: для первой группы весь интервал принимается равным величине интервала второй группы, для последней группы длина интервала берется в соответствии с величиной интервала предпоследней группы.
Пример 1.1
По строительным предприятиям области получены данные об объеме выполненных строительных работ за год (см. табл. 1.1).
Таблица 1.1
Группы пред- приятий по объему выпол- ненных работ, млн. руб. |
Число предприя- тий (n) |
Расчетные показатели | ||
закрытые интервалы по группам |
центральное значение интервала () |
xn |
||
до 500 | 8 | 300-500 | 400 | 3200 |
от 500 до 700 | 12 | 500-700 | 600 | 7200 |
от 700 до 1000 | 6 | 700-1000 | 850 | 5100 |
свыше 1000 | 4 | 1000-1300 | 1150 | 4600 |
Итого: | 30 | — | — | 20100 |
Вычислим средний объем выполненных работ на одно предприятие, используя формулу средней арифметической взвешенной.
Вначале закрываем интервалы. Исходя из того, что весь интервал второй группы равен 200, нижняя граница первого интервала будет исчислена: 500-200=300. Интервал предпоследней группы равен 300, тогда верхняя граница последнего интервала будет 1000+300=1300. В графе 3 все интервалы после этих расчетов записаны закрытыми. По формуле простой арифметической средней исчисленные центральные значения интервалов записаны в графе 4. Эти значения и будут служить вариантами () для расчета средней арифметической взвешенной
==670 (млн. руб.).
Средняя гармоническая
:
простая
;
взвешенная
,
где .
Приведем пример расчета средней гармонической. Допустим, что трое рабочих работали по 8 часов (480 мин.) и затрачивали на отделку 1 кв. м стен: 1-й – 30 мин., 2-й – 40 мин., 3-й – 60 мин. Найти среднюю затрату времени на отделку 1 кв. м стен по формуле:
.
В этом расчете в числителе значится общее время работы трех рабочих (1440 мин.), а в знаменателе общее количество отделанных кв. м (36 кв. м). Средняя затрата времени на отделку 1 кв. м составляет 40 мин. В данном примере веса средней равные и поэтому можно записать:
.
Следовательно, при равных весах расчет может быть произведен по формуле:
.
Средняя квадратическая
:
простая
;
взвешенная
.
Эта средняя применяется при нахождении показателей вариации, которые рассматриваются далее, например, среднеквадратического отклонения.
Средняя геометрическая
:
,
Эта средняя применяется, например, при нахождении средних темпов роста в рядах динамики.
К структурным средним
относятся мода и медиана.
Мода
- это величина признака (вариант), который чаще всего встречается в данной совокупности.
В дискретном ряду распределения моду исчислять не требуется, она находится как значение варианта (), у которого наибольшая частота ().
Пример 1.2
Имеется следующий ряд распределения семей по числу членов семьи:
Таблица 1.2
Число членов семьи () | 2 | 3 | 4 | 5 | 6 |
Число семей () | 300 | 500 | 260 | 100 | 40 |
Здесь мода =3 человека в семье, так как наибольшее число семей (500) в данном ряду имеют 3 человека в семье.
В интервальном ряду мода определяется по формуле:
,
где - мода;
- начальное значение модального интервала (интервала, содержащего наибольшую частоту);
- величина модального интервала;
- частота модального интервала;
- частота интервала, предшествующего модальному интервалу;
- частота интервала, следующего за модальным интервалом.
Рассмотрим нахождение моды в интервальном ряду распределения по условию табл. 1.1.
В этой задаче наибольшая частота (12) находится в интервале от 500 до 700. Это модальный интервал. Тогда мода:
.
Итак, модальная величина объема выполненных работ составляет 580 млн. руб.
Медиана
- это вариант, расположенный в середине ранжированного (упорядоченного) ряда.
Ранжированным
называется ряд, в котором единицы совокупности расположены в возрастающем (или убывающем) порядке значений варианта.
В дискретном нечетном (нечетное число единиц) вариационном ряду распределения медианой будет значение - го варианта.
Например, при испытании прочности семи образцов стекла на силу удара в кг были получены результаты:
4, 5, 6, 7, 8, 8, 15.
В середине ранжированного ряда находится четвертый вариант и его величина есть медиана. Итак, кг или медианное значение прочности стекла при испытании на силу удара составило 7 кг.
В дискретном четном (четное число единиц) вариационном ряду распределения медиана находится как средняя из двух вариантов, расположенных в середине ранжированного ряда, т.е. среднее значение - го и - го вариантов.
Рассмотрим нахождение медианы в дискретном четном ряду распределения по условию табл. 1.2. Данный ряд имеет четное число элементов, так как
300+500+260+100+40=1200, тогда в середине ранжированного ряда будут находиться -ый и ( )-ый варианты, или 600-ый и 601-ый. По суммам накопленных частот (см. табл. 1.3) видно, что и 600-ый и 601-ый варианты имеют значение 3. Значит медиана =3 человека в семье.
Таблица 1.3
Число членов семьи () | 2 | 3 | 4 | 5 | 6 |
Число семей () | 300 | 500 | 260 | 100 | 40 |
Сумма накопленных частот (S) | 300 | 800 | 1060 | 1160 | 1200 |
Медиана интервального вариационного ряда определяется по формуле:
,
- начальное значение медианного интервала (интервала, содержащего медиану);
- величина медианного интервала;
- сумма частот ряда;
- сумма накопленных частот, предшествующих медианному интервалу;
- частота медианного интервала.
По данным табл. 1.1 найдем медиану.
Таблица 1.4
Группы предприятий по | Число | Сумма накопленных |
объему выполненных | предприятий | частот |
работ, млн. руб. | (n) | (S) |
От 300 до 500 | 8 | 8 |
От 500 до 700 | 12 | 20 |
От 700 до 1000 | 6 | 26 |
От 1000 до 1300 | 4 | 30 |
Итого: | 30 | — |
В данном примере в середине ряда находится варианты с порядковыми номерами 15 и 16. Медианным интервалом является второй – от 500 до 700.
Находим медиану по приведенной выше формуле.
.
Итак, медиальная величина объема выполненных работ составляет 617 млн. руб.
1.3 Показатели вариации и способы их расчета
Вариацией
признака называется его изменение у единиц совокупности(колеблемость или рассеивание признака).
Предметом изучения статистики является вариация.
При характеристики рассеивания признака применяют систему абсолютных и относительных показателей.
К абсолютным показателям вариации
относятся:
1) размах вариации:
;
где - максимальное значение признака;
- минимальное значение признака.
Размах вариации характеризует величину максимального колебания признака.
2) среднее линейное отклонение:
.
Этот показатель дает более полное представление о мере вариации признака, чем размах вариации, в расчете которого учитываются только крайние по размеру варианты. В практике данный показатель применяется сравнительно редко.
3) дисперсия:
.
Дисперсия имеет большое значение в статистическом анализе. Однако ее применение как меры вариации в ряде случаев бывает не совсем удобным, потому что размерность дисперсии равна квадрату размерности изучаемого признака. В таких случаях для измерения вариации признака вычисляют среднее квадратическое отклонение.
4) среднеквадратическое отклонение:
.
Среднеквадратическое отклонение широко используется в исследовании технических и экономических явлений. Это величина именованная, имеет ту единицу измерения, которую имеют исходные показатели. Познавательное значение среднеквадратического отклонения можно выразить формулой: . Это значит, что значение вариантов в ряду распределения отклоняются от средней арифметической в среднем на . Среднеквадратическое отклонение () всегда оказывается несколько выше среднего линейного отклонения (
). Величина
обладает некоторыми примечательными математическими свойствами, которые и обусловили предпочтение ее в анализе в сравнении с .
К относительным показателям вариации
относятся:
1) коэффициент осцилляции:
;
2) линейный коэффициент вариации:
;
3) простой коэффициент вариации:
.
Если среднюю арифметическую величину принять за 100%, то с помощью простого коэффициента вариации вариацию можно охарактеризовать как 100%
%. Выражая простой коэффициент вариации в процентах, различные абсолютные среднеквадратические отклонения приводят к одному основанию и дают возможность сравнивать, оценивать колеблемость величин различных признаков. При помощи простого коэффициента вариации возможно, например, сравнение размера колеблемости производительности труда групп рабочих, занятых производством различных видов продукции, размера колеблемости урожаев различных сельскохозяйственных культур и т.д. Чем меньше коэффициент вариации, тем меньше колеблемость признака, и наоборот.
Пример 1.3
Рассмотрим расчет показателей вариации по данным табл. 1.1. Воспользуемся найденным выше средним значением объема выполненных строительных работ одним предприятием 670 млн. руб.
Таблица 1.5
Группы предприятий | Расчетные показатели | |||
по объему выполнен- | Число | центральное | ||
ных работ (закрытые | предприя- | значение |
|
|
интервалы), | тий (n) | интервала | ||
млн. руб. | ()
|
|||
3 | 2 | 4 | 6 | 7 |
300-500 | 8 | 400 | 2160 | 583200 |
500-700 | 12 | 600 | 840 | 58800 |
700-1000 | 6 | 850 | 1080 | 194400 |
1000-1300 | 4 | 1150 | 1920 | 921600 |
Итого: | 30 | — | 6000 | 1758000 |
1) Размах вариации:
=
1300-300=1000 (млн. руб.);
2) среднее линейное отклонение:
=
(млн. руб.);
3) дисперсия:
=
;
4) среднеквадратическое отклонение:
(млн. руб.);
5) коэффициент осцилляции:
=
;
6) линейный коэффициент вариации:
=
;
7
) простой коэффициент вариации:
=
.
1.4 Статистические графики
Для получения приблизительного представления о форме распределения строят графики распределения
.
Полигон распределения
- графическое изображение дискретного вариационного ряда распределения. По оси абсцисс откладывают варианты, а по оси ординат - частоты ряда. Полученные точки соединяются прямыми линиями.
Полученная таким образом линия называется эмпирической (фактической) кривой распределения.
На нее оказывают влияние как общие (отражающие основную закономерность), так и случайные условия.
Если влияние случайных величин будет погашено, то будет установлена теоретическая кривая распределения
. Она выражает определенный тип распределения, отвечает на вопрос о наличии определенного закона распределения. Познание законов распределения - наиболее важная цель статистического исследования. В каждом конкретном случае закономерность распределения может быть, а может и не быть.
Гистограмма распределения
- графическое изображение интервального вариационного ряда распределения. Образуемые над интервалами столбики пропорциональны по высоте частотам значений признака по каждому интервалу. При неравных интервалах высота столбиков должна быть пропорциональна плотности распределения признака в соответствующем интервале.
Чтобы получить эмпирическую кривую, гистограмму нужно преобразовать в полигон. Для этого каждый интервал делим на две равные части (находим середину интервала), ставим точки и затем их соединяем последовательно отрезками прямых линий.
Эмпирическая кривая позволяет предварительно предположить форму теоретической кривой распределения, характеризующую функциональную связь между изменением варьирующего признака и изменением частот.
1.5 Асимметрия распределения и эксцесс
Асимметрия распределения
означает, что частоты каких-либо двух вариантов, равноудаленных от центра распределения, не равны между собой. Графически асимметрия выражается различной длиной правой или левой ветви относительно максимальной ординаты. При асимметрии распределения значения средней арифметической, моды и медианы не совпадают.
Степень асимметрии определяется с помощью, например,
1) коэффициента асимметрии;
2) показателя асимметрии Пирсона.
Коэффициент асимметрии
находится по формуле:
,
где - центральный момент третьего порядка, т.е.
.
Этот коэффициент характеризует асимметричность распределения крайних значений признака.
Показатель асимметрии Пирсона
находится по формуле:
.
Показатель асимметрии Пирсона характеризует асимметричность распределения в средней части ряда.
Эксцесс
характеризует степень островершинности эмпирической кривой относительно кривой нормального распределения.
Коэффициент эксцесса
находится по формуле:
,
где - центральный момент четвертого порядка, т.е.
.
Если получим , то вершины эмпирического и теоретического распределения совпадают. Если , то эмпирическая величина выше вершины соответствующего теоретического распределения, а если , то эмпирическая вершина ниже вершины соответствующего теоретического распределения.
Пример 1.4
Рассмотрим расчет показателей асимметрии и эксцесса по данным табл. 1.1. Воспользуемся найденным выше средним значением объема выполненных строительных работ одним предприятием 670 млн. руб., среднеквадратическим отклонением
млн. руб., модальным значение объема выполненных строительных работ млн. руб.
Таблица 1.6
Группы предприятий | Расчетные показатели | |||
по объему выполненных | Число | центральное | ||
работ (закрытые | предприя- | значение |
|
|
интервалы), млн. руб. | тий (n) | интервала | ||
()
|
||||
3 | 2 | 4 | 8 | 7 |
300-500 | 8 | 400 | -157464000 | 42515280000 |
500-700 | 12 | 600 | -4116000 | 288120000 |
700-1000 | 6 | 850 | 34992000 | 6298560000 |
1000-1300 | 4 | 1150 | 442368000 | 212336640000 |
Итого: | 30 | — | 315780000 | 261438600000 |
Центральный момент третьего порядка:
.
Коэффициент асимметрии
:
.
Показатель асимметрии Пирсона
:
.
Таким образом, данное распределение имеет правостороннюю асимметрию, причем в крайних значениях признака асимметрия более значительная, чем в средней части распределения.
Центральный момент четвертого порядка:
.
Коэффициент эксцесса
:
.
Таким образом, вершина данного распределения ниже вершины соответствующего теоретического нормального распределения.
2 ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ
2.1 Определение выборочного наблюдения
Выборочным наблюдением
называют такое несплошное наблюдение, при котором характеристику всей совокупности единиц (генеральной совокупности) дают по некоторой части единиц (выборочной совокупности), отобранных в определенном порядке.
Выборочное наблюдение используется в связи с тем, что оно позволяет:
— экономить силы и средства, необходимые для статистического исследования;
— быстрее (оперативнее) получать результаты;
— проводить исследования в случаях, когда сплошное наблюдение невозможно (например, для определения качества предметов, связанного с физическим уничтожением образцов);
— уточнять результаты сплошного наблюдения (например, для проверки сплошной переписи населения организуют контрольные выборочные обследования).
Генеральная и выборочная совокупности характеризуются соответственно генеральными и выборочными показателями
(средние величины, показатели доли, показатели вариации).
Возможные случайные отклонения между выборочными и генеральными показателями называют ошибкой выборки
.
Выборочная совокупность формируется различными способами отбора. Применительно к способу отбора используют и свои методы расчета средней ошибки выборки.
2.2 Способы отбора
1. Собственно случайный отбор – отбор на удачу (по жребию, лотерее). Случайный отбор может быть повторный и бесповторный. В экономических исследованиях повторный отбор практически не применяется. Важнейшее правило случайного отбора – каждой единице генеральной совокупности должна обеспечиваться равная вероятность быть отобранной.
2. Механический отбор (порядковый).
Например, генеральная совокупность составляет 600 единиц (т.е. N=600), из которых нужно отобрать выборочную совокупность, состоящую из 50 единиц (т.е. n=50). Единицам генеральной совокупности присваиваются порядковые номера от 1 до 600. Находится интервал отбора: 600/50=12. Из первых 12-ти единиц отбирают единицу случайным отбором. Допустим, что первой оказалась единица под номером 7. Далее с интервалом 12 в выборку будут отобраны единицы под номерами 19, 31, 43 и т.д.
3. Серийный (гнездовой) отбор.
Допустим, генеральная совокупность из 500 единиц разделяется на 100 серий по 5 единиц в серии. В выборку нужно отобрать 50 единиц, т.е. 10 серий. Тогда каждая серия отбирается в выборку собственно случайным бесповторным отбором.
4. Типический (расслоенный) отбор.
При этом отборе генеральная совокупность делится на группы по какому-либо признаку. Затем пропорционально доли каждой группы в генеральной совокупности отбирают единицы из групп в выборочную совокупность в случайном порядке.
5. Комбинированный отбор предполагает использование нескольких способов отбора в их комбинации.
2.3 Статистическая оценка
Статистическая оценка – приближенное значение искомой величины по результатам выборочного наблюдения.
Например, выборочная средняя является оценкой генеральной средней. Различают понятия точечной и интервальной оценки.
Точечной
называют статистическую оценку, которая определяется одним числом.
Несмещенной
называют точечную оценку, математическое ожидание которой равно оцениваемому параметру при любом объеме выборки.
Смещенной
называют точечную оценку, математическое ожидание которой не равно оцениваемому параметру.
Несмещенной оценкой генеральной средней
служит выборочная средняя.
Смещенной оценкой генеральной дисперсии
служит выборочная дисперсия.
Несмещенной оценкой генеральной дисперсии
служит исправленная выборочная дисперсия:
,
где – выборочная дисперсия,
– число единиц выборочной совокупности.
Интервальной
называют оценку, которая определяется двумя числами – концами интервала, покрывающего оцениваемый параметр.
Доверительным
называют интервал, который с заданной надежностью (вероятностью) покрывает оцениваемый параметр.
Обозначим:
– генеральная средняя,
– выборочная средняя,
– предельная ошибка выборочной средней для заданной доверительно вероятности .
Тогда интервальная оценка генеральной средней примет вид:
Предельная ошибка выборочной средней
а) для повторного собственно случайного отбора:
,
б) для бесповторного собственно случайного отбора:
,
где – дисперсия генеральной совокупности,
– число единиц выборочной совокупности,
– число единиц генеральной совокупности,
– коэффициент доверия, величина которого зависит от заданной доверительной вероятности .
Приведем значения некоторых коэффициентов доверия (см. табл. 2.1)
Таблица 2.1
Доверительная вероятность | Коэффициент доверия |
0,683 | 1,0 |
0,866 | 1,5 |
0,954 | 2,0 |
0,991 | 2,6 |
0,997 | 3,0 |
Замечание.
Если генеральная дисперсия неизвестна, то вместо нее можно взять исправленную выборочную дисперсию. При больших выборках
(>30) отношение , и вместо генеральной дисперсии можно использовать выборочную дисперсию.
Пример 2.1
Из общей численности рабочих предприятия 5000 человек в порядке собственно случайного бесповторного отбора было отобрано 500 человек для изучения времени простоев в течение рабочего дня. Результаты наблюдения отражены в табл. 2.2
Таблица 2.2
Распределение выборочной численности рабочих
предприятия по времени простоев
Группы рабочих по времени простоев в минутах | Число рабочих () | Среднее значение интервала в минутах () |
до 10 от 10 до 20 от 20 до 30 от 30 до 40 от 40 до 50 от 50 до 60 свыше 60 |
35 62 84 145 77 65 32 |
5 15 25 35 45 55 65 |
Итого: | 500 |
С вероятностью 0,997 определить пределы, в которых находится среднее время простоя одного рабочего на предприятии.
Решение
1) Выборочная средняя времени простоя одного рабочего:
(мин).
2) Выборочная дисперсия времени простоя одного рабочего:
.
3) Предельная ошибка выборочной средней с вероятностью =0,997 для бесповторного отбора:
;
где коэффициент доверия =3 найден по табл. 2.1 в соответствии с доверительной вероятностью =0,997.
4) Среднее время простоя одного рабочего на предприятии с вероятностью 0,997 находится в интервале от 32,77 минут до 36,84 минут, что вытекает из интервальной оценки генеральной средней:
,
т.е. 34,8–2,0334,8+2,03.
Аналогично находится интервальная оценка генеральной доли:
,
где выборочная доля, которая находится по формуле:
– число единиц выборочной совокупности,
– число единиц, обладающих указанным признаком,
генеральная доля,
– предельная ошибка выборочной доли для заданной доверительно вероятности .
Предельная ошибка выборочной доли
а) для повторного собственно случайного отбора:
,
б) для бесповторного собственно случайного отбора:
,
где – коэффициент доверия, величина которого зависит от заданной доверительной вероятности (см. табл. 2.1).
Пример 2.2
По данным примера 2.1 с вероятностью 0,954 определить пределы, в которых находится доля рабочих на предприятии, у которых время простоя от 30 минут и выше.
Решение
1) Выборочная доля рабочих, у которых время простоя от 30 минут и выше:
.
2) Предельная ошибка выборочной доли с вероятностью =0,954 для бесповторного отбора:
;
где коэффициент доверия =2 найден по табл. 2.1 в соответствии с доверительной вероятностью =0,954.
3) Доля рабочих на предприятии, у которых время простоя от 30 минут и выше с вероятностью 0,954 находится в интервале от 0,597 до 0,679, что вытекает из интервальной оценки генеральной доли:
,
т.е. 0,638–0,0410,638+0,041.
2.4 Определение необходимой численности выборки
При организации выборочного наблюдения очень важно предварительно решить вопрос о том, сколько единиц должно быть отобрано в выборку.
Необходимая численность выборки () определяется на основе формул предельной ошибки выборки.
Численность выборки
по формуле предельной ошибки выборочной средней
а) для повторного собственно случайного отбора:
,
б) для бесповторного собственно случайного отбора:
.
Численность выборки
по формуле предельной ошибки выборочной доли
а) для повторного собственно случайного отбора:
,
б) для бесповторного собственно случайного отбора:
.
Пример 2.3
На заводе предполагается провести выборочное обследование средней часовой выработки рабочих методом случайного повторного отбора. Какова должна быть численность выборки, чтобы с вероятностью 0,991 ошибка выборки не превышала 5 шт., если на основе предыдущих обследований известно, что дисперсия равна 225?
Решение
Численность выборки по формуле предельной ошибки выборочной средней для повторного собственно случайного отбора:
.
Итак, для получения желаемого результата необходимо отобрать 61 рабочего.
3 РЯДЫ ДИНАМИКИ
3.1 Построение рядов динамики
Ряд динамики (временной ряд) -
ряд показателей, характеризующих развитие явления во времени, состоит из двух элементов - времени ряда (моменты или периоды) и уровней ряда (показателей величины явления).
Уровнем ряда
называется абсолютная величина каждого члена динамического ряда. Различают начальный, конечный и средний уровень ряда. Начальный уровень
- это величина первого члена ряда, конечный
– последнего, средний уровень
- средняя из всех значений динамического ряда.
По времени, отражаемому в рядах, ряды динамики делят на моментные
(моментом обычно является дата, на которую относится уровень) и интервальные
(уровни ряда выражают размер явления за промежуток времени).
По полноте времени, отражаемого в рядах, ряды динамики делят на полные
(даты или периоды следуют друг за другом с равным интервалом) и неполные
(равный интервал не соблюдается).
По способу выражения уровней, ряды динамики делят на ряды абсолютных величин
, ряды средних величин
и ряды относительных величин
.
3.2 Показатели анализа рядов динамики
Для анализа ряда динамики применяют следующие базисные и цепные показатели анализа рядов динамики
: абсолютный прирост, темп роста, темп прироста.
Уровень, который сравнивается, называется текущим
.
Если каждый уровень ряда сравнивается с предыдущим, то получают цепные
показатели, а если с одним и тем же начальным уровнем, то получают базисные
показатели.
Абсолютный прирост
характеризует размер увеличения или уменьшения изучаемого явления за определенный период времени. Он определяется как разность между текущим и предыдущим уровнями (цепной) или между текущим и начальным уровнями (базисный).
Темпом роста
называется отношение текущего уровня к предыдущему (цепной) или текущего уровня к начальному (базисный).
Темпом прироста
называется отношение цепного абсолютного прироста к предыдущему уровню (цепной) или базисного абсолютного прироста к начальному уровню (базисный).
Обозначим:
У0
- базисный (начальный) уровень;
У
i
- текущий уровень;
Уi-1
- уровень, предшествующий Уi
.
- цепной абсолютный прирост;
- базисный абсолютный прирост;
- темп роста цепной;
- темп роста базисный;
- темп прироста цепной;
- темп прироста базисный.
Расчет этих показателей будет выражаться формулами, приведенными в табл. 3.1 (в коэффициентах).
Таблица 3.1
Показатель | Цепной | Базисный |
Абсолютный прирост | ||
Темп роста | ||
Темп прироста |
Абсолютное значение 1% прироста (a
i
) – есть отношение цепного абсолютного прироста к цепному темпу прироста, т.е.
( в 1% прироста).
Пример 3.1
В Ивановской области за период с 1980 г. по 1984г. производство сборных железобетонных конструкций и деталей составляло (см. табл. 3.2).
Таблица 3.2
Производство сборных железобетонных конструкций и деталей
В Ивановской области за 1980–1984 годы
Годы | 1980 | 1981 | 1982 | 1983 | 1984 |
Произведено, тыс. куб. м. | 393 | 402 | 381 | 428 | 469 |
Вычислить показатели анализа данного ряда динамики.
Решение
Показатели анализа данного ряда динамики найдены непосредственно в таблице (см. табл. 3.3) по вышеприведенным формулам.
Таблица 3.3
Расчет показателей анализа данного ряда динамики
Годы | 1980 | 1981 | 1982 | 1983 | 1984 |
Произведено, тыс. куб. м. | 393 | 402 | 381 | 428 | 469 |
Абсолютный прирост, тыс. куб. м.: а) цепной б) базисный |
– 0 |
9 9 |
-21 -12 |
47 35 |
41 76 |
Темпы роста в % а) цепные б) базисные |
– 100,0 |
102,3 102,3 |
94,8 96,9 |
112,3 108,9 |
109,6 119,3 |
Темпы прироста в % а) цепные б) базисные |
– 0 |
2,3 2,3 |
-5,2 -3,1 |
12,3 8,9 |
9,6 19,3 |
Абсолютное значение 1% прироста, тыс. куб. м. в 1% прироста | – |
3,93 |
4,02 |
3,81 |
4,28 |
3.3 Расчет средних величин в рядах динамики
Средний уровень в интервальном ряду динамики
находится по формуле средней арифметической простой:
,
где - средний уровень ряда,
- число уровней ряда.
Например, по данным табл. 3.1 среднегодовой уровень производства сборных железобетонных конструкций и деталей за период 1980–1984 гг. составит:
(тыс. куб. м.).
Средний уровень в полном моментном ряду динамики
находится по формуле:
.
Например, стоимость имущества предприятия за полугодие в млн. руб. составляла на 1-ое число каждого месяца:
1.01 | 1.02 | 1.03 | 1.04 | 1.05 | 1.06 | 1.07 |
180 | 150 | 155 | 135 | 160 | 140 | 200 |
Средняя стоимость имущества за полугодие составит:
(млн. руб.).
Средний уровень в неполном моментном ряду динамики
находится по формуле:
,
где средняя за каждый период, находится как средняя арифметическая простая между двумя рядом стоящими уровнями,
продолжительность периода, разделяющего два рядом стоящих уровня.
Пример 3.2
Остаток строительных материалов на предприятии составлял на моменты времени (см. табл. 3.4):
Таблица 3.4
Дата | 1.01 | 10.02 | 25.03 | 1.04 |
Остаток материалов в тыс. руб. | 2500 | 12300 | 8200 | 7400 |
Определить средний остаток строительных материалов за первый квартал.
Решение
Первый период с 1.01 по 10.02 имеет продолжительность 40 дней, т.е. =40.
Второй период с 10.02 по 25.03 имеет продолжительность 43 дня, т.е. =43.
Третий период с 25.03 по 1.04 имеет продолжительность 7 дней, т.е. =7.
Итак, средний остаток строительных материалов на предприятии за первый квартал составит:
8792,778 (тыс. руб.)
Средний абсолютный прирост:
,
где число уровней ряда,
конечный уровень ряда,
начальный уровень ряда.
Например, найдем средний абсолютный прирост производства сборных железобетонных конструкций и деталей за период с 1980 г. по 1984г. по данным примера 3.1 (см. табл. 3.2):
(тыс. куб. м.)
Средний темп роста
исчисляется по формуле геометрической средней:
,
где число уровней ряда,
конечный уровень ряда,
начальный уровень ряда.
Например, найдем средний темп роста производства сборных железобетонных конструкций и деталей за период с 1980 г. по 1984г. по данным примера 3.1 (см. табл. 3.2):
; или 104,5%.
Средний темп прироста
будет равен:
.
Например, найдем средний темп прироста производства сборных железобетонных конструкций и деталей за период с 1980 г. по 1984г. по данным примера 3.1:
; или 4,5%.
3.4 Графическое изображение рядов динамики
Динамика явлений графически может быть представлена в виде линейной диаграммы. Для построения которой используется система прямоугольных координат - по оси абсцисс откладывается время, а по оси ординат - либо уровни, либо базисные темпы роста. На рисунке 3.1 показано, как в принципе должен строится график для интервального ряда (вариант а) и для моментного ряда (вариант б).
Можно указать на следующие важные моменты в построении линейных графиков:
1) на графике должен строго соблюдаться масштаб уровня и масштаб времени;
2) каждая точка оси абсцисс выражает момент времени, а отрезки шкалы - периоды времени;
3) периоды (годы, месяцы и т.п.) в принципе должны подписываться под отрезком шкалы, уровни интервального ряда могут быть выражены, строго говоря, только столбиками, а потому точка на графике обозначает высоту столбика;
4) моменты времени подписывают под точками шкалы, вершины ординат (обозначение точками) соответствуют уровням этих моментов;
5) точки соединяют отрезками прямых, которые образуют ломаную кривую, характеризующую процесс динамики. Соединять точки отрезками кривых линий (“закругленных”) недопустимо.
|
|
|
|
|||||||||||||||||||||||||
|
|||||||||||||||||||||||||
|
|||||||||||||||||||||||||
|
|||||||||||||||||||||||||
|
|||||||||||||||||||||||||
|
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||
|
|||||||||||||||||||||||||
|
|||||||||||||||||||||||||
|
|||||||||||||||||||||||||
|
|||||||||||||||||||||||||
|
|||||||||||||||||||||||||
|
|
|
|
|
Рис. 3.1. Линейная диаграмма ряда динамики
3.5 Приемы анализа рядов динамики
Важнейшая задача анализа динамики - вскрыть, а затем и охарактеризовать свойственные развитию данного явления закономерности и тенденции
(например, тенденция роста, снижения, стабилизации и др.)
Во многих случаях основная тенденция развития выступает по данным ряда динамики недостаточно отчетливо, затушевывается постоянными колебаниями уровня.
Основная тенденция, или, иначе, тренд
, на графике характеризуется линией тренда, которая свободна от кратковременных отклонений, вызванных разными случайными причинами.
В конкретных условиях могут использоваться следующие приемы обработки рядов динамики для выявления основной тенденции (закономерности) развития:
а) простое укрупнение интервалов (от месячных интервалов перейти к квартальным, от квартальных - к годовым и т.д.). Соответственно и уровни ряда будут исчислены за более длительные периоды времени путем суммирования уровней за периоды, вошедшие в новый интервал;
б) расчет среднего уровня в укрупненном интервале. Такой прием, например, часто используют при изучении урожайности сельскохозяйственных культур. По пятилеткам определяют среднегодовую урожайность зерна или другой культуры. Случайные колебания при этом сглаживаются;
в) сглаживание ряда с помощью скользящей средней;
г) аналитическое выравнивание ряда динамики.
Скользящая средняя
может быть трех-, пяти- и более членной. Вопрос о числе членов решает исследователь, проводящий сглаживание ряда. Так, при подсчете трехзвенной скользящей средней первая и последние средние не исчисляются, вторая средняя исчисляется как средняя арифметическая первых трех уровней, третья – как средняя арифметическая второго, третьего и четвертого уровней и т.д.
Сглаживание ряда с помощью скользящей средней является простым приемом, но не всегда ясно позволяет выявить тенденцию развития. Поэтому часто используют прием аналитического выравнивания.
Аналитическое выравнивание
включает:
- выбор формы линии (прямой или какой-либо кривой, имеющей математическую формулу);
- расчет параметров избранной формулы линии, позволяющей нанести теоретическую линию на график.
Допустим, линейная диаграмма позволяет предположить, что динамика исследуемого явления имеет форму прямой линии.
Уравнение прямой выразим:
,
где - теоретическое значение уровней ряда;
- параметры прямой;
- показатели времени.
Коэффициент имеет смысл показателя степени связи между изменчивостью влияющей переменной и изменчивостью зависимой переменной . Коэффициент показывает на сколько изменится переменная при изменении переменной на единицу, а знак коэффициента показывает направление этого изменения.
Для нахождения параметров уравнения используют систему уравнений:
где - фактические уровни ряда;
- число членов ряда;
- показатели времени.
Решая эту систему относительно параметров и , получим:
,
.
Полученная прямая линия выражает тренд динамики.
Пример 3.3
Имеются данные о сварке труб газопровода по месяцам отчетного года в строительной корпорации (см. табл. 3.5).
Таблица 3.5
Месяц | Сварка в метрах | Месяц | Сварка в метрах |
Январь Февраль Март Апрель Май Июнь |
20650 18100 25300 22150 19900 26200 |
Июль Август Сентябрь Октябрь Ноябрь Декабрь |
24550 24250 27250 28000 24250 28000 |
Проведем сглаживание ряда динамики с помощью трехзвенной скользящей средней.
Таблица 3.6
Месяц | Сварка в метрах |
Скользящая средняя (в метрах) |
Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь |
20650 18100 25300 22150 19900 26200 24550 24250 27250 28000 24250 28000 |
– (20650+18100+25300)/3=21350 (18100+25300+22150)/3=21850 (25300+22150+19900)/3=22450 (22150+19900+26200)/3=22750 (19900+26200+24550)/3=23550 (26200+24550+24250)/3=25000 (24550+24250+27250)/3=25350 (24250+27250+28000)/3=26500 (27250+28000+24250)/3=26500 (28000+24250+28000)/3=26750 – |
Значения скользящей средней найдены непосредственно в табл. 3.6.
Если нанести данные табл. 3.6 на график, то получим две линии, изображающие динамику абсолютных уровней и скользящих средних. Покажем это на рис. 3.2.
Рис. 3.2. Сглаживание ряда динамики при помощи скользящей средней
По графику можно убедится в том, что кривая абсолютных уровней имеет резкие изломы и не позволяет однозначно выявить тенденцию динамики.
Кривая скользящих средних, напротив, свидетельствует о безусловном нарастании показателей сварки труб.
Пример 3.4
Рассмотрим прием простого укрупнения интервалов и расчета среднего уровня в укрупненном интервале. По данным табл. 3.5 перейдем от месячных объемов сварки труб газопровода к квартальным. Рассчитаем объем среднемесячной сварки труб газопровода в каждом квартале. Полученные таким образом ряды динамики и расчет их уровней приведены в табл. 3.7. Эти ряды также свидетельствуют о безусловном нарастании показателей сварки труб.
Таблица 3.7
Квартал | Сварка в метрах | Среднемесячная сварка (в метрах) |
1 2 3 4 |
20650+18100+25300=64050 22150+19900+26200=68250 24550+24250+27250=76050 28000+24250+28000=80250 |
64050/3=21350 68250/3=22750 76050/3=25350 80250/3=26750 |
Пример 3.5
Рассмотрим прием сглаживания ряда с помощью аналитического выравнивания по данным табл. 3.5.
Рисунок 3.2 позволяет предположить, что динамика сварки труб имеет форму прямой линии, т.к., несмотря на изломы, точки кривой имеют направленность из нижнего левого в верхний правый угол графика. (Правильность такого суждения проверяется специальными показателями – коэффициентами корреляции).
Произведем расчет параметров и прямой и теоретических уровней . Для этого найдем необходимые суммы в табл. 3.8.
Таблица 3.8
Месяц, | Фактические уровни, | i
|
|||
1 2 3 4 5 6 7 8 9 10 11 12 |
20650 18100 25300 22150 19900 26200 24550 24250 27250 28000 24250 28000 |
20650 36200 75900 88600 99500 157200 171850 194000 245250 280000 266750 336000 |
1 4 9 16 25 36 49 64 81 100 121 144 |
20358 21029 21700 22372 23043 23714 24386 25057 25728 26400 27071 27742 |
|
Итого: | 78 | 288600 | 1971900 | 650 | 288600 |
В нашем случае .
Итак,
(м),
(м).
Тогда уравнение линейного тренда будет иметь вид:
= 19686,36 + 671,33.
Находим теоретические значения:
1 = 19686,36 + 671,33·1 ≈ 20358,
2 = 19686,36 + 671,33·2 ≈ 21029,
3 = 19686,36 + 671,33·3 ≈ 21700 и т.д.
Заносим значения теоретических уровней в табл. 3.8.
Итог теоретических уровней должен быть равен итогу фактических уровней. Нанесем теоретические точки на график (рис. 3.3) и получим прямую линию, которая выражает тренд динамики.
Рис. 3.3. Сглаживание ряда динамики при помощи аналитического
выравнивания
4 ИНДЕКСЫ
4.1 Понятие об индексах
В статистике индексом называется относительная величина, которая характеризует изменение во времени или пространстве уровня изучаемого общественного явления или степень выполнения плана
.
При помощи индексов:
1) определяются средние изменения сложных, непосредственно несоизмеримых совокупностей во времени;
2) оценивается средняя степень выполнения плана по совокупности в целом или ее части;
3) устанавливаются средние соотношения сложных явлений в пространстве;
4) определяется роль отдельных факторов в общем изменении сложных явлений во времени или в пространстве и, в частности, изучается влияние структурных сдвигов.
Индексы всегда выражаются в процентах или коэффициентах.
По степени охвата элементов сложной совокупности различают индексы:
- индивидуальные;
- общие;
- агрегатные.
4.2 Индивидуальные индексы
Индивидуальные индексы
выражают соотношение отдельных элементов совокупности.
Индивидуальные индексы обозначаются буквой “i
” и определяются путем соотношения двух величин, характеризующих уровень изучаемого явления во времени или пространстве, т.е. за два сравниваемых периода.
Период, уровень которого сравнивается, называется отчетным
, или текущим
периодом и обозначается подстрочным знаком “1”.
Период, с уровнем которого производится сравнение, называется базисным и обозначается подстрочным знаком “0” или “пл
”, если сравнение производится с планом.
В статистической практике принято количество обозначать буквой q
, цену – p
, себестоимость – z
, затраты времени на производство единицы продукции – t
.
Индивидуальные индексы выражаются следующим образом:
1) Индекс физического объема продукции
,
где и – количество произведенной продукции в отчетном и базисных периодах, соответственно.
Этот индекс может характеризовать изменение физического объема продукции:
- во времени;
- в пространстве, если сравнивать производство одного и того же вида продукции за один и тот же период времени, но по разным объектам (заводам, территориям и т.д.);
- по сравнению с планом, если фактический выпуск сравнивать с плановым заданием.
2) Индекс цен
,
где и – цена единицы продукции в отчетном и базисном периодах, соответственно.
3) Индекс себестоимости
,
где и – себестоимость единицы продукции в отчетном и базисном периодах, соответственно.
4) Индекс трудоемкости
,
где и – затраты времени на производство единицы продукции в отчетном и базисном периодах, соответственно.
4.3 Общие и агрегатные индексы
Общие индексы показывают соотношение совокупностей явлений, состоящих из разнородных, непосредственно несоизмеримых элементов.
Так, например, общий индекс товарооборота будет:
.
Индекс товарооборота
показывает, что его величина зависит от двух переменных величин:
- физического объема товарооборота, т.е. количества проданных товаров;
- цены за каждую величину реализованных товаров.
Чтобы выявить влияние каждой переменной в отдельности, следует влияние одной из них исключить, т.е. принять ее условно в качестве постоянной, неизменной величины на уровне отчетного или базисного периода. В этом случае используют агрегатные индексы.
Агрегатный индекс цен
, в котором вес принят на уровне отчетного периода (q1
) вычисляют по формуле:
.
Агрегатный индекс физического объема товарооборота,
в котором вес принят на уровне базисного периода (р0
)вычисляют по формуле:
.
Существует взаимосвязь между общим индексом товарооборота и агрегатными индексами цен и физического объема товарооборота, вычисленными по вышеприведенным формулам:
или .
Абсолютный прирост стоимости товарооборота зависит от двух факторов:
- от изменения цен на товары;
- от изменения объема продаж.
Итак, абсолютный прирост стоимости товарооборота равен , в том числе за счет изменения цен на и за счет изменения физического объема на .
Т.е.
Пример 4.1
Имеются следующие данные об объеме выпуска и себестоимости продукции по предприятию (см. табл. 4.1):
Таблица 4.1
Базисный период | Отчетный период | |||
Вид | Выпущено | Себестоимость | Выпущено | Себестоимость |
продукции | продукции, | 1 ед. продукции, | продукции, | 1 ед. продукции, |
ед. () | руб. () | ед. () | руб. () | |
А | 123 | 417 | 178 | 396 |
Б | 64 | 870 | 75 | 792 |
В | 1260 | 10 | 1010 | 10,5 |
Вычислить:
1 Индивидуальные индексы себестоимости и физического объема выпуска продукции вида А.
2 Общий индекс затрат по выпуску всей продукции по данному предприятию.
3 Агрегатный индекс себестоимости продукции.
4 Агрегатный индекс физического объема выпуска продукции.
5 Абсолютную величину изменения затрат на данном предприятии за указанный период, в том числе за счет изменения себестоимости продукции и за счет изменения физического объема выпуска продукции.
6 Сделать краткие выводы по всем полученным показателям.
Решение
1 Индивидуальный индекс себестоимости продукции вида А:
или 95%.
Вывод: себестоимости продукции вида А снизилась на 5%.
Индивидуальный индекс физического объема выпуска продукции вида А:
или 144,7%.
Вывод: физический объем выпуска продукции вида А вырос на 44,7%.
2 Общий индекс затрат по выпуску всей продукции по данному предприятию:
или 117,5%.
Вывод: затраты по выпуску всей продукции по данному предприятию за указанный период выросли на 17,5%.
3 Агрегатный индекс себестоимости продукции:
или 93,9%.
Вывод: Себестоимость всей продукции по данному предприятию за указанный период снизилась на 6,1%.
4 Агрегатный индекс физического объема выпуска продукции:
или 125,1%.
Вывод: физический объем выпуска всей продукции по данному предприятию за указанный период увеличился на 25,1%.
5 Абсолютная величина изменения затрат по выпуску продукции на данном предприятии за указанный период составила:
(руб.),
в том числе за счет изменения себестоимости продукции затраты выросли на:
(руб.)
и за счет изменения физического объема выпуска продукции затраты выросли на:
(руб.).
Вывод: затраты по выпуску продукции на данном предприятии за указанный период выросли на 20922 руб., в том числе за счет изменения себестоимости продукции затраты снизились на 9083 руб. и за счет изменения физического объема выпуска продукции затраты выросли на 30005 руб.
4.4 Средние индексы
Агрегатный индекс может быть преобразован в средний арифметический
или средний гармонический
. Эти формулы используют тогда, когда информация не позволяет сделать расчет по формуле агрегатного индекса, но достаточна для расчета индексов по преобразованным формулам.
Так, например, агрегатный индекс физического объема товарооборота
может быть преобразован в средний арифметический
, если выразить из индивидуального индекса физического объема: , т.е. и подставить в выше приведенную формулу. Итак,
.
Пример 4.2
Имеются данные о производстве продукции заводом за два года (см. табл. 4.2):
Таблица 4.2
Наименование продукции | Стоимость произведенной продукции в базисном году, тыс. руб. () | Изменение количества произведенной продукции в отчетном году, %. |
Станки модели «А» Станки модели «Б» Посуда |
25000 10000 5000 |
-35,0 +20,0 +52,0 |
Требуется вычислить агрегатный индекс физического объема производства продукции.
Решение
Для расчета агрегатного индекса физического объема производства продукции воспользуемся формулой среднего арифметического индекса.
Индивидуальные индексы физического объема составляют:
станки модели «А» — 100% – 35% = 65% или 0,65;
станки модели «Б» — 100% + 20% = 120% или 1,20;
посуда — 100% + 52% = 152% или 1,52.
Итак, агрегатный индекс физического объема производства продукции:
или 89,6%. Следовательно, физический объем производства продукции за указанный период сократился на 10,4%.
Аналогично, агрегатный индекс цен
может быть преобразован в средний гармонический
, если выразить из индивидуального индекса цен: , т.е. и подставить в выше приведенную формулу.
Итак,
.
Пример 4.3
По приведенным данным (см. табл. 4.3) вычислить агрегатный индекс цен.
Таблица 4.3
Наименование товаров | Товарооборот за 1995 год в фактических ценах, тыс. руб. () | Изменение цен в 1995 г. по сравнению с 1994 г. в процентах |
Мясо Молоко Сахар Картофель |
810 1260 930 500 |
+30 +24 +42 –5 |
Решение
Для расчета агрегатного индекса цен воспользуемся формулой среднего гармонического индекса.
Индивидуальные индексы цен составляют:
Мясо — 100% + 30% = 130% или 1,30;
Молоко — 100% + 24% = 124% или 1,24;
Сахар — 100% + 42% = 142% или 1,42;
Картофель — 100% – 5% = 95% или 0,95.
Итак, агрегатный индекс цен:
или 124,1%. Следовательно, цены на товары в 1995 году увеличились по сравнению с 1994 годом на 24,1%
4.5 Индексы средних величин
В ряде случаев приходится изучать динамику общественных явлений, уровни которых выражены средними величинами (средней себестоимостью, средней заработной платой, средней урожайностью, средней производительностью труда и т.д.).
Динамика средних показателей зависит от одновременного изменения вариантов, из которых формируются средние, и изменения удельных весов этих вариантов, т.е. от структуры изучаемого явления. Так, например, средняя производительность труда на предприятии может возрасти за счет ее повышения у рабочих отдельных специальностей и повышения удельного веса рабочих с более высокой производительностью труда в общей численности рабочих.
Таким образом, на изменение динамики среднего значения изучаемого явления могут оказывать влияние одновременно два фактора: изменение осредняемого показателя и изменение структуры. Изучение совместного действия указанных факторов на общее изменение динамики среднего уровня явления, а также роли и влияния каждого фактора в отдельности в общей динамике средней проводится в статистике при помощи системы взаимосвязанных индексов, которую можно представить в следующем виде:
где и – уровни осредняемого показателя соответственно в отчетном и базисном периодах, а и – веса (частоты) осредняемых показателей соответственно в отчетном и базисном периодах.
В указанной системе взаимосвязанных индексов при построении индекса постоянного состава в качестве весов принята структура отчетного периода, что позволяет проследить изменение средней динамики изучаемого явления только за счет изменения осредняемых значений качественного показателя. При построении индекса структурных сдвигов в качестве соизмерителя принята величина осредняемого показателя на уровне базисного периода, что дает возможность изучить изменение средней динамики явления только за счет структурных сдвигов.
Используя индексы средних величин, можно найти не только относительное влияние факторов, но и определить абсолютное изменение уровня среднего показателя в целом () и за счет каждого из факторов: за счет непосредственного изменения уровней осредняемого признака () и за счет изменения структуры (). Для этого необходимо из числителя соответствующего индекса приведенной системы индексов вычесть его знаменатель. Итак
,
в том числе:
;
;
Таким образом .
Пример 4.4
Имеются данные о динамике себестоимости и объеме производства продукции «А» на двух заводах (см. табл. 4.4).
Таблица 4.4
№ завода | Выработано продукции «А», ед. | Себестоимость единицы продукции «А», млн. руб. | ||
Базисный период () | Отчетный период () | Базисный период() | Отчетный период() | |
1 | 25 | 30 | 5,0 | 5,8 |
2 | 40 | 45 | 7,0 | 7,5 |
Вычислить:
1. Индекс средней себестоимости продукции «А» (переменного состава);
2. Индекс себестоимости продукции «А» постоянного состава;
3. Индекс влияния изменения структуры производства продукции «А» на динамику ее средней себестоимости;
4. Определить общее абсолютное изменение средней себестоимости единицы продукции «А» в отчетном периоде по сравнению с базисным и разложить по факторам: за счет непосредственного изменения уровней себестоимости единицы продукции и за счет изменения структуры производства продукции;
Сделать краткие выводы по всем полученным показателям.
Решение
1. Индекс средней себестоимости продукции «А» (переменного состава):
Вывод: средняя себестоимость единицы продукции «А» за указанный период увеличилась на 9,5%.
Изменение средней себестоимости единицы продукции «А» может быть обусловлено изменением себестоимости единицы продукции «А» на каждом заводе и изменением удельного веса производства продукции «А» на каждом из анализируемых заводов.
Выявление влияния каждого из этих факторов на динамику средней себестоимости продукции «А» можно осуществить при помощи расчета индекса себестоимости постоянного состава и индекса структурных сдвигов.
2. Индекс себестоимости продукции «А» постоянного состава:
Вывод: средняя себестоимость единицы продукции «А» за указанный период за счет изменения уровней себестоимости продукции «А» на каждом из заводов увеличилась на 10%.
3. Индекс влияния изменения структуры производства продукции «А» на динамику ее средней себестоимости:
Вывод: средняя себестоимость единицы продукции «А» за указанный период за счет изменения удельного веса количества произведенной продукции «А» на каждом из заводов снизилась на 0,5%.
4. Общее абсолютное изменение средней себестоимости единицы продукции «А» в отчетном периоде по сравнению с базисным:
(млн. руб.),
в том числе:
- за счет непосредственного изменения уровней себестоимости единицы продукции:
(млн. руб.)
- за счет изменения структуры производства продукции:
(млн. руб.)
Вывод: средняя себестоимость единицы продукции «А» за указанный период увеличилась на 0,589 млн. руб., в том числе за счет изменения уровней себестоимости продукции «А» на каждом из заводов увеличилась на 0,62 млн. руб. и за счет изменения удельного веса количества произведенной продукции «А» на каждом из заводов снизилась на 0,031 млн. руб.
5 КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ
5.1 Виды взаимосвязей, изучаемые статистикой
Изучение взаимосвязей в обществе и природе – важнейшая познавательная задача статистики.
Существуют различные виды и формы связей. По характеру зависимости явлений различают:
— функциональную (полную) связь;
— корреляционную (неполную) связь.
Функциональные связи характеризуются однозначным изменением результативного признака под влиянием изменения факторного признака. Так, например, функциональная связь существует между площадью и радиусом круга. Функциональная связь выражается формулой у=
f
(х)
.
Корреляционная связь проявляется лишь в среднем, в массе случаев. При корреляционной зависимости тот или иной признак изменяется (варьирует) под влиянием действия целого комплекса факторов, часть которых имеет основное значение для совокупности, а другая — второстепенное, хотя, может быть, и сильно влияет на отдельные единицы совокупности. Так, например, уровень производительности труда рабочих зависит от энерговооруженности и фондовооруженности труда. В то же время уровень производительности труда в какой-то мере зависит от многих других факторов, в том числе и от особенностей условий работы каждого предприятия. Для обнаружения корреляционной зависимости нужно взять не один и не два случая, а большое их число. Только в массе случаев индивидуальные особенности и второстепенные факторы сгладятся и зависимость, если она имеет существенную силу, проявится достаточно отчетливо.
Корреляционную связь можно выразить формулой: у=
f
(х)+
. Здесь результативный признак у
зависит от признака-факторах
,
но имеется еще и остаточное влияние второстепенных причин, выраженное величиной — .
По направлению действия факторного признака различают связи:
— прямые
(увеличение факторного признака вызывает увеличение результативного признака, так же и уменьшений одного ведет к уменьшению другого признака);
— обратные
(увеличение факторного признака ведет и уменьшению признака результативного и наоборот).
Связи между явлениями могут быть:
— сильными (тесными);
— слабыми.
Статистические методы позволяют измерять силу взаимосвязей. По аналитическому выражению связи могут быть линейные и нелинейные.
Корреляционная связь может быть:
— парной
(связь двух признаков);
— многофакторной (множественной)
, когда на результативный признак одновременно оказывают влияние несколько признаков факторов.
5.2 Корреляционный метод анализа связей
Корреляционный метод имеет две основные задачи:
1) обнаружить зависимость между факторным и результативным признаками и описать её форму с помощью уравнения регрессии;
2) установить меру тесноты связи между признаками (в какой мере вариация х
обуславливает вариацию у
).
Приступая к изучению корреляционной зависимости,следует помнить о том что, прежде всего, необходимо провести предварительный теоретический анализ. Он должен ответить на вопрос о том, существует ли такая связь вообще. Из истории статистики известно, что несоблюдение этого правила не раз приводило исследователей к курьезным результатам.
Предварительный теоретический анализ позволяет во многих случаях подсказать и форму связи (прямолинейная или более сложная), установить, является ли связь прямой пли обратной.
Сказанное выше означает, что каждый, кто прибегает к использованию метода корреляции, должен хорошо владеть не только данным методом, но и знанием предмета своего исследования.
Корреляционную связь, в которой есть только один признак-фактор и один признак-результат, именуют парной. Уравнение, выражающее такую связь, представляют какой-либо математической формулой прямой или кривых линий (гипербола, парабола и др.).
Для нахождения формы связи и описания ее в виде уравнения линии используют:
— группировку статистических данных;
— построение графика эмпирической линии.
Если точек очень много, то рассматривают не линию, а облако точек на графике корреляционного поля. В реальной практике не всегда удается достаточно уверенно по эмпирической линии установить форму линии связи. В этих случаях принимают несколько вариантов формы связи, по каждому из них делают расчеты и в конце дают оценку вариантов с помощью показателя тесноты связи. Вариант, в котором теснота связи оказалась наиболее высокой, принимается за наиболее верный.
Если форма связи выражается прямой линией, то уравнение регрессии имеет вид:
,
где - теоретическое значение,
и - параметры уравнения.
Параметр экономической интерпретации не имеет. Параметр называется коэффициентом регрессии
, который показывает насколько изменится
результативный признак () при изменении признака-фактора (x
) на одну единицу.
Параметры уравнения и находят из решения системы двух нормальных уравнений:
Решая эту систему относительно параметров a
и b
, получим:
,
.
Уравнение регрессии можно использовать для прогнозирования, если связь между факторным и результативным признаками достаточно тесная.
В случае прямолинейной формы связи теснота может быть измерена линейным коэффициентом корреляции
по формуле:
.
Коэффициент корреляции может находится в пределах от 0 (связь отсутствует) до (связь полная). Знак «+» указывает на прямую, а знак «–» на обратную связь.
Существуют способы оценки тесноты связи. В частности, по таблице Чэддока тесноту связи определяют следующим образом (см. табл. 5.1):
Таблица 5.1
Значение коэффициента (по модулю) |
Теснота связи |
0,1-0,3 0,3-0,5 0,5-0,7 0,7-0,9 0,9-0,99 |
слабая умеренная заметная высокая весьма высокая |
В упрощенном виде считают, что если коэффициент (по модулю) составляет от 0,1 до 0,3 – связь слабая, от 0,3 до 0,7 – средняя, от 0,7 и выше – тесная.
Пример 5.1
Имеются данные стоимости основных производственных фондов и объеме выпуска продукции по 10 предприятиям за отчетный год (см. табл. 5.2)
Таблица 5.2
Номер предприятия |
Стоимость основных производственных фондов, млн. руб. (x
) |
Объем выпуска продукции, млн. руб. (y
) |
1 2 3 4 5 6 7 8 9 10 |
6 9 10 12 14 8 10 11 13 15 |
24 36 45 56 70 40 40 46 65 70 |
На основе приведенных данных:
1) для подтверждения положений логического анализа о наличии корреляционной прямолинейной зависимости между факторным признаком (стоимостью основных производственных фондов) и результативным признаком (объемом выпуска продукции) нанесите исходные данные на график корреляционного поля и сделайте выводы о форме связи, укажите ее формулу;
2) определите параметры уравнения связи и нанесите полученную при этом теоретическую линию на график корреляционного поля;
3) исчислите линейный коэффициент корреляции;
4) поясните значения показателей, полученных в пунктах 2) и 3);
5) используя полученную модель, сделайте прогноз о возможном объеме выпуска продукции на предприятии со стоимостью основных производственных фондов 7 млн. руб.
Решение
1 Величина основных производственных фондов определяет производственную мощность предприятия и поэтому логически можно считать, что зависимость между величиной основных производственных фондов и объемом выпуска продукции реально существует. Это подтверждается и показателями табл. 5.2. С увеличением основных производственных фондов отмечается рост объема выпуска продукции. В то же время в отдельных случаях наблюдается и другое — величина основных производственных фондов увеличивается, а увеличения объема выпуска продукции нет. Связь является корреляционной.
Для выяснения формы связи построим по данным табл. 5.2 график (см. рис. 5.1).
Рис. 5.1. Стоимость основных производственных фондов (x
) и объем
выпуска продукции (y
), млн. руб.
Эмпирическая ломаная линия на графике позволяет предположить, что связь выражается прямой линией, т.к. общей тенденцией на графике является направленность эмпирической линии из нижнего левого угла в верхний правый угол.
Итак, уравнение регрессии имеет вид:
,
2 Для нахождения параметров уравнения и составим табл. 5.3.
Таблица 5.3
6 9 10 12 14 8 10 11 13 15 |
24 36 45 56 70 40 40 46 65 70 |
144 324 450 672 980 320 400 506 845 1050 |
36 81 100 144 196 64 100 121 169 225 |
576 1296 2025 3136 4900 1600 1600 2116 4225 4900 |
|
Итого: | 108 | 492 | 5691 | 1236 | 26374 |
Так как в нашем случае n
=10, то
;
.
Итак, уравнение регрессии в нашем случае будет иметь вид:
.
Изобразим полученную теоретическую линию на график корреляционного поля (см. рис. 5.1).
Полученное уравнение позволяет оценить по предприятиям, как они использовали возможности для производства продукции, заложенные в величине основных производственных фондов.
Так, по первому предприятию при :
; т.е. фактический объем выпуска продукции выше теоретической величины на 0,83 млн.руб.
По последнему предприятию при :
; т.е. возможности производства недоиспользованы на 1,968 млн. руб.
3 Найдем значение линейного коэффициента корреляции
.
4 Параметр =5,422 означает, что увеличение стоимости основных производственных фондов на 1 млн. руб. ведет к росту объема выпуска продукции на 5,422 млн. руб.
Значение линейного коэффициента корреляции r
=0,97 свидетельствует о наличии весьма высокой связи между величиной стоимости основных производственных фондов и объемом выпуска продукции. Следовательно, полученное уравнение регрессии может быть использовано для прогнозирования.
5 Прогнозируемая величина объема выпуска продукции на предприятии со стоимостью основных производственных фондов 7 млн. руб. будет:
(млн.руб.).
СОДЕРЖАНИЕ
Литература 1. Ряды распределения. Средние величины. Показатели вариации и другие характеристики рядов распределения. Статистические графики. 1.1 Построение рядов распределения 1.2 Средние величины 1.3 Показатели вариации и способы их расчета 1.4 Статистические графики 1.5 Асимметрия распределения и эксцесс 2. Выборочное наблюдение 2.1 Определение выборочного наблюдения 2.2 Способы отбора 2.3 Статистическая оценка 2.4 Определение необходимой численности выборки 3. Ряды динамики 3.1 Построение рядов динамики 3.2 Показатели анализа рядов динамики 3.3 Расчет средних величин в рядах динамики 3.4 Графическое изображение рядов динамики 3.5 Приемы анализа рядов динамики 4. Индексы 4.1 Понятие об индексах 4.2 Индивидуальные индексы 4.3 Общие и агрегатные индексы 4.4 Средние индексы 4.5 Индексы средних величин 5. Корреляционно – регрессионный анализ 5.1 Виды взаимосвязей, изучаемые статистикой 5.2 Корреляционный метод анализа связей |
3 4 5 10 12 13 16 16 17 21 22 22 24 26 28 33 33 34 37 39 42 43 |
План 2006/2007, поз.
Колодная Елена Мумунджановна
КОНСПЕКТ ЛЕКЦИЙ
по дисциплине
«ОБЩАЯ ТЕОРИЯ СТАТИСТИКИ»
для студентов уровня ВО заочной формы обучения
специальностей
1-26 02 03 – Маркетинг
1-25 01 07 – Экономика и управление на предприятии
Редактор Н.В. Вердыш
Подписано к печати___________
Формат 60Х84/16
Усл. печ. л. 0,9 уч.-изд. л. 0,8
Тираж____экз. Заказ____
Учреждение образования
«ВЫСШИЙ ГОСУДАРСТВЕННЫЙ КОЛЛЕДЖ СВЯЗИ»
220114, г. Минск, ул. Ф.Скорины 8, к.2