РефератыМенеджментГрГруппировка статистических данных и ее роль в анализе информации

Группировка статистических данных и ее роль в анализе информации


Содержание


Семестр 1_ 2


Группировка статистических данных и ее роль в анализе информации_ 2


Абсолютные, относительные, средние величины_ 2


Относительные величины_ 2


Средние величины_ 2


Статистические распределения и их характеристики_ 3


Показатели вариации (колеблемости) признака_ 4


Сложение дисперсий_ 4


Показатель асимметрии_ 5


Показатель эксцесса (островершинности) 5


Кривые распределения 5


Выборочное наблюдение 6


Формулы ошибок простой случайной выборки_ 7


Формулы для определения численности простой и случайной выборки_ 7


Типичная выборка_ 7


Серийная выборка_ 8


Малые выборки_ 8


Корреляционная связь_ 8


Уравнение регрессии_ 9


Ряды динамики_ 10


Показатели динамики_ 10


Средние показатели динамики_ 10


Тренды_ 11


Семестр 2 (Индексы) 11


Семестр 1


Группировка статистических данных и ее роль в анализе информации


Равный интервал
, величина интервала - , m
– число групп


Формула Стерджесса (величина интервала) - , n
– число наблюдений



Абсолютные, относительные, средние величины


Относительные величины

Относительные величины (ОВ) динамики характеризуют изменение явления во времени. (Коэффициент роста)


Темп роста
– с переменной базой - yn

– уровень явления за период
(например, выпуск продукции по кварталам года)


С постоянной базой - , yk
– постоянная база сравнения


ОВ планового задания
-


ОВ выполнения плана
-


ОВ динамики
-


ОВ структуры
характеризуют долю отдельных частей в общем объеме совокупности (удельный вес) -


ОВ координации
отражают отношение численности двух частей единого целого, т. е. показывают, сколько единиц одной группы приходится в среднем на одну, на 10 или на 100 единиц другой изучаемой совокупности.


ОВ координации -


ОВ наглядности (сравнения)
отражают результаты сопоставления одноименных показателей, относящихся к одному и тому же периоду времени, но к разным объектам или территориям (например, сравнивается годовая производительность труда по 2-м предприятиям)


ОВ сравнения -


Средние величины

Степенные средние общего типового расчета:


Средняя степенная простая
- , - индивидуальное значение признака, по которому рассчитывается средняя,
n
– объем совокупности (число единиц)


Средняя степенная взвешенная
- , fi
– частота повторения индивидуального признака
(=n)





























Значе-ние k


Наименование средней


Формула средней


Простая


Средняя


-1


Гармоническая



,


0


Геометрическая




1


Арифметическая



,


2


Квадратическая





гарм.
< геом
< арифм
< квадрат
, x=w/f


Гармоническая простая – когда небольшая совокупность и индивидуальные значения не повторяются. Используется, если исчисляем среднюю из обратных величин.


Средняя квадратическая – для расчета среднего квадратического отклонения, являющегося показателем вариации признаков


Средняя геометрическая простая – для вычисления среднего коэффициента роста (темпа) в рядах динамики, если промежутки, к которым относятся коэффициенты роста, одинаковы.


Статистические распределения и их характеристики


Мода
– значение признака, которое наиболее часто встречается в совокупности


, - нижняя граница модального интервала (интервал с наибольшей частотой), - величина интервала, - частота в модальном интервале.


Медиана
– значение признака, которое лежит в середине ранжированного ряда и делит этот ряд на две равные по численности части.


- положение медианы


, - нижняя граница медианного интервала, - накопленная частота интервала, предшествующего медианному, - частота медианного интервала.


Квартель


,


,


Дециль


, (от 1/10 до 9/10)


Показатели вариации (колеблемости) признака

Среднее линейное отклонение
– на сколько в среднем отличаются индивидуальные значения признака от среднего его значения.


-для несгруппированных данных (первичного ряда):


-для вариационного ряда:


Среднее квадратическое отклонение


- для несгруппированных данных:


- для вариационного ряда:


Дисперсия


- для несгруппированных данных:


- для вариационного ряда:



Коэффициент вариации
(используется для характеристики однородности совокупности по исследуемому признаку)


- до 17% – совокупность совершенно однородна, 17%-33% - достаточно однородна, >33% - неоднородна.


Сложение дисперсий

Величина общей дисперсии
() характеризует вариацию признака под влиянием всех факторов, формирующих уровень признака у единиц данной совокупности


, - общая средняя арифметическая для всей совокупности


Межгрупповая дисперсия
() отражает систематическую вариацию, т. е. различия в величине изучаемого признака, которые возникают под влиянием фактора, положенного в основу группировки


,- средняя в каждой группе, - число единиц в каждой группе


Средняя внутригрупповая дисперсия
() характеризует случайную вариацию, возникающую под влиянием других, неучтенных факторов, и не зависит от условия (признака-фактора), положенного в основу группировки.


, где - дисперсия по отдельной группе


или


Равенство:


Корреляционное отношение


, >0,5 – связь между групповым фактором и результирующим признаком – тесная, <0,5 – связь слабая


Показатель асимметрии

, - центральный момент третьего порядка


Средняя квадратическая ошибка: , n
– число наблюдений


Если , асимметрия существенна и распределение признака в генеральной совокупности не является симметричным. Если , асимметрия несущественна, ее наличие объясняется влиянием случайных обстоятельств.


- правосторонняя асимметрия, - левосторонняя асимметрия.


Показатель эксцесса (островершинности)

, - центральный момент четвертого порядка


>0 – высоковершинное, < 0 – низковершинное (= -2 – предел)


Средняя квадратическая ошибка: n
– число наблюдений



Кривые распределения

Кривая линия, которая отражает закономерность изменения частот в чистом, исключающем влияние случайных факторов виде, называется кривой распределения.


Плотность распределения (расчет теоретических частот)


, - нормированное отклонение


, - определяется по таблице (приложение 1)


Критерий согласия К. Пирсона (
для проверки близости теоретического и эмпирического распределений, для проверки соответствия эмпирического распределения закону нормального распределения)


f
– эмпирические частоты в интервале,
f

– теоретические частоты в интервале





Критерий согласия Романовского


,
m
– число групп,
m
-3 – число степеней свободы при исчислении частот нормального распределения


Если к<3, то можно принять гипотезу о нормальном характере эмпирического распределения


Критерий Колмогорова


, D
– максимальное значение разности между накопленными эмпирическими и теоретическими частотами,
n
– сумма эмпирических частот


Распределение Пуассона (теоретические частоты)


,
n
– общее число независимых испытаний, λ – среднее число появления редкого события в
n
одинаковых независимых испытаниях,
m
– частота данного события, е=2,71828


Выборочное наблюдение


N – объем генеральной совокупности


n – объем выборочной совокупности (число единиц, попавших в выборку)


- генеральная средняя (среднее значение признака в генеральной совокупности)


- выборочная средняя


р – генеральная доля (доля единиц, обладающих данным признаком в генеральной совокупности)


w – выборочная доля


- генеральная дисперсия


- выборочная дисперсия


- среднее квадратическое отклонение признака в генеральной совокупности


S – среднее квадратическое отклонение признака в выборочной совокупности.


Неравенство Чебышеба


При неограниченном числе наблюдений, независящих друг от друга из генеральной совокупности с вероятностью сколь угодно близкой к 1, можно утверждать, что расхождение между выборочной и генеральной средней будет сколь угодно малой величиной .



Теорема Ляпунова


Дает количественную оценку ошибки. При неограниченном объеме из генеральной совокупности с Р расхождения выборочной и генеральной средней равна интегралу Лапласа


, - нормированная функция Лапласа (интеграл Лапласа)


Р – гарантированная вероятность


t – коэффициент доверия, зависящий от Р












Р


0,683


0,954


0,997


t


1


2


3



- предельная ошибка выборки


, - стандартная среднеквадратическая ошибка


, - предельная (максимально возможная) ошибка средней,
t
– коэффициент кратности средней ошибки выборки, зависящий от вероятности, с которой гарантируется величина предельной ошибки


, - предельная (максимально возможная) ошибка доли


Средняя ошибка (n>30) при случайной повторной выборке:


,


При случайной бесповторной выборке:


,


Формулы ошибок простой случайной выборки






















Способ отбора единиц


повторный


бесповторный


Средняя ошибка μ:


Для средней




Для доли




Предельная ошибка Δ:


Для средней




Для доли





Доверительные интервалы для генеральной средней –



Доверительные интервалы для генеральной доли –



Доверительная вероятность – функция от t, вероятность находится по приложению3



Формулы для определения численности простой и случайной выборки
















Способ отбора единиц


повторный


бесповторный


Численность выборки (n):


Для средней




Для доли*




*
В случае, когда частость w даже приблизительно неизвестна, в расчет вводят максимальную величину дисперсии доли, равную 0,25 (если w=0,5, то w(1-w)=0,25).



Типичная выборка

Применяется в тех случаях, когда из генеральной совокупности можно выделить однокачественные группы единиц (или однородные), затем из каждой группы случайно отобрать определенное число единиц в выборку.


Стандартная среднеквадратическая ошибка:


Повторный отбор - , - средняя из внутригрупповых


Бесповторный отбор -


Отбор единиц при типичной выборке из каждой типичной группы:


1.Равное число единиц , - число единиц, отобранных из
i
-ой типичной группы,
n
– общий объем,
R
– число групп


2.Пропорциональный отбор , - доля
i
-ой группы в общем объеме генеральной совокупности


3.Отбор единиц с учетом вариации случайного признака


Серийная выборка

Вместо случайного отбора единиц совокупности осуществляется отбор групп (серий, гнезд). Внутри отобранных серий производится сплошное наблюдение.


Средняя стандартная ошибка:


Повторный отбор - , , m
– число отобранных серий, - средний уровень признака в серии, - средний уровень признака для всей выборочной совокупности


Бесповторный отбор - , M
– общее число серий


Малые выборки

Выборки, при которых наблюдением охватывается небольшое число единиц (n<30)


Средняя ошибка малой выборки
,


Вероятность того, что генеральная средняя находится в определенных границах, определяется по формуле , - значение функции Стьюдента (приложение 4)


Корреляционная связь


Для оценки однородности совокупности – коэффициент вариации по факторным признакам


, совокупность однородна, если ≤ 33%




Линейный коэффициент корреляции


Несгруппированные данные


Сгруппированные данные -


Оценка существенности линейного коэффициента корреляции


при большом объеме выборки , . Если это отношение больше значения t-критерия Стьюдента (приложение 6, k=n-2, вероятность – 1-α)


при недостаточно большом объеме выборки ,


Корреляционное отношение
, , где , ,
























Признаки


А(да)


(нет)


Итого


В (да)


a


b


a+b


(нет)


c


d


c+d


Итого


a+c


b+d


n


A,b,c,d – частоты взаимного сочетания (комбинации) двух альтернативных признаков, n – общая сумма частот



Коэффициент ассоциации


Коэффициент контингенции


Уравнение регрессии

Линейная


Гиперболичская


Параболическая


Показательная




Для проверки возможности использования линейной функции определяется разность , если она <0,1 то можно применить линейную функцию.


,m
– число групп
. Если < F-критерия, то можно. (Значение F-критерия определяется по таблице (приложение 5) α=0,05, число степеней свободы числителя (k1
= m-2) и знаменателя (k2
=n-m))


Достоверность уравнения корреляционной зависимости , - средняя квадратическая ошибка,
y
– фактические значения результативного признака, - значения результативного признака, рассчитанные по уравнению регрессии,
l
– число параметров в уравнении регрессии.


Если это отношение не превышает 10-15%, то уравнение хорошо отображает изучаемую взаимосвязь.


Ряды динамики


Показатели динамики


























Показатель


Метод расчета


С переменной базой (цепные)


С постоянной базой (базисные)


Абсолютный прирост (показывает, на сколько в абсолютном выражении уровень текущего периода больше (меньше) базисного)




Коэффициент роста (показывает, во сколько раз уровень текущего периода больше (меньше) базисного)




Темп роста, % (это коэффициент роста, выраженный в %, показывает, сколько процентов уровень текущего периода составляет по отношению к уровню базисного периоа)




Темп прироста, % (показывает, на сколько % уровень текущего периода больше (меньше) уровня базисного периода)








Абсолютное значение 1% прироста (показывает, какая абсолютная величина скрывается за относительным показателем – одним процентом прироста)





Средние показатели динамики



























Показатель


Метод расчета


Средний уровень ряда


-Для интервального ряда



-Для моментального ряда с равными интервалами



-Для моментального ряда с неравными интервалами



Средний абсолютный прирост


или


Средний коэффициент рост


или


Средний темп роста, %



Средний темп прироста, %


или


Средняя величина абсолютного значения 1% прироста




Тренды

Линейный




Пусть =0, тогда если количество уровней в ряду динамики нечетное, то временные даты (t) будут (-2, -1, 0, 1, 2). Если четное, то (-5, -3, -1, 1, 3, 5)


Семестр 2 (Индексы)


Индекс – относительная величина, характеризующая изменение уровней сложных социально-экономических показателей во времени, в пространстве или по сравнению с планом.


Индивидуальный индекс физического объема выпуска продукции


Индивидуальный индекс цен


Индивидуальный индекс затрат на выпуск продукции


Индивидуальный индекс стоимости продукции


Агрегатный индекс физического объема продукции
(Относительное изменение физического объема продукции в отчетном периоде по сравнению с базисным)


- характеризует абсолютное изменение физического объема в относительном выражении без влияния ценового фактора.


Средний взвешенный арифметический индекс физического объема продукции
, iq
– индивидуальный индекс по каждому виду продукции


Средний взвешенный гармонический индекс физического объема продукции


Агрегатный индекс цен
(характеризует среднее изменение цен по совокупности различных видов продукции)


- абсолютное изменение всей стоимости продукции за счет изменения цен


Агрегатный индекс цен
(характеризует среднее изменение цен на потребительские товары)


Агрегатный индекс затрат на выпуск всей продукции


Двухфакторный индекс


Связь:


Индекс планового задания


Индекс степени выполнения плана


Связь:


Изменение себестоимости продукта А по фирме , средняя себестоимость -


Индекс влияния структурных сдвигов в объеме продукции
, d
0
– удельный вес каждого предприятия в общем объеме выпуска продукта А


Абсолютное изменение общей стоимости продукции за счет двух факторов: , за счет изменения физического объема продукции -, за счет изменения цен на продукцию -


Абсолютное изменение общих затрат на выпуск продукции за счет двух факторов: , за счет изменения физического объема продукции - , за счет среднего изменения себестоимости единицы продукции - .


Выработка
- W = Q/T , W
– выработка,
Q
– физический объем реализованной продукции/услуг,
T
– затраты живого труда (среднесписочная численность работников/рабочих)


Трудоемкость
(показатель, обратный выработке) - t = 1/W = T/Q Трудоемкость характеризует величину затрат рабочего времени на единицу произведенной продукции.


Индекс динамики выработки переменного состава
, определяющий отношение выработки отчетного периода к выработке базисного периода - Iw
= W1
/W0


Этот индекс характеризует изменение производительности труда под влиянием всех факторов, а именно: НТП, человеческого фактора (квалификация и т.п.) и др.


Индекс динамики трудоемкости
- It
= t1
/t0


Индекс динамики трудоёмкости характеризует изменение трудоёмкости в отчетном периоде по сравнению с базисным, и его величина зависит от изменения трудоёмкости производимой продукции и от изменения объемов производства этой продукции.


IQ
= IW
* IT
– система связанных индексов, которая позволяет определить влияние интенсивных и экстенсивных факторов на изменение объема продукции, услуг.


Среднегодовая стоимость основных фондов
в базисном и отчетном годах - , - введенные в эксплуатацию фонды в течение года, - число месяцев эксплуатации фондов в данном году, - фонды, выбывшие из эксплуатации в течение года, - число месяцев, оставшихся до конца года после выбытия фондов из эксплуатации.


Фондоотдача
-.


Фондоёмкость
– показатель, обратный фондоотдаче, за базисный и отчетный годы по формуле


Индекс динамики фондоотдачи
IV
п.с.
= = Этот индекс характеризует изменение фондоотдачи под влиянием всех факторов, включая НТП (новая техника, технология), человеческий фактор, структурный фактор, который на уровне АО может выражаться в изменении состава основных фондов в отчетном по сравнению с базисным годом.


Индекс динамики фондоемкости


Влияние интенсивного (качественного) и экстенсивного (количественного) факторов
на абсолютное изменение физического объема продукции/услуг. Под экстенсивным фактором обычно понимают абсолютное изменение основных фондов. Под интенсивным – абсолютное изменение показателя фондоотдачи.


Влияние экстенсивного фактора:


Влияние интенсивного фактора:


Влияние обоих факторов
:


Показатели фондовооруженности рабочих
, - среднесписочная численность рабочих
.


Индекс динамики фондовооруженности:


Коэффициент износа основных фондов
на конец отчетного года


Износ фондов
на конец отчетного года

Сохранить в соц. сетях:
Обсуждение:
comments powered by Disqus

Название реферата: Группировка статистических данных и ее роль в анализе информации

Слов:2883
Символов:27109
Размер:52.95 Кб.