Международный институт экономики и права
Белорецкий филиал
Статистика
Белорецк 2009 г.
Содержание
1. Предмет и метод статистики
2. Основные категории статистики как науки
3. Статистическое наблюдение и сводка
4. Группировка статистических данных. Способы представления статистических результатов
5. Относительные и средние величины
6. Показатели вариации
7. Выборочное наблюдение
8. Анализ рядов динамики
9. Изучение взаимосвязей
10. Индексы
Список использованной литературы
1. Предмет и метод статистики
Статистика – это практическая деятельность по сбору, накоплению, обработке и анализу цифровых данных. Предметом изучения статистики
служат различные общественные социально-экономические явления, исследование которых связано с количественной характеристикой и выявлением присущих им закономерностей.
Специфические приемы, с помощью которых статистика изучает свой предмет, образует статистическую методологию. Под статистической методологией
понимается система приемов, способов и методов, направленных на изучение количественных закономерностей, проявляющихся в структуре, динамике и взаимосвязях социально-экономических явлений.
Основным методом является статистическое исследование, состоящее из трех стадий (статистическое наблюдение, сводка и группировка результатов наблюдения и анализ полученных сводных материалов). Прохождение каждой стадии исследования связано с использованием специальных методов (массовые наблюдения, группировки, обобщающие показатели, динамические ряды индексы).
Коренным вопросом осуществления радикальной экономической реформы является переход от командно – административной формы управления к экономической. Это ставит перед статистикой как составной частью системы управления народным хозяйством новые задачи.
Исходя из изменений характера управления, основными задачами статистики являются:
1. Всестороннее исследование происходящих в обществе глубоких преобразований экономических и социальных процессов на основе научно обоснованной системы показателей.
2. Обобщение и прогнозирование тенденций развития народного хозяйства.
3. Выявление имеющихся резервов эффективности общественного производства.
4. Своевременное обеспечение надежной информацией законодательной власти, управленческих, исполнительных и хозяйственных органов, а также широкой общественности.
Возвращение статистике широкого общественного предназначения определяет главные направления ее развития: совершенствование анализа статистической информации, упорядочение отчетности, обеспечение ее достоверности. Важен переход от сплошной отчетности к несплошным видам статистического наблюдения: единовременным учетам, выборочным и монографическим обследованиям. Это прямо вытекает из изменения положений предприятий в условиях рыночной экономики, из разнообразия форм кооперирования, динамичности их организационно – экономических процессов.
2. Основные категории статистики как науки
Изучаемые статистикой явления, как правило, состоят из множества отдельных элементов и фактов – они называются статистическими совокупностями и служат предметом статистики. Явления и процессы изучаются статистикой посредством статистических показателей и признаков. Статистический показатель – это количественная оценка свойства изучаемого явления. В зависимости от целевой функции статистических показателей их разделяют на 2 вида: учетно-оценочные и аналитические.
Учетно-аналитические показатели –
это статистическая характеристика размера качественно определенных социально-экономических явлений в конкретных условиях места и времени.
Они отражают:
1) объемы распространенности в пространстве;
2) достигнутые уровни развития на определенный момент (дату).
Аналитические показатели
– применяются для анализа статистической информации и характеризуют особенности развития изучаемых явлений:
1) типичность признака;
2) соотношение его отдельных частей;
3) меру распространения в пространстве;
4) скорость развития во времени.
Понятие признак тесно связано с показателем.
Под признаком
– понимается характерное свойство изучаемого явления, отличающее его от других явлений.
Статистические признаки выражаются:
1) смысловыми понятиями
, их называют атрибутивными (пол человека: мужской или женский; спецмагазины: продовольственный, хозяйственный);
2) числовыми значениями
– количественными (возраст, размер заработной платы).
Если признак имеет разные значения-то он называется варьирующим
, а его значение – вариантом
. Различают дискретные
(прерывные) и непрерывные признаки.
В статистических исследованиях признаки бывают:
1) основные
(существенные), т.е. определяют главное содержание изучаемого явления;
2) второстепенные –
не связанные непосредственно с основным их содержанием.
Различают также результативные и факторные признаки.
3. Статистическое наблюдение и сводка
- Первым этапом статистического исследования
является сбор первичной статистической информации посредством статистического наблюдения.
Статистическое наблюдение
– научно организованный сбор массовых первичных данных о явлениях и процессах общественной жизни.
Информация должна отвечать требованиям, т.е. быть объективной, достаточно полной, чтобы обеспечить достоверность выводов о характере и закономерностях развития изучаемого объекта.
Не всякое собирание сведений может быть названо статистическим наблюдением. Статистическим можно назвать такое наблюдение, которое обеспечивает регистрацию устанавливаемых фактов в учетных документах для последующего их обобщения. То есть – это информация, содержащаяся в установленных формах отчетности предприятий.
Статистическое наблюдение должно отвечать следующим требованиям:
1) Наблюдаемые явления должны иметь научную или практическую ценность, выражать определенные социально-экономические типы явлений.
2) Массовые данные должны обеспечивать полноту фактов.
3) Контроль качества собираемых фактов должен обеспечивать достоверность данных.
Наблюдение должно проводиться по разработанной программе, включая методологию и организационные вопросы.
Организационные формы статистического наблюдения
Наблюдение осуществляется в двух формах:
1) посредством отчетности и
2) специально организованных наблюдений или обследований.
Отчетность
– организованная форма статистического наблюдения, при которой сведения поступают в определенные сроки и по утвержденным формам.
Сведения, представляемые в отчетности, могут относиться к разным по продолжительности периодам времени. Поэтому различают отчетность: суточную, декадную, месячную, квартальную, полугодовую, годовую. Такая отчетность называется текущей (кроме годовой).
Отчетность подразделяется на общегосударственную
, которая представляется как в вышестоящую организацию, так и в соответствующие органы государственной статистики и ведомственную
– представляется только в вышестоящие органы.
Виды статистического наблюдения различаются:
1) по времени регистрации данных;
2) по степени охвата единиц исследуемой совокупности.
I. По времени: непрерывное или текущее и прерывное (периодическое), единовременное.
Текущее
– систематическое, то есть регистрация фактов по мере их свершения. Не допускается значительный разрыв между моментом возникновения факта и моментом его регистрации.
Прерывное
– повторяется через определенные периодическое промежутки времени (переписи).
Единовременное
(разовое) – по мере надобности.
II. По степени охвата:
Сплошные
– при котором обследованию подвергаются все без исключения единицы изучаемой совокупности. Пример: Всесоюзная перепись населения 1989 г.
Несплошные
– заранее установленная часть изучаемой совокупности:
а) наблюдение основного массива
– обследуется та часть совокупности, у которой величина изучаемого признака является преобладающей во всем объеме. Этот вид наблюдения возможен, когда известен весь состав совокупности и можно заранее решать, какие единицы малозна
чимы.
б) выборочное наблюдение
– вид несплошного обследования, при котором характеристика всей изучаемой совокупности дается по некоторой их части, отобранной в случайном порядке.
в) анкетное
– вид несплошного наблюдения, основан на принципе добровольного заполнения анкет. Предусматривается, что возврат будет неполным, точность – невысокая.
г) монографическое
– детальное, глубокое изучение и описание отдельных, характерных единиц совокупности.
Способы статистического наблюдения:
Документальный учет
фактов – источником сведений являются соответствующие документы. Точность большая.
Экспедиционный способ
– лица-регистраторы или счетчики сами устанавливают факты учета путем непосредственного наблюдения на основании документов или опроса соответствующих лиц и сами заполняют формуляр наблюдения – материалы доброкачественные.
Явочный
– человек сам дает необходимые сведения. Явочным способом собираются сведения о родившихся, умерших.
Корреспондентский
– сведения в органы, ведущие наблюдение, сообщают их корреспонденты. В связи с создание статистической информационной системы (АСИС) во многом меняется организация сбора, обработки и доставки в статистические органы данных наблюдения. АСИС позволит обеспечить надежной, качественной информацией потребности управления экономикой как на отраслевом так и региональном уровне.
Программно-методологические формы наблюдения:
1) Определение цели; 2) объекта; 3) единицы наблюдения; 4) разработка программы наблюдения; 5) проектирование формуляров; 6) составление текста инструкции; 7) источники информации; 8) способы сбора данных.
Цель наблюдения – это основной результат статистического наблюдения.
Объект – совокупность единиц изучаемого явления.
Единица наблюдения – первичный элемент объекта статистического наблюдения, являющийся носителем признаков, подлежащих регистрации, и основой ведущегося при обследований счета.
Единица совокупности – первичная ячейка-носитель необходимых статистических сведений.
Пример
: объем розничного товарооборота единица наблюдения – магазин, единица совокупности – акты купли-продажи
Программа статистического наблюдения – перечень изучаемых показателей.
Статистические формуляры – бланки определенных форм учета и отчетности (титульная, адресная часть). Бывают:
индивидуальные
– сведения об 1 единице совокупности
списочные
– по несколько единиц совокупности
Инструкция – отражает цель, объект, единицы наблюдения, способы проведения обследования и др.
Для успешного проведения статистического наблюдения разрабатывается организационный план:
1) органы наблюдения; 2) время наблюдения (сезон, период, критический момент); 3) сроки наблюдения; 4) подготовительные работы;
5) обучение кадров; 6) порядок проведения статистического наблюдения; 7) прием материалов; 8) представление предварительных и окончательных результатов.
Время наблюдения – время, к которому относятся данные собранной информации, то есть устанавливается единое время регистрации показателей.
Сезон (время года) – время начала и окончания сбора сведений.
Критический момент – в выбранном периоде намечается определенный момент, по состоянию на который должны регистрироваться все сведения.
Ошибки статистического наблюдения:
Полнота, точность и достоверность собираемой статистической информации – задача статистического наблюдения.
Точность – уровень соответствия величины изучаемого показателя показателю, получаемому посредством статистического наблюдения, действительному его значению.
Ошибки – отклонения между исчисленными показателями и действительными величинами исследуемых явлений.
Выделяют ошибки регистрации и ошибки репрезентативности.
Для сплошного и несплошного наблюдения:
Ошибки регистрации
– 1) неправильное установление фактов в процессе наблюдения;
2) неправильная их запись.
Ошибки подразделяются на: случайные и систематические.
Случайные ошибки – ошибки регистрации как со стороны опрашиваемого, так и регистраторов.
Систематические – преднамеренные и непреднамеренные (за счет неисправности измерительных приборов).
Ошибки репрезентативности – для несплошного наблюдения – возникают в результате того, что состав отобранной для обследования части единиц совокупности недостаточно полно отображает состав всей изучаемой совокупности, могут быть случайными и систематическими.
Случайные – отклонения, возникающие при несплошном наблюдении из-за того, что совокупность отобранных единиц наблюдения неполно воспроизводит всю совокупность в целом. Величина случайной ошибки репрезентативности может быть оценена с помощью соответствующих математических методов.
Систематические – отклонения, возникающие вследствие нарушения принципов случайного отбора единиц изучаемой совокупности. Размеры ошибки количественной оценке не поддаются.
Для выявления и устранения допущенных при регистрации ошибок применяются счетный и логический контроль исходной информации.
Счетный – проверка арифметических расчетов.
Логический – проверка ответов на вопросы программы наблюдения путем их логического осмысления.
- Статистическая сводка – 2-ой этап статистического исследования
–
систематизация единичных фактов, позволяющая перейти к обобщающим показателям, осуществляющая анализ и прогнозирование изучаемых явлений и процессов.
Статистические сводки различаются по ряду признаков: 1) по сложности построения; 2) методу проведения; 3) способу обработки материалов статистического наблюдения.
Сводка определяет общий размер изучаемого явления по заданным показателям – это простая сводка. Может быть вспомогательная, служащая для дальнейшего изучения.
Статистическая сводка
предполагает: 1) систематизацию; 2) группировку исходных данных; 3) характеристику образованных групп системой показателей; 4) подсчет итогов; 5) представление результатов сводки в виде таблиц и графиков.
Вся эта работа подразделяется на 3 этапа:
1). Формулировка задачи сводки на основе целей статистического исследования.
2). Формирование групп и подгрупп, определение группировочных признаков, установление вида группировок, числа групп и величины интервала.
3). Математические расчеты итогов, показателей. Контроль.
Способ разработки статистической сводки
: централизованный и децентрализованный в условиях рынка.
Статистическое исследование расчленяет множество единиц изучаемой совокупности на различающиеся между собой, но внутренне однородные части и одновременно с этим объединяет их в типические группы по существенному для них признаку. Группировки позволяют уловить переход количественных изменений в качественные, выявить закономерности их развития.
4. Группировка статистических данных. Способы представления статистических результатов
Группировка – это процесс образования однородных групп на основе расчленения статистической совокупности на части или объединение изучаемых единиц в частные совокупности по существенным для них признакам. В результате объект разделяется на группы по группировочным признакам или основаниям группировки. Значение группировок в том, что они раскрывают объективное положение вещей и выявляют самые существенные черты и свойства изучаемых явлений, а также позволяют получать информацию о размерности отдельных групп, соотношении их в общей совокупности и о связях между изучаемыми показателями и признаками, положенными в основу группировки.
Метод группировок применяется для решения 3‑х задач:
1) выделения социально-экономических типов;
2) изучения структуры и структурных сдвигов;
3) характеристики взаимосвязи между признаками изучаемого явления.
Известны группировки: простые, типологические, структурные, аналитические, комбинированные.
- Простые – группировки по одному признаку.
- Комбинированные – группировки по нескольким признакам.
- Структурные – изучение их структуры и состава.
- Вторичные – образование новых групп на основе имеющейся группировки.
При распределении единиц совокупности по группам определяются:
1) количество групп
2) величина интервала.
Количество групп зависит от того, какой признак в основании группировки. Если: 1) атрибутивный, то он определяет число групп;
2) дискретный количественный, но изменяющийся в незначительном диапазоне (число секций в магазине);
3) интервал устанавливается при значительной колеблемости дискретного признака.
Величина – разность между максимальным и минимальным значениями признака в каждой группе.
Число групп связано с объемом совокупности.
Американский ученый Стерджесс предложил формулу определения числа групп n
при известной численности совокупности N
:
Размах колеблемости или вариации определяется:
Величина интервала определяется
Способы представления статистических результатов
Результаты сводки и группировки материалов наблюдения представляются в виде статистических таблиц.
Макет таблицы – составленная, но не заполненная таблица.
Подлежащее
– объекты или их части, отдельные территории и периоды времени, характеризующиеся показателями.
Сказуемое
– показатели, которыми характеризуются подлежащее.
В зависимости от построения подлежащего таблицы делятся на: перечневые, групповые и комбинированные.
Простые:
1) перечневые (меню) – носят описательный характер
2) территориальные
3) хронологические.
Групповые: подлежащее представлено группами по признаку или связи между показателями (по производит. -7 групп).
Комбинационные: каждая группа подлежащего сформирована по одному признаку, делится на подгруппы - по второму признаку. Каждая вторая подгруппа делится по третьему признаку.
Устанавливаются взаимное действие на результативные признаки и существующая связь между факторами группировки.
Статистические графики – чертеж, на котором при помощи условных геометрических фигур изображаются статистические данные.
Графический метод является продолжением и дополнением табличного метода.
Основные элементы графика:
1) графический образ, т.е. знаки – символы) линии, фигуры) с помощью которых изображаются статистические величины;
2) поле графика – место, где размещены графические образы.
3) пространственные ориентиры – определяется размещение графических образов на поле (координатная сетка)
4) масштабные ориентиры – количественная значимость:
а) масштаб графика – мера перевода численной величины в графическую (например: 1 см = 100 тыс. руб.)
б) масштабная шкала
– линия, отдельные точки которой читаются как определенные числа. Бывают: прямолинейные, криволинейные.
5) экспликация графика
– пояснение его содержания, включает в себя заголовок графика, объяснения масштабных шкал, пояснения отдельных элементов графического образа.
6) заголовок графика
– пояснение основного содержания.
Классификация статистических графиков. В основе лежит ряд признаков: 1) по способу построения; 2) форме применения графических образов; 3) характеру решаемых задач.
1. По способу построения
различают: диаграммы, картограммы, картодиаграммы.
- Диаграмма – графическое изображение статистических величин с помощью различных геометрических фигур или знаков:
1. Столбиковые
– ряд прямоугольников с одинаковым основанием, высота которых пропорциональна численности значениям показателей. Столбики строятся на базовой линии, оси «х» – ов.
2. Ленточные
– основания – вертикально, масштабная шкала – ось «х» – ов.
Столбиковые диаграммы
(рост товарооборота)
Ленточные диаграммы
(выполнение плана)
3. Линейные диаграммы
– для их построения применяется система прямоугольных координат. На оси «х
» - отражаются варианты показателя (время), на оси «у»
- величина изучаемого показателя (рост объема товарооборота).
4. Объемные диаграммы:
а) круговые – площадь окружности принимается за величину всей изучаемой статистической совокупности, а площади отдельных секторов отображают удельный вес ее составных частей: 100% = 360о
% определения в общем объеме товаров
б) радиальные – на базе полярных координат, началом отсчета служит центр окружности, а носителями масштабных шкал являются радиусы круга. Различают замкнутые и спиральные диаграммы.
5. Фигурные диаграммы
– статистические данные изображаются рисунками – символами (не всегда точно отражают данные).
6. Знаки Варзара
(русский статистик) – применял прямоугольные фигуры для графического изображения 3-х показателей, один из которых равен произведению двух других:
- 2. Картограмма – схематическая карта, на которой отдельные территории в зависимости от показателей обозначаются с помощью графических символов (штриховки, расцветки, точки).
а) фоновые
– различные цвета, штриховка
б) точечные
– в качестве графического знака используются точки одинакового размера.
- 3. Картодиаграмма – сочетание контурной карты с диаграммой.
Геометрические символы – столбики, круги размещаются по всей карте.
II. В зависимости от формы применения графических образов
статистические графики могут быть:
1) точечными
– совокупность точек
2) линейными
3) плоскостными
– прямоугольники, квадраты
4) фигурными.
III. В зависимости от характера решаемых задач
:
1) статистические графики рядов распределения
2) структуры статистической совокупности
3) рядов динамики
4) показателей связи
5) показателей выполнения заданий.
Статистические ряды распределения
Результаты сводки и группировки материалов статистического наблюдения оформляются в виде статистических рядов распределения.
Статистические ряды распределения представляют собой упорядоченое расположение единиц изучаемой совокупности на группы по группировочному признаку.
Они характеризуют состав (структуру) изучаемого явления, позволяют судить об однородности совокупности, границах ее изменения, закономерностях развития наблюдаемого объекта.
Ряды распределения, образованные по качественным признакам, называются атрибутивными
.
При группировке ряда по количественному признаку получаются вариационные ряды
(дискретные, интервальные).
Вариационные ряды состоят из 3‑х элементов:
1) варианты – отдельного значения варьируемого признака, которое он принимает в ряду распределения.
2) частоты – численности отдельных вариант или каждой группы вариационного ряда.
3) частости – частот, выраженных в долях единицы или в процентах к итогу.
Сумма частот составляет объем ряда распределения.
Интервальный ряд распределения изображается графически в виде гистограммы. На оси «х
»- отображаются интервалы ряда, высота которых равна частотам, отложенным на оси «у
».
Гистограмма
Кумулята распределения
Накопленные частоты в основе графика в виде кумуляты называются кривой сумм. Это кривые концентрации называются кривыми Лоренца.
5. Относительные и средние величины
Абсолютные величины.
Обобщающие показатели – это полученные в результате статистической сводки и выраженные в таблицах статистические данные, характеризующие совокупность в целом или отдельные ее части.
Абсолютные обобщающие величины получают в результате сводки путем суммирования первичного статистического материала или расчетов на основе других показателей (приросты, вторичные показатели).
По способу выражения размеров изучаемых явлений абсолютные величины подразделяются на индивидуальные и суммарные.
Индивидуальные
– характеризуют размеры количественных признаков у отдельных единиц наблюдения.
Абсолютные показатели всегда являются именованными числами, т.е. имеют определенную размерность. Единицы измерения бывают:
1) натуральные –
соответствуют природным или потребительским свойствам предмета. Могут быть простыми
– кг, т, км, сложными
– чел.-час.
2) денежные
– стоимостные (руб., млн. руб.)
3) трудовые единицы измерения
– чел.-день
4) условные натуральные единицы
– служат для сопоставимости. Например, в сельском хозяйстве – усл. га пашни, усл. поголовье.
Относительные величины – качественная оценка экономических явлений, рассчитываются как частное от деления двух статистических величин и характеризуют количественное соотношение между ними. В числителе – показатель изучаемого явления, в знаменателе – показатель, с которым производится сравнение, т.е. база сравнения.
Вычисления производят в долях или процентах.
Основание сравнения – 100 – в %, 1000 – в промилле, 10000 – в децимилле.
По своему познавательному значению относительные величины подразделяются на следующие виды:
I. Результат сопоставления одноименных статистических показателей –
Направления сопоставления:
II. Результат сопоставления разноименных статистических показателей:
1) Показатель выполнения плана соответствует фактическому выполнению плана.
2) Относительные величины структуры – характеризуют состав изучаемых совокупностей.
Исчисляются они как отношение абсолютной величины каждого из элементов совокупности к абсолютной величине всей совокупности, т.е. как отношение части к целому и представляют собой удельный вес части в целом.
3) Относительные величины динамики – характеризуют изменение изучаемого явления во времени, определяют направление развития, измеряют интенсивность развития. Рассчитываются в виде темпов роста и других показателей динамики.
4) Относительные величины сравнения – характеризуют количественное соотношение одноименных показателей, относящихся к различным объектам наблюдения.
5) Относительные величины координации – разновидность показателей сравнения. Применяются для характеристики соотношения между отдельными частями статистической совокупности и показывают, во сколько раз сравниваемая часть совокупности больше или меньше части, которая принимается за основание сравнения, т.е. характеризует структуру изучаемой совокупности.
6) Относительные величины интенсивности – показывают, насколько широко распространено изучаемое явление в среде. Они характеризуют соотношение разноименных, но связанных между собой абсолютных величин. Выражаются именованными величинами. Рассчитываются делением абсолютной величины изучаемого явления на абсолютную величину, характеризующую объем среды, в которой происходит развитие явления. Относительная величина показывает, сколько единиц одной совокупности приходится на единицу другой совокупности.
Обобщающие статистические показатели отражают количественную сторону изучаемой совокупности общественных явлений, т.е. представляют собой их величину, выраженную соответствующими единицами измерения.
Статистические показатели имеют взаимосвязанные количественную и качественную стороны. Качественная сторона показателя – его содержание. Количественная сторона – числовое значение.
Средние величины
Теория средних величин занимает одно из центральных мест в общей теории статистики. Средние величины широко применяются не только в статистике, но и во многих других науках, в управленческой деятельности, научно-исследовательской работе.
Под средней величиной понимается обобщенная количественная характеристика признака в статистической совокупности. Средняя выражает величину признака, отнесенную к единице совокупности и абстрагированную от индивидуальных особенностей отдельных единиц.
Благодаря этой абстракции создаются предпосылки для выявления характерных, типичных размеров признака в совокупностях, для изучения свойств и закономерностей массовых общественных явлений в конкретных условиях места и времени.
В средних величинах погашаются индивидуальные различия единиц совокупности, обусловленные случайными обстоятельствами. В средних величинах находят выражение общие, закономерные черты, свойственные всей совокупности явления. Это свойство средних предопределяет использование их в качестве основного метода статистической науки.
Итак, средние величины – это обобщающие показатели, в которых находят выражение действие общих условий, закономерность изучаемого явления. Статистическая средняя будет объективна и типична, если она рассчитывается по массовым данным для качественно однородной совокупности (массовых явлений). Средняя отражает то общее, что складывается в каждом отдельном, единичном объекте. Благодаря этому средняя получает большое значение для выявления закономерностей, присущих массовым явлениям и не заметных в единичных явлениях. Отклонение индивидуального от общего – проявление процесса развития.
Каждая из конкретных средних выражает определенное свойство совокупности, описанное функцией f
(х1, х2…, х n
), раскрытие которой приводит к установлению различных видов средних величин
.
- Средняя арифметическая – наиболее распространенный вид средней. Она исчисляется в тех случаях, когда объем осредняемого признака образуется как сумма его значений у отдельных единиц изучаемой статистической совокупности.
1) арифметическая простая рассчитывается, когда дан ряд одиночных значений признака
2) арифметическая взвешенная рассчитывается при определении среднего значения признака по ряду распределения, когда одно и то же значение признака встречается несколько раз.
Для исчисления проводится умножение каждого варианта на его частоту, суммирование полученных произведений и деление полученной суммы на сумму частот.
- Средняя гармоническая – это величина, обратная средней арифметической, когда k = – 1 (по схеме в ПТК.)
Когда статистическая информация не содержит частот по отдельным вариантам совокупности, а представлена как их произведение, применяется формула средней гармонической взвешенной.
- Средняя геометрическая – это величина, используемая как средняя из отношений или в рядах распределения, представленная в виде геометрической прогрессии. Этой средней удобно пользоваться, когда уделяется внимание не абсолютным разностям, а отношением двух чисел. Средняя геометрическая используется а расчетах среднегодовых темпов роста.
Мода
– чаще всего встречающийся вариант, или значение признака, который соответствует максимальной точке теоретической кривой распределения.
1). Для дискретных рядов – вариант, имеющий наибольшую частоту.
2). В интервальном вариационном ряду – модальный интервал определяется по наибольшей частоте или по наибольшей плотности распределения.
Во многих случаях при характеристике совокупности в качестве
обобщенного показателя отдается предпочтение моде, а не средней арифметической:
1) при изучении цен на рынках фиксируется и изучается в динамике не средняя цена на определенную продукцию, а модальная;
2) при изучении спроса населения на определенный размер обуви или одежды представляет интерес определение модального номера;
3) при характеристике типичности: если средняя арифметическая близка по значению к моде, значит она типична.
Медиана
– значение признака у средней единицы ранжированного ряда (т.е. ряда, у которого значения признака записаны в порядке возрастания или убывания). Рассчитывается:
1) для ранжированного ряда с нечетным числом членов медианой является варианта, расположенная в центре ряда; 2) с четным числом членов – средняя арифметическая из двух смежных вариант.
В интервальном вариационном ряду:
1) ранжируем индивидуальные значения признака;
2) определяем для ряда накопленные частоты;
3) по данным о накопленных частотах находим медианный интервал.
6. Показатели вариации
Вариация признака – различие индивидуальных значений признака внутри изучаемой совокупности. Термин variatio
(лат) – изменение, колеблемость, различие.
Под вариацией в статистике понимают такие количественные изменения величины исследуемого признака в пределах однородной совокупности, которые обусловлены перекрещивающимся влиянием действия различных факторов.
Вариацию признака различают: случайную и систематическую.
Показатели вариации:
1). Размах вариации или амплитуда колебания:
2). Обобщающую характеристику распределению отклонений дают средние линейные отклонения:
а) для арифметической простой:
б) для арифметической взвешенной:
Меру вариации более объективно отражает показатель дисперсии (средний квадрат отклонений) – есть отклонение суммы квадратов отклонений индивидуальных значений признака от их средней к численности совокупности:
а) для арифметической простой:
б) для арифметической взвешенной:
Среднее квадратическое отклонение
– есть корень квадратный из дисперсии:
Показатели относительного рассеивания – для характеристики меры колеблемости изучаемого признака исчисляются показатели колеблемости в относительных величинах. Они позволяют сравнивать характер рассеивания в различных распределениях.
Расчет показателей меры относительного рассеивания осуществляют как отношение абсолютного показателя рассеивания к средней арифметической, умножаемое на 100%.
а) коэффициент осцилляции – отражает относительную колеблемость крайних значений признака вокруг средней:
б) относительное линейное отклонение – характеризует долю усредненного значение абсолютных отклонений от средней величины:
в) коэффициент вариации – показатель колеблемости используемый для оценки типичности средних величин:
Если v
>40% – колеблемость признака большая.
Понятие о моментах распределения – характеристике вариационного ряда.
Моментом k‑го порядка называется средняя арифметическая из k‑той степени отклонений отдельных вариантов от некоторой постоянной величины А:
В статистике находят применение моменты первых четырех порядков.
Если:
А – произвольное число, то момент называется условным
А=0 – момент называется начальным
Общая формула:
– средняя вариационного ряда
– средняя арифметическая из квадратов вариантов
;
– центральные моменты обозначаются
Общая формула:
Основные характеристики вариационного ряда распределения
Средняя арифметическая
Мода:
Медиана:
;
4. Размах вариации:
Квартильное отклонение
Среднее линейное отклонение:
а) для арифметической простой
б) для арифметической взвешенной
Дисперсия:
а) для арифметической простой
б) для арифметической взвешенной
Среднее квадратическое отклонение:
Центральные моменты распределения:
Коэффициент скошенности – асимметрии:
Показатели эксцесса (островершинности)
7. Выборочное наблюдение
Из всех видов несплошного наблюдения в статистической практике наибольшее распространение получило выборочное наблюдение.
Выборочным называется такой вид наблюдения, результаты которого дают возможность судить о всей совокупности единиц при обследовании только части ее. Совокупность, из которой отбирают единицы для выборочного наблюдения, называется генеральной, а часть, подвергающуюся наблюдению – выборочной.
Основная задача выборочного наблюдения – получить показатели, пригодные для характеристики генеральной совокупности.
Преимущества выборочного метода:
1) сроки обследования уменьшаются, так как обследуется только часть совокупности;
2) уменьшаются затраты труда;
3) уменьшаются затраты материальных средств;
4) повышается оперативность информации;
5) сокращается число единиц наблюдения, поэтому уменьшается количество ошибок регистрации.
В условиях перехода к рынку для принятия оперативных решений нужна надежная информация и это способствует более широкому применению выборочного метода наблюдения.
Основные условия научного применения выборочного метода:
1) достаточная численность выборочной совокупности;
2) равная возможность каждой единицы генеральной совокупности попасть в выборку.
По способу организации отбора различают:
1. индивидуальный отбор – отбирают отдельные единицы;
2. групповой – отбираются качественно однородные группы или серии единиц;
3. комбинированный отбор – комбинация индивидуального и группового отбора.
Выборка может быть:
· собственно-случайной;
· механической;
· типической (или районированная);
· серийной (или гнездовая);
· комбинированной.
I. Собственно-случайная – при которой отбор единиц в выборочную совокупность производится 3 непосредственно из всей массы единиц генеральной совокупности. При этом каждой единице совокупности обеспечивается одинаковая вероятность быть отобранной благодаря случайности отбора. Случайный отбор может осуществляться в виде повторного отбора и бесповторного.
Повторная выборка – при этом каждая отобранная из генеральной совокупности единица вновь возвращается в нее после обследования. Т.е. при новом исследовании единица может опять попасть в выборку.
Бесповторная выборка – каждая отобранная единица исключается из числа генеральной совокупности, т.е. может попасть в выборку один раз.
II. Механическая выборка – разновидность собственно-случайной.
Например
: 20% отбор – наблюдению подвергается каждая 5 единица.
III. Типическая, или районированная – вся генеральная совокупность предварительно подразделяется на качественно-однородные по существенному признаку группы, а затем уже из этих групп производится случайный отбор n
единиц.
Отбор единиц почти прямо пропорционален численности групп:
если учитывается вариация изучаемого признака, которая измеряется средним квадратическим отклонением (s
i
):
IV. Серийная (гнездовая) выборка – отбору подлежат группы единиц совокупности. Они могут быть связаны: территориально; организационно (группы, предприятия); упаковкой (ящик, пачка); во времени (продукция за определенный период).
Моментные выборочные обследования – метод моментных наблюдений - изучает наличие или длительность отдельных элементов процесса, явления. Метод предложен в 1938 году английским статистиком Типпетом.
Пример
: определение структуры рабочего времени оборудования (работа, наладка, простой). То есть определяется состояние единиц наблюдения в определенный момент наблюдения.
Для определения числа моментов обследования n
применяется формула:
, где
w
– доля изучаемого признака в выборке;
d
– относительная величина предельной ошибки выборки, %.
t
– коэффициент доверия зависит от вероятности ошибки.
Ошибки выборки:
1. ошибки регистрации
2. ошибки репрезентативности
.
I. Ошибки регистрации зависят от:
подготовленности счетчика
ошибочных ответов наблюдаемых
способа наблюдения.
При хорошей организации они должны быть меньше, чем при сплошном обследовании.
II. Ошибки репрезентативности свойственны только выборочному методу, показывают величину расхождения между показателями выборочной и генеральной совокупности. Имеют систематический или случайный характер.
Систематическая ошибка – ошибка появляется в результате нарушения случайности отбора (в сторону уменьшения или увеличения).
Случайная ошибка – имеет одинаковую величину вероятности в сторону увеличения или в сторону уменьшения изучаемого показателя, так как исследуется часть, а не вся совокупность.
Определение ошибки выборки:
Возможные расхождения между характеристиками выборочной и генеральной совокупности измеряются средней ошибкой выборки
, генеральная совокупность численность выборки при проведении выборочных исследований s
0
неизвестна.
Между дисперсиями выборочной и генеральной совокупности существует следующее соотношение:
Если n
достаточно велико, то
Поэтому на практике применяется следующая формула:
дисперсия выборки
Для показателя средней величины дисперсии количественного признака в выборке определяется по формуле:
– для случайной выборки при повторном отборе
При бесповторном отборе численность генеральной совокупности N в ходе выборки сокращается, в формулу включают дополнительный множитель
, если пренебречь единицей в знаменателе при больших значениях N:
для бесповторного отбора
Ошибка при определении доли
Для определения ошибок выборки при установлении доли тех или иных единиц в совокупности генеральная дисперсия заменяется показателем дисперсии альтернативного признака: pq
по теории вероятности 1= p+q, но поскольку р – генеральная доля неизвестна, то практически вместо нее принимается выборочная частость w:
для повторного отбора
для бесповторного отбора
Предельная ошибка выборки
Расхождение между выборочной средней и генеральной может быть:
I.
средняя ошибка выборки
II. Каждое расхождение имеет различную вероятность.
Поэтому рассматриваем как некую предельную ошибку, но она:
связана со средней ошибкой m
гарантирует определенную вероятность – р
, где D – предельная ошибка;
m
– средняя ошибка;
t
– коэффициент доверия – зависит от вероятности, с какой определена предельная ошибка.
Формула предельной ошибки выборки вытекает из основных положений теории выборочного метода, сформулированной в ряде теорем теории вероятностей, отражающих закон больших чисел.
III. Одной из главных является теорема Чебышева: «сколь угодно близка к единице вероятность того, что при достаточно большом объеме выборки и ограниченной дисперсии генеральной совокупности разность между х – х 0
будет сколь угодно мала, т.е. не превзойдет заданного предела t
m
.
».
Теорему Чебышева можно записать:
при
Т.е. по мере увеличения объема выборки расхождения между х – х 0
будут сокращаться, вероятность этого близка к 1.
Но какова вероятность наступления каждого значения t
m
это неравенство не определяет.
IV. Эта неопределенность устраняется Ляпуновым, который доказал, что при достатачно большом числе наблюдений и ограниченной дисперсии распределение вероятностей выборочных средних, а следовательно, и их отклонений от генеральной средней подчиняется закону нормального распределения, значит, вероятность p
наступления той или иной величины предельной ошибки может быть рассчитана как f
от
t‑
коэффициента доверия по интегралу Лапласа.
Интеграл Лапласа является функцией от t
. По формуле величины вероятности F (t)
для разных коэффициентов доверия t
рассчитаны и сведены в таблицу значения F (t).
По таблице: при
Вывод: эти показатели означают, что с вероятностью = 0,683 предельная ошибка не превзойдет среднюю ошибку; при 0,954 – не превзойдет 2‑х кратной средней ошибки.
Методика расчета предельной ошибки:
1) по выборке определяется средняя ошибка m;
2) задается вероятность F,
с которой искомая предельная ошибка гарантируется;
3) в соответствии с F
определяется по таблицам t
;
4) средняя ошибка выборки умножается на значение t:
Формулы предельных ошибок:
Собственно-случайная выборка
Способ отбора |
Для средней величи- ны количеств. призн. |
Для доли альтерна тивного признака |
1) повторный отбор |
|
|
2) бесповторный отбор |
|
|
Для механической и типической выборок используются эти же формулы.
Серийная выборка
Отбор отдельных серий в выборочную совокупность осуществляется либо посредством собственно-случайной выборки, либо механическим отбором.
Практически серийная выборка производится, как правило, по схеме бесповторного отбора.
Для определения средней ошибки выборки применяются формулы:
1) для средней величины
количественного признака:
при этом межсерийная дисперсия выборочной средней:
2) для доли
альтернативного признака:
где ‑
межсерийная дисперсия выборочной доли:
Комбинированная выборка
Средняя ошибка комбинированной выборки определяется по формулам:
а) при повторном отборе
б) при бесповторном отборе
n
– число единиц, взятое в выборку из серий.
В статистике различают одноступенчатый и многоступенчатый способы отбора единиц в выборочную совокупность.
При одноступенчатой выборке каждая отобранная единица изучается по заданному признаку. Это при собственно-случайной и серийной выборке.
При многоступенчатой выборке производят отбор из генеральной совокупности отдельных групп, а из групп выбирают отдельные единицы.
Пример
: типическая выборка с механическим способом отбора единиц в выборочную совокупность.
Комбинированная выборка может быть 2‑х ступечатой. Генеральная совокупность разбивается на группы. Затем осуществляется отбор групп и только потом осуществляется отбор отдельных единиц.
Средняя ошибка выборки при многоступенчатом отборе определяется:
где m1,
m2
,…, mn
- средние ошибки выборки на отдельных ступенях отбора;
n1,
n2
,…, nn
-
численность выборки на соответствующих ступенях отбора.
Использование формул предельной ошибки выборки:
1. Определение доверительных пределов генеральной средней (или доли) с заданной вероятностью
2. Определение доверительной вероятности того, что расхождение между выборочными и генеральными характеристиками не превзойдет определенную заданную величину.
3. Определение необходимой численности выборки, которая с определенной вероятностью обеспечит заданную точность выборочных показателей.
I. а) Определение доверительных пределов средней.
Рассчитывается выборочная средняя (х
), вероятность р
– задается,
б) определение доверительных пределов доли
n= 400, 20 браков; выборочная доля – частость брака w = 20: 400 = 0,05; р = 0,95, по таблице t=1,96
доверительные пределы генеральной доли:
II. Определение доверительной вероятности
При расчете выборочных характеристик может ставиться задача определения вероятности допуска той или иной ошибки, т.е. отклонения от соответствующих характеристик генеральной совокупности не более чем на определенную заданную величину, которую можно рассматривать как предельную ошибку выборки
III. Определение необходимой численности выборки основывается на формуле предельной ошибки выборки повторного отбора
объем необходимой выборки:
отсюда ;
для средней величины количественного признака
Для расчета численности выборки
при выборочном обследовании доли альтернативного признака (nw):
, отсюда
, или
Бесповторный отбор
а) для средней величины количественного признака
б) для доли альтернативного признака
или
8. Анализ рядов динамики
Рядами динамики называются статистические данные, отображающие развитие изучаемого явления во времени.
Виды рядов динамики:
В зависимости от вида показателей:
а) ряды абсолютных величин – исходные;
б) ряды относительных и средних величин – производные.
Моментные ряды – отображают состояние изучаемых явлений на определенные даты (моменты) времени.
Интервальные ряды – итоги развития изучаемых явлений за отдельные периоды (интервалы) времени.
Показатели динамики:
Для количественной оценки динамики социально-экономических явлений применяются статистические показатели: 1) абсолютные приросты; 2) темпы роста; 3) темпы прироста; 4) темпы наращивания.
Абсолютный прирост – разновидность сопоставления 2‑х уровней ряда динамики в единицах измерения исходной информации.
Различают:
а) базисный – , где – постоянная база сравнения
б) цепной – разность между сравниванием уровнем и уровнем, который ему предшествует
Абсолютный прирост может иметь знак | – |, т.е. уровень ниже базисного.
Между базисным и цепными абсолютными приростами существует следующая связь:
сумма цепных абсолютному приросту последнего периода ряда динамики
Темп роста – характеризует отношение 2‑х уровней ряда и может выражаться в виде коэффициента или%%.
а) базисный – Трб
исчисляется делением сравниваемого уровня yi
на уровень, принятый за постоянную базу сравнения, y0i
:
б) цепной – Трцi
– исчисляется делением сравниваемого уровня yi-1
:
Темп прироста – характеризует абсолютный прирост в относительных величинах. Исчисленный в % темп прироста показывает, на сколько процентов изменился сравниваемый уровень с уровнем, принятым за базу сравнения.
а) базисный – Тпб
вычисляется делением сравниваемого базисного абсолютного прироста на уровень, принятый за постоянную базу сравнения y0i
б) цепной – Тпцi
– отношение сравниваемого цепного абсолютного прироста к предыдущему уровню
Между показателями темпа прироста и темпа роста имеется взаимосвязь:
– при выражении темпа роста в %
– при выражении темпа роста в коэффициентах
темп наращивания – измеряет наращивание экономического потенциала во времени.
Тн
вычисляется делением цепных абсолютных приростов на уровень, принятый за постоянную базу сравнения,
, если эту формулу преобразовать, то Тн
можно определять по базисным темпам
Экстраполяция в рядах динамики и прогнозирование.
В ходе анализа рядов динамики исчисляются показатели изменения уровней, тренда, сезонной волны. Они положены в основу статистической оценки возможного развития социально-экономических явлений в будущем.
Состояние надежных прогнозов динамики, например, спроса и предложения товаров и услуг – необходимы для регулирования рыночных отношений. Пользуются статистическими методами экстраполяции.
Под экстраполяцией понимается распространение выявленных в анализе рядов динамики закономерностей развития изучаемого явления на будущее (перспективу). При прогнозировании тренда изучаемого явления на основе аналитического выравнивания для экстраполяции тренда применяется адекватная трендовая модель. Причем стандартизованная ошибка аппроксимации должна быть минимальной:
Часто применяется для прогнозирования способ наименьших квадратов, аппросикмация линейной функцией и параболой II порядка.
При экстраполяции пользуется не только дискретными, но и интервальными оценками.
Для определения границ интервала используется формула:, где ta
– коэффициент доверия по распределению Стьюдента;
– остаточное среднее квадратическое отклонение тренда, скорректированное по числу степеней свободы (n-m), где
n – число уровней базисного ряда динамики;
m – число параметров адекватной модели тренда.
9. Изучение взаимосвязей
Одним из наиболее общих законов объективного мира является закон всеобщей связи и зависимости между явлениями. Статистические показатели в свете этого закона могут находится:
- в балансовой А+В=С+Д,
- компонентной а=в x с и факторной связи.
При факторной связи одни показатели выступают как факторные, другие – как результативные. По своему характеру это причинно-следственная зависимость. Для количественных показателей (признаков) связи могут быть функциональными и корреляционными (статистическими).
Функциональная связь – изменение результативного признака y
обусловлено изменением факторного признака x
: y=f(x).
Корреляционная связь – изменение результативного признака y
обусловлено влиянием не только факторного признака x
, но и возможным влиянием других факторов .
Корреляционные связи не являются жесткими зависимостями. Корреляция – от англ. «correlation» – соотношение, соответствие.
При функциональной связи зависимость проявляется с одинаковой силой у каждой единицы изучаемой совокупности. Поэтому установленную зависимость можно распространить на всю изучаемую совокупность.
При корреляционной связи при одном и том же значении учтенного факторного признака возможны различные значения результативного признака.
Парная корреляция – описывает влияние вариации факторного показателя x
на результативный y.
взаимосвязь только 2-х переменных.
Анализ парной корреляции проводится на основе уравнений регрессии.
Подбор функции производится на основе критериев:
1) показателя средней ошибки апроксимации
при сравнении выбирают уравнение с наименьшим значением:
показатели остаточной дисперсии результативного признака
Показатели тесноты связи
Проверка практической значимости математических моделей осуществляется посредством показателей тесноты между признаками x
и y
.
Для статической оценки тесноты связи применяются следующие показатели вариации:
общая дисперсия результативного признака , отображающая совокупное влияние всех факторов:
, где – сочетание значений факторов, влияющих на вариацию признака y
для каждой единицы совокупности различно.
Факторная дисперсия результативного признака , отображающая вариацию y
только от воздействия изучаемого признака x
, где – характеризует колеблемость выровненных значений от их общей средней величины y
Остаточная дисперсия – отображает вариацию результативного признака y
от всех прочих, кроме x
, кроме факторов:
, где – характеризует колеблемость фактического значения результативного признака y
от их выравненных .
теснота связи между признаками x
и y
:
, где – выравн., – эмпирич., R2
‑ индекс или коэффициент детерминации (причинности) иначе это корреляционное соотношение.
Если R2
=0,792, то это означает, что 79,2% общей вариации объясняется изменением факторного признака x
Выражает долю факторной дисперсии общей дисперсии, то есть характеризует какая часть общей вариации результативного признака y
объясняется изучаемым фактором x
.
Множественная корреляция – результативный признак корреляционно зависит от нескольких факторов. В этом случае статистическая модель может быть представлена уравнением регрессии с несколькими переменными.
Линейная .
Теснота связи результативного y
и фактроных x1
, x2
,…, xn
признаков характеризуется совокупным коэффициентом множественной корреляции
где
– факторная дисперсия ;
– дисперсия результативного признака ;
– остаточная дисперсия .
При отсутствии связи между y
и x1
…, n
факторная дисперсия и линия регрессии совпадает с прямой yx
=y
.
При функциональной связи факторная дисперсия совпадает с общей дисперсией, а R
=1.
Коэффициент частной корреляции – или частный коэффициент корреляции – показатель, характеризующий тесноту связи между признаками при элиминации всех остальных признаков.
y
и x1
; ry1
=0,4520
y
и x1
x2
; ry1,2
=0,7296
Итак, для оценки вклада во множественный коэффициент корреляции каждого из факторов применяют частные коэффициенты корреляции.
Частный коэффициент корреляции фактора x2
при элиминации x1
;
частный коэффициент корреляции x2
при элиминации x1
.
Частный коэффициент детерминации
dyx1(2)
=0,058, т.е. 5,8% колебаний y
– за счет x1
dyx2(1)
=0,4123, т.е. 41,23% – за счет x2
Корреляционно-регресивный анализ связи статистических показателей
Этот метод используется при обработке статистических данных, связанных между собой корреляционно: т.е. когда средняя величина одной из них изменяется в зависимости от другой.
При анализе социально-экономических явлений множественная регрессия и корреляция применяются одновременно.
1. С помощью регрессии определяется форма связи и оцениваются параметры регрессии.
2. Посредством корреляционного анализа определяется сила связи между факторами.
Значит, можно численно охарактеризовать как интенсивность и направление связей, так и степень влияния различных факторов.
Результаты анализа приобретают количественное выражение: 1) в уравнениях, описывающих форму связи и 2) коэффициентах регрессии.
Кроме изменчивости оцениваются и степень интенсивности корреляции между результативным фактором y
и влияющим на него производственными факторами xj
.
Степень интенсивности корреляции определяется коэффициентом множественной корреляции Ryxj
Пример: R=0,803 – по шкале Чеддока определяется – высокая степень связи. Для проверки надежности установления коэффициентов множественной корреляции необходимо найти значение критерия Фишера, сравнить с табличным значением при доверительном уровне вероятности суждения и соответствующем числе степеней свободы.
,
R2
– квадрат коэффициента корреляции или коэффициент множественной детерминации;
n
– численность выборочной совокупности;
m
– число параметров в уравнении связи, включая и параметр a0
.
Если Fфакт.
>Fтабл.
, значит, зависимость результативного y
от факторов описывается уравнением достоверно и существенно.
Оценка существенности коэффициентов множественной корреляции при определенной вероятности ошибки (0,05) и числе свободы k – по таблицам определяются критические значения t‑Стьюдента.
tфакт.
>tкрит.
– связь надежна
– утроенная среднеквадратическая ошибка коэффициента корреляции не превышает их расчетного значения – связь надежна.
Измерить надежное влияние, которое оказывают вариации всех исследуемых факторов, позволяет квадрат множественного коэффициента корреляции – называется коэффициентом множественной детерминации D=R2
. Если R=0,803, то D=R2
=0,645. И это означает, что 64,5% общей вариации объясняется изменением изучаемых факторов xj
. R=0,925D=85,4%
Возможность определить долю, вносимую каждым фактором в модификацию уровня результативного показателя, дает коэффициент частной детерминации: .
Степень влияния каждого фактора, включенного в вычисление корреляции, выражается той частью дисперсии значений признака явлений, которая определяется вариацией значений соответствующего фактора.
Сумма dj
=D. В нашем примере:
d1
=0,201; d4
=0,005
d2
=0,204; d5
=0,166
d3
=0,039; d6
=0,239
Вывод: Наибольшее влияние оказывают: x6, x2 и x1.
Анализ коэффициентов регрессии
Прямое сравнение коэффициентов регрессии невозможно, так как они не выражены в одинаковых единицах.
а) Применение коэффициентов эластичности .
– устраняет различие в единицах измерения.
– показывает, на сколько% изменится результативный признак при изменении факторного признака на 1% при фиксировании значений остальных факторов на каком-либо уровне. Если в качестве такого уровня принять их средние значения, то получим средний коэффициент эластичности :
1
=0,420; 3
=0,038; 5
=0,164
2
=0,827; 4
=0,024; 6
=0,754.
Вывод: Сравнением легко установить, что самое значительное влияние на результативный признак оказывают производственные факторы x2
, x6
и x1
.
б) – коэффициенты – нормированные коэффициенты регрессии
, где
aj
– коэффициент регрессии при факторе xj;
– среднее квадратическое отклонение факторного признака xj
;
– среднее квадратическое отклонение результативного признака y
.
Интерпретация : Чтобы установить, в развитии каких факторов заложены возможности изменения y
, следует учесть степень колеблемости факторов, которая характеризуется среднеквадратическим отклонением и коэффициентом вариации (vx
)/
1=0,223; 3=-0,030; 5=0,214;
2=0,270; 4=-0,050; 6=0,521.
Вывод: x6, x2, x1.
Коэффициент вариации (vxj
), больше y
x6
=18.5% vx2
=8,8%, vx1
=14,3%.
в) оценка значимости (существенности) коэффициентов регрессии проверяется по значению t – критерия Стьюдента
Значения x1=3,083; x3=0,363; x5=3,059;
t‑критерия: x2=3,781; x4=0,722; x6=6,051.
Вывод: наиболее значимы: x6, x2, x1.
Испытания параметров уравнения регрессии на их типичность
Применительно к совокупностям, у которых n<30 для определений типичности используется t‑критерий Стьюдента.
Алгоритм:
Вычисляются фактические значения t‑критерия:
а) для параметра a0
;
б) для параметра a1
, где
– среднее квадратическое отклонение результативного признака yi
от выравненных значений yxi
;
– среднее квадратическое отклонение факторного признака xi
от общей средней –
.
Полученные по формулам ta0
и ta
необходимо сравнить с критическими tk
, который находят по таблице Стьюдента с учетом принятого уровня значимости и числа степеней свободы k
.
3. Если t‑факт. больше t‑крит., следовательно полученные в анализе корреляции связи параметров уравнения регрессии признаются типичными.
Параметры получают соответствующие количественные значения, которые записываются в уравнение выбранной f
.
Смысловое содержание моделей:
Характеристика средней величины результативного признака в зависимости от вариации признака фактора.
Оценка надежности коэффициента корреляции и коэффициента регрессии.
Коэффициент корреляции может рассчитываться по выборочным данным, значит, может быть искаженным под действием случайных величин. Поэтому должна быть рассчитана ошибка коэффициента корреляции
.
I. Если число наблюдений достаточно велико (n
>50), то
– пределы r
.
II. Если n
<50, или значение r
невелико, то приходится решать вопрос о том, насколько реальна связь между y
и x
. Ответ – при сопоставлении r
и .
Если , то а) r
– считается значимым;
б) а связь – реальной
Если , то вязь не доказана и r
от 0
, получено случайно.
10. Индексы
Статистический индекс – это относительная величина сравнения сложных совокупностей и отдельных их единиц. При этом под сложной совокупностью понимается такая статистическая совокупность, отдельные элементы которой непосредственно не подлежат суммированию.
Общий объем производства, выраженный в натуральных единицах, суммировать нельзя. Для этого служит индексный метод. В этом случае переходят от натурально-вещественной формы выражения товарных масс к стоимостным измерителям.
Полученные на основе индексного анализа показатели используются для характеристики развития анализируемых показателей: 1) во времени; 2) по территории; 3) изучения структуры и взаимосвязей; 4) выявления роли факторов в изменении сложных явлений. При всем своем разнообразии показатели можно разделить на 2 группы:
1 группа – объемные, допускающие суммирование (численность рабочих, размер посевных площадей), выражаются абсолютными величинами.
2 группа – показатели, рассчитанные на какую-то единицу (показатели цен, себестоимости, производительности труда). Их условно можно назвать качественными, выражаются в виде средних величин.
· Классификация индексов:
1. По степени охвата явления – индивидуальные, сводные (групповые, общие).
2. По базе сравнения – динамические индивидуальные (базисные, цепные), индексы выполнения плана, территориальные индексы.
3. По виду весов (коэффициентов соизмерения) – с постоянными весами (базисного периода, постоянными или стандартными) и переменными весами.
4. По форме построения – агрегатные, средние взвешенные (арифметические, гармонические).
5. По составу явления – постоянного (фиксированного состава) и переменного состава (агрегатные, среднего уровня).
6. По содержанию индексируемых величин – физического объема, цен, производительности труда, себестоимости, средних затрат на 1 рубль продукции.
Индивидуальные индексы –
характеризуют изменения отдельных единиц статистической совокупности (т.е. отражают соотношения простых единичных показателей).
Общие индексы
– выражают сводные (обобщающие) результаты совместного изменения всех единиц, образующих статистическую совокупность. В числителе и знаменателе общего индекса изменяется только значение индексируемых величин, а их соизмерители являются постоянными величинами и фиксируются на одном уровне (текущего или базисного периода).
Для определения сводных обобщающих показателей используются средний арифметический и средний гармонический индексы, причем средние рассчитываются как средние взвешенные.
Исчисление общих индексов, выступающих в качестве обобщающих относительных показателей, позволяющих соотносить между собой показатели по сложным совокупностям, составляет индексный метод. Он дает возможность не только изучать динамику тех или иных сложных показателей, но и измерять влияние отдельных факторов на динамику сложного показателя, дает возможность абстрагироваться о одних факторов в случае необходимости или рассматривать их взаимосвязано.
Список использованной литературы
1) Общая теория статистики: Статистическая методология в изучении коммерческой деятельности: Учебник / Под ред. Спирина А.А., Башиной О.Э.М.: Финансы и статистика, 1994.
2) Общая теория статистики: Учебник / Под ред. И.И. Елисеевой. М.: Финансы и статистика, 1996.
3) Практикум по теории статистики / Под ред. Р.А. Шмойловой. М.: Финансы и статистика, 1998.
4) Теория статистики: Учебник / Под ред. Р.А. Шмойловой. М.: Финансы и статистика, 1998.