Тема: Выборочный метод в статистике
1. Понятие о выборочном наблюдении, его задачи
Статистическое наблюдение можно организовать сплошное и несплошное. Сплошное наблюдение
предусматривает обследование всех единиц изучаемой совокупности и связано с большими трудовыми и материальными затратами. Изучение не всех единиц совокупности, а лишь некоторой части, по которой следует судить о свойствах всей совокупности в целом, можно осуществить несплошным
наблюдением. В статистической практике самым распространенным является выборочное наблюдение.
Выборочное наблюдение
—
это такой вид несплошного наблюдения, при котором отбор подлежащих обследованию единиц осуществляется в случайном порядке, отобранная часть изучается, а результаты распространяются на всю исходную совокупность. Наблюдение организуется таким образом, что эта часть отобранных единиц в уменьшенном масштабе репрезентирует
(представляет) всю совокупность.
Совокупность, из которой производится отбор, называется генеральной,
и все ее обобщающие показатели — генеральными.
Совокупность отобранных единиц именуют выборочной совокупностью,
и все ее обобщающие показатели — выборочными.
Имеется ряд причин, в силу которых, во многих случаях выборочному наблюдению отдается предпочтение перед сплошным. Наиболее существенны из них следующие:
• экономия времени и средств в результате сокращения объема работы;
• сведение к минимуму порчи или уничтожения исследуемых объектов (определение прочности пряжи при разрыве, испытание электрических лампочек на продолжительность горения, проверка консервов на доброкачественность);
• необходимость детального исследования каждой единицы наблюдения при невозможности охвата всех единиц (при изучении бюджета семей);
• достижение большой точности результатов обследования благодаря сокращению ошибок, происходящих при регистрации.
Преимущество выборочного наблюдения по сравнению со сплошным можно реализовать, если оно организовано и проведено в строгом соответствии с научными принципами теории выборочного метода.
Такими принципами являются: обеспечение случайности
(равной возможности попадания в выборку) отбора единиц и достаточного их числа.
Соблюдение этих принципов позволяет получить объективную гарантию репрезентативности полученной выборочной совокупности. Понятие репрезентативности
отобранной совокупности не следует понимать как ее представительство по всем признакам изучаемой совокупности, а только в отношении тех признаков, которые изучаются или оказывают существенное влияние на формирование сводных обобщающих характеристик.
Основная задача выборочного наблюдения в экономике состоит в том, чтобы на основе характеристик выборочной совокупности (средней и доли) получить достоверные суждения о показателях средней и доли в генеральной совокупности. При этом следует иметь в виду, что при любых статистических исследованиях (сплошных и выборочных) возникают ошибки двух видов: регистрации и репрезентативности.
Ошибки регистрации
могут иметь случайный
(непреднамеренный) и систематический
(тенденциозный) характер. Случайные ошибки
обычно уравновешивают друг друга, поскольку не имеют преимущественного направления в сторону преувеличения или преуменьшения значения изучаемого показателя. Систематические ошибки
направлены в одну сторону вследствие преднамеренного нарушения правил отбора (предвзятые цели). Их можно избежать при правильной организации и проведении наблюдения.
Ошибки репрезентативности
присущи только выборочному наблюдению и возникают в силу того, что выборочная совокупность не полностью воспроизводит генеральную. Они представляют собой расхождение между значениями показателей, полученных по выборке, и значениями показателей этих же величин, которые были бы получены при проведенном с одинаковой степенью точности сплошном наблюдении, т. е. между величинами выборных и соответствующих генеральных показателей.
Для каждого конкретного выборочного наблюдения значение ошибки репрезентативности может быть определено по соответствующим формулам, которые зависят от вида, метода
и способа
формирования выборочной совокупности.
По виду
различают индивидуальный, групповой и комбинированный отбор. При индивидуальном отборе
в выборочную совокупность отбираются отдельные единицы генеральной совокупности; при групповом отборе
— качественно однородные группы или серии изучаемых единиц; комбинированный отбор
предполагает сочетание первого и второго видов.
По методу отбора
различают повторную
и бесповторную выборки.
При повторной выборке
общая численность единиц генеральной совокупности в процессе выборки остается неизменной. Ту или иную единицу, попавшую в выборку, после регистрации снова возвращают в генеральную совокупность, и она сохраняет равную возможность со всеми прочими единицами при повторном отборе единиц вновь попасть в выборку («отбор по схеме возвращенного шара»). Повторная выборка в социально-экономической жизни встречается редко. Обычно выборку организуют по схеме бесповторной выборки.
При бесповторной выборке
единица совокупности, попавшая в выборку, в генеральную совокупность не возвращается и в дальнейшем в выборке не участвует; т. е. последующую выборку делают из генеральной совокупности уже без отобранных ранее единиц («отбор по схеме невозвращенного шара»). Таким образом, при бесповторной выборке численность единиц генеральной совокупности сокращается в процессе исследования.
Способ отбора
определяет конкретный механизм или процедуру выборки единиц из генеральной совокупности.
По степени охвата единиц совокупности различают большие
и малые
(n
<30) выборки.
В практике выборочных исследований наибольшее распространение получили следующие виды выборки: собственно-случайная, механическая, типическая, серийная, комбинированная.
Основные характеристики параметров генеральной и выборочной совокупностей обозначаются символами:
N—объем генеральной совокупности (число входящих в нее единиц);
п —
объем выборки (число обследованных единиц);
—
генеральная средняя (среднее значение признака в генеральной совокупности);
— выборочная средняя;
P
— генеральная доля (доля единиц, обладающих данным значением признака в общем числе единиц генеральной совокупности);
w
—
выборочная доля;
—
генеральная дисперсия (дисперсия признака в генеральной совокупности);
S
2
— выборочная дисперсия того же признака;
— среднее квадратическое отклонение в генеральной совокупности;
S
— среднее квадратическое отклонение в выборке.
2. Ошибки выборки
При выборочном наблюдении должна быть обеспечена случайность
отбора единиц. Каждая единица должна иметь равную с другими возможность быть отобранной. Именно на этом основывается собственно-случайная выборка.
К
собственно-случайной выборке
относится отбор единиц из всей генеральной совокупности (без предварительного расчленения ее на какие-либо группы) посредством жеребьевки (преимущественно) или какого-либо иного подобного способа, например, с помощью таблицы случайных чисел. Случайный отбор —
это отбор не беспорядочный. Принцип случайности предполагает, что на включение или исключение объекта из выборки не может повлиять какой-либо фактор, кроме случая. Примером собственно-случайного
отбора могут служить тиражи выигрышей: из общего количества выпущенных билетов наугад отбирается определенная часть номеров, на которые приходятся выигрыши. Причем всем номерам обеспечивается равная возможность попадания в выборку. При этом количество отобранных в выборочную совокупность единиц обычно определяется исходя из принятой доли выборки.
Доля, выборки
есть отношение числа единиц выборочной совокупности к числу единиц генеральной совокупности:
Так, при 5%-ной выборке из партии деталей в 1000 ед. объем выборки п
составляет 50 ед., а при 10%-ной выборке -100 ед. и т.д. При правильной научной организации выборки ошибки репрезентативности можно свести к минимальном значениям, в результате — выборочное наблюдение становится достаточно точным.
Собственно-случайный отбор «в чистом виде» применяется в практике выборочного наблюдения редко, но он является исходным среди всех других видов отбора, в нем заключаются и реализуются основные принципы выборочного наблюдения.
Рассмотрим некоторые вопросы теории выборочного метода и формулы ошибок для простой случайной выборки.
Применяя выборочный метод в статистике, обычно используют два основных вида обобщающих показателей: среднюю величину количественного признака
и относительную величину альтернативного признака
(долю или удельный вес единиц в статистической совокупности, которые отличаются от всех других единиц этой совокупности только наличием изучаемого признака).
Выборочная доля
(
w
),
или частость, определяется отношением числа единиц, обладающих изучаемым признаком т,
к общему числу единиц выборочной совокупности п:
w
= т/п.
Например, если из 100 деталей выборки (и = 100), 95 деталей оказались стандартными (т
=95), то выборочная доля
w
= 95 / 100 = 0,95 .
Для характеристики надежности выборочных показателей различают среднюю
и предельную ошибки выборки.
Ошибка выборки
или, иначе говоря, ошибка репрезентативности представляет собой разность соответствующих выборочных и генеральных характеристик:
• для средней количественного признака
(1)
• для доли (альтернативного признака)
(2)
Ошибка выборки свойственна только выборочным наблюдениям. Чем больше значение этой ошибки, тем в большей степени выборочные показатели отличаются от соответствующих генеральных показателей.
Выборочная средняя и выборочная доля по своей сути являются случайными величинами,
которые могут принимать различные значения в зависимости от того, какие единицы совокупности попали в выборку. Следовательно, ошибки выборки также являются случайными величинами и могут принимать различные значения. Поэтому определяют среднюю из возможных ошибок — среднюю ошибку выборки.
От чего зависит средняя ошибка выборки!
При соблюдении принципа случайного отбора средняя ошибка выборки определяется, прежде всего объемом выборки:
чем больше численность при прочих равных условиях, тем меньше величина средней ошибки выборки. Охватывая выборочным обследованием все большее количество единиц генеральной совокупности, всё более точно характеризуем всю генеральную совокупность.
Средняя ошибка выборки также зависит от степени варьирования
изучаемого признака. Степень варьирования, как известно, характеризуется дисперсией
или w
(1 -
w
)
— для альтернативного признака. Чем меньше вариация признака, а следовательно, и дисперсия, тем меньше средняя ошибка выборки, и наоборот. При нулевой дисперсии (признак не варьирует) средняя ошибка выборки равна нулю, т. е. любая единица генеральной совокупности будет совершенно точно характеризовать всю совокупность по этому признаку.
Зависимость средней ошибки выборки от ее объема и степени варьирования признака отражена в формулах, с помощью которых можно рассчитать среднюю ошибку выборки в условиях выборочного наблюдения, когда генеральные характеристики (х,р)
неизвестны, и следовательно, не представляется возможным нахождение реальной ошибки выборки непосредственно по формулам (1), (2).
При случайном повторном отборе
средние ошибки теоретически рассчитывают по следующим формулам:
• для средней количественного признака
(3)
• для доли (альтернативного признака)
(4)
Поскольку практически дисперсия признака в генеральной совокупности
точно неизвестна, на практике пользуются
значением дисперсии S
2
,
рассчитанным для выборочной совокупности на основании закона больших чисел, согласно которому выборочная совокупность при достаточно большом объеме выборки достаточно точно воспроизводит характеристики генеральной совокупности.
Таким образом, расчетные формулы средней ошибки выборки
при случайном повторном отборе будут следующие:
• для средней количественного признака
(5)
• для доли (альтернативного признака)
(6)
Однако дисперсия выборочной совокупности не равна дисперсии генеральной совокупности, и следовательно, средние ошибки выборки, рассчитанные по формулам (5) и (6), будут приближенными. Но в теории вероятностей доказано, что генеральная дисперсия выражается через выборочную следующим соотношением:
(7)
Так как п
/ (n
-1) при достаточно больших п —
величина, близкая к единице, то можно принять, что =
S
2
, а
следовательно, в практических расчетах средних ошибок выборки можно использовать формулы (5) и (6). И только в случаях малой выборки (когда объем выборки не превышает 30) необходимо учитывать коэффициент п/(п-1)
и исчислять среднюю ошибку малой выборки
по формуле:
(8)
При случайном бесповторном отборе
в приведенные выше формулы расчета средних ошибок выборки необходимо подкоренное выражение умножить на 1-(п/
N
),
поскольку в процессе бесповторной выборки сокращается численность единиц генеральной совокупности. Следовательно, для бесповторной выборки расчетные формулы средней ошибки выборки
примут такой вид:
• для средней количественного признака
(9)
• для доли (альтернативного признака)
(10)
Так как п
всегда меньше N
,
то дополнительный множитель 1 - (n / N
)
всегда будет меньше единицы. Отсюда следует, что средняя ошибка при бесповторном отборе всегда будет меньше, чем при повторном. В то же время при сравнительно небольшом проценте выборки этот множитель близок к единице (например, при 5%-ной выборке он равен 0,95; при 2%-ной — 0,98 и т.д.). Поэтому иногда на практике пользуются для определения средней ошибки выборки формулами (5) и (6) без указанного множителя, хотя выборку и организуют как бесповторную. Это имеет место в тех случаях, когда число единиц генеральной совокупности N
неизвестно или безгранично, или когда п
очень мало по сравнению с N,
и по существу, введение дополнительного множителя, близкого по значению к единице, практически не повлияет на значение средней ошибки выборки.
Механическая выборка
состоит в том, что отбор единиц в выборочную совокупность из генеральной, разбитой по нейтральному признаку на равные интервалы (группы), производится таким образом, что из каждой такой группы в выборку отбирается лишь одна единица. Чтобы избежать систематической ошибки, отбираться должна единица, которая находится в середине каждой группы.
При организации механического отбора единицы совокупности предварительно располагают (обычно в списке) в определенном порядке (например, по алфавиту, местоположению, в порядке возрастания или убывания значений какого-либо показателя, не связанного с изучаемым свойством, и т.д.), после чего отбирают заданное число единиц механически, через определенный итервал. При этом размер интервала в генеральной совокупности равен обратному значению доли выборки. Так, при 2%-ной выборке отбирается и проверяется каждая 50-я единица (1 : 0,02), при 5 %-ной выборке — каждая 20-я единица (1 : 0,05), например, сходящая со станка деталь.
При достаточно большой совокупности механический отбор по точности результатов близок к собственно-случайному. Поэтому для определения средней ошибки механической выборки используют формулы собственно-случайной бесповторной выборки (9), (10).
Для отбора единиц из неоднородной совокупности применяется, так называемая типическая выборка,
которая используется в тех случаях, когда все единицы генеральной совокупности можно разбить на несколько качественно однородных, однотипных групп по признакам, влияющим на изучаемые показатели.
При обследовании предприятий такими группами могут быть, например, отрасль и подотрасль, формы собственности. Затем из каждой типической группы собственно-случайной или механической выборкой производится индивидуальный отбор единиц в выборочную совокупность.
Типическая выборка обычно применяется при изучении сложных статистических совокупностей. Например, при вы
Типическая выборка дает более точные результаты по сравнению с другими способами отбора единиц в выборочную совокупность. Типизация генеральной совокупности обеспечивает репрезентативность такой выборки, представительство в ней каждой типологической группы, что позволяет исключить влияние межгрупповой дисперсии на среднюю ошибку выборки,
При определении средней ошибки типической выборки
в качестве показателя вариации выступает средняя из внутригрупповых дисперсий.
Среднюю ошибку выборки
находят по формулам:
• для средней количественного признака
(повторный отбор); (11)
(бесповторный отбор); (
12)
• для доли (альтернативного признака)
(повторный отбор); (13)
(бесповторный отбор), (14)
где
—
средняя из внутригрупповых дисперсий по выборочной совокупности;
- средняя из внутригрупповых дисперсий доли (альтернативного
признака) по выборочной совокупности.
Серийная выборка
предполагает случайный отбор из генеральной совокупности не отдельных единиц, а их равновеликих групп (гнезд, серий) с тем, чтобы в таких группах подвергать наблюдению все без исключения единицы.
Применение серийной выборки обусловлено тем, что многие товары для их транспортировки, хранения и продажи упаковываются в пачки, ящики и т.п. Поэтому при контроле качества упакованного товара рациональнее проверить несколько упаковок (серий), чем из всех упаковок отбирать необходимое количество товара.
Поскольку внутри групп (серий) обследуются все без исключения единицы, средняя ошибка выборки (при отборе равновеликих серий) зависит только от межгрупповой (межсерийной) дисперсии.
Среднюю ошибку выборки для средней количественного признака
при серийном отборе находят по формулам:
(повторный отбор); (15
)
(бесповторный отбор), (16
)
где r
- число отобранных серий; R
-
общее число серий.
Межгрупповую дисперсию серийной выборки вычисляют следующим образом:
где — средняя i-й серии; -
общая средняя по всей выборочной совокупности.
Средняя ошибка выборки для доли (альтернативного признака)
при серийном отборе:
(повторный отбор); (17
)
(бесповторный отбор). (18
)
Межгрупповую
(межсерийную) дисперсию доли серийной выборки
определяют по формуле:
(19)
где w
i
-
доля признака в i-и серии;
-
общая доля признака во всей выборочной совокупности.
В практике статистических обследований помимо рассмотренных ранее способов отбора применяется их комбинация (комбинированный отбор).
3. Распространение выборочных результатов на генеральную совокупность
Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов.
Выборочные средние и относительные величины распространяют на генеральную совокупность с учетом предела их возможной ошибки.
В каждой конкретной выборке расхождение между выборочной средней и генеральной, т. е.
может быть меньше средней ошибки выборки ,
равно ей или больше ее.
Причем каждое из этих расхождений имеет различную вероятность
(объективную возможность появления события). Поэтому фактические расхождения между выборочной средней и генеральной
можно рассматривать как некую предельную ошибку, связанную со средней ошибкой и гарантируемую с определенной вероятностью Р.
Предельную ошибку выборки для средней
() при повторном отборе
можно рассчитать по формуле:
(20)
где t
- нормированное отклонение — «коэффициент доверия», зависящий от вероятности, с которой гарантируется предельная ошибка выборки;
— средняя ошибка выборки.
Аналогичным образом может быть записана формула предельной ошибки выборки для доли
при повторном отборе:
(21)
При случайном бесповторном отборе
в формулах расчета предельных ошибок выборки (20) и (21) необходимо умножить подкоренное выражение на 1 - (n
/ N
)
.
Формула предельной ошибки выборки вытекает из основных положений теории выборочного метода, сформулированных в ряде теорем теории вероятностей, отражающих закон больших чисел.
На основании теоремы П.Л. Чебышева (с уточнениями А.М. Ляпунова) с вероятностью, сколь угодно близкой к единице, можно утверждать, что при достаточно большом объеме выборки и ограниченной генеральной дисперсии выборочные обобщающие показатели (средняя, доля) будут сколь угодно мало отличаться от соответствующих генеральных показателей.
Применительно к нахождению среднего
значения признака эта теорема может быть записана так:
(22)
а для доли
признака:
(23
)
где (24)
Таким образом, величина предельной ошибки выборки может быть установлена с определенной вероятностью.
Значения функции Ф(
t
)
при различных значениях t
как коэффициента кратности средней ошибки выборки, определяются на основе специально составленных таблиц. Приведем некоторые значения, применяемые наиболее часто для выборок достаточно большого объема (n
30):
t
1,000 1,960 2,000 2,580 3,000
Ф(
t
)
0,683 0,950 0,954 0,990 0,997
Предельная ошибка выборки отвечает на вопрос о точности выборки с определенной вероятностью, значение которой определяется коэффициентом t
(в практических расчетах, как правило, заданная вероятность не должна быть менее 0,95). Так, при t
= 1 предельная ошибка составит
= . Следовательно, с вероятностью 0,683 можно утверждать, что разность между выборочными и генеральными показателями не превысит одной средней ошибки выборки. Другими словами, в 68,3% случаев ошибка репрезентативности не выйдет за пределы ±1.
При t
= 2
с вероятностью 0,954 она не выйдет за пределы ±2 ,
при t
=
3 с вероятностью 0,997 — за пределы ±3 и т.д.
Как видно из приведённых выше значений функции Ф
(t
) (см. последнее значение), вероятность появления ошибки, равной или большей утроенной средней ошибки выборки, т. е.
3 крайне мала и равна 0,003, т. е. 1—0,997. Такие маловероятные события считаются практически невозможными, а потому величину
= 3можно принять за предел возможной ошибки выборки.
Выборочное наблюдение проводится в целях распространения выводов, полученных по данным выборки, на генеральную совокупность. Одной из основных задач является оценка по данным выборки исследуемых характеристик (параметров) генеральной совокупности.
Предельная ошибка выборки позволяет определить предельные значения характеристик генеральной совокупности и их доверительные интервалы:
• для средней
(25)
• для доли
(26)
Это означает, что с заданной вероятностью можно утверждать, что значение генеральной средней следует ожидать в пределах от -
до +
Аналогичным образом может быть записан доверительный интервал генеральной доли:
Наряду с абсолютным значением предельной ошибки выборки рассчитывается и предельная относительная ошибка выборки,
которая определяется как процентное отношение предельной ошибки выборки к соответствующей характеристике выборочной совокупности:
• для средней, %:
(27)
• для доли,
%: (28)
Рассмотрим нахождение средних и предельных ошибок выборки, определение доверительных пределов средней и доли на конкретных примерах.
Задача 1.
Для определения скорости расчетов с кредиторами предприятий корпорации в коммерческом банке была проведена случайная выборка 100 платежных документов, по которым средний срок перечисления и получения денег оказался равным 22 дням ( =
22) со стандартным отклонением 6 дней (S= 6).
Необходимо с вероятностью Р =
0,954 определить предельную ошибку выборочной средней и доверительные пределы средней продолжительности расчетов предприятий данной корпорации.
Решение.
Предельную ошибку
= t
определяем по формуле повторного отбора (6.20), так как численность генеральной совокупности N
неизвестна. Из представленных значений Ф
(t
) (см. с. 98) для вероятности Р
= 0,954 находим t
= 2.
Следовательно, предельная ошибка выборки, дней:
Предельная относительная ошибка выборки, %:
Генеральная средняя будет равна =
±
, а доверительные интервалы (пределы) генеральной средней исчисляем, исходя из двойного неравенства:
Таким образом, с вероятностью 0,954 можно утверждать, что средняя продолжительность расчетов предприятий данной корпорации колеблется в пределах от 20,8 до 23,2 дней.
Задача 2.
Среди выборочно обследованных 1000 семей региона по уровню душевого дохода (выборка 2%-ная, механическая) малообеспеченных оказалось 300 семей.
Требуется с вероятностью 0,997 определить долю малообеспеченных семей во всем регионе.
Решение.
Выборочная доля (доля малообеспеченных семей среди обследованных семей) равна:
По представленным ранее данным Ф(t
) для вероятности 0,997 находим t
= 3 (см. с. 99). Предельную ошибку доли определяем по формуле бесповторного отбора (механическая выборка всегда является бесповторной):
Предельная относительная ошибка выборки, %:
Генеральная доляа доверительные пределы генеральной доли исчисляем, исходя из двойного неравенства:
В нашем примере:
Таким образом, почти достоверно, с вероятностью 0,997 можно утверждать, что доля малообеспеченных семей среди всех семей региона колеблется от 28,6 до 31,4%.
Задача 3.
Для определения урожайности зерновых культур проведено выборочное обследование 100 хозяйств региона различных форм собственности, в результате которого получены сводные данные (табл.6.1). Необходимо с вероятностью 0,954 определить предельную ошибку выборочной средней и доверительные пределы средней урожайности зерновых культур по всем хозяйствам региона.
Таблица 6.1
Распределение урожайности по хозяйствам региона, имеющим различную форму собственности
Хозяйства (по формам собственности)
|
Количество обследованных хозяйств
f
|
Средняя урожайность,
xi
|
Дисперсия урожайности
в каждой группе
Si
|
Коллективные Акционерные общества Крестьянские (фермерские) |
30 50 20 |
18 20 28 |
15 25 40 |
Итого
|
100
|
—
|
— |
Решение.
Поскольку обследованные хозяйства региона сгруппированы по формам собственности, предельную ошибку средней урожайности определяем по формуле для типической выборки, осуществляемой методом повторного отбора (численность генеральной совокупности N неизвестна):
В этой формуле неизвестна средняя из внутригрупповых дисперсий.
Она исчисляется по формуле:
По представленным ранее (см. с. 98) данным Ф
(t
) для вероятности Р
=0,954 находим t
= 2.
Тогда предельная ошибка выборки, ц/га:
Генеральная средняя:
=
±
. Для нахождения ее границ вначале нужно исчислить среднюю урожайность по выборочной совокупности
, ц/га:
Предельная относительная ошибка выборки, %:
Доверительные пределы генеральной средней исчисляем, исходя из двойного неравенства:
Таким образом, с вероятностью 0,954 можно гарантировать, что средняя урожайность зерновых культур по региону будет не менее чем 20 ц/га, но и не более чем 22 ц/га.
Определение необходимого объема выборки.
При проектировании выборочного наблюдения с заранее заданным значением допустимой ошибки выборки очень важно правильно определить численность (объем) выборочной совокупности, которая с определенной вероятностью обеспечит заданную точность результатов наблюдения. Формулы для определения необходимой численности выборки п
легко получить непосредственно из формул ошибок выборки.
Так, из формул предельной ошибки выборки для повторного отбора
нетрудно (предварительно возведя в квадрат обе части равенства) выразить необходимую численность выборки:
• для средней количественного признака
(29
)
• для доли (альтернативного признака)
(30
)
Аналогично из формул предельной ошибки выборки для бесповторного отбора
находим, что
(для средней);
(31
)
(для доли).
(32
)
Эти формулы показывают, что с увеличением предполагаемой ошибки выборки значительно уменьшается необходимый объем выборки.
Для расчета объема выборки нужно знать дисперсию. Она может быть заимствована из проводимых ранее обследований данной или аналогичной совокупности, а если таковых нет, тогда для определения дисперсии надо провести специальное выборочное обследование небольшого объема.
Задача 4.
Для определения среднего возраста 1200 студентов факультета необходимо провести выборочное обследование методом случайного бесповторного отбора. Предварительно установлено, что среднее квадратическое отклонение возраста студентов равно 10 годам.
Сколько студентов нужно обследовать, чтобы с вероятностью 0,954 средняя ошибка выборки не превышала 3 года?
Решение.
Рассчитаем необходимую численность выборки, чел., по формуле бесповторного отбора (6.31), учитывая, что t = 2 при Р
= 0,954:
Таким образом, выборка численностью 47 чел. обеспечивает заданную точность при бесповторном отборе.
Выборочный метод широко используется в статистической практике для получения экономической информации.
Большую актуальность приобретает выборочный метод в современных условиях перехода к рыночной экономике. Изменения в характере экономических отношений, аренда, собственность отдельных коллективов и лиц обусловливают изменения функций учета и статистики, сокращение и упрощение отчетности. Вместе с тем, возрастающие требования к менеджменту усиливают потребность в обеспечении надежной информацией, дальнейшего повышения ее оперативности. Все это обусловливает более широкое применение выборочного метода в экономике.
В отечественной статистике уже накоплен определенный опыт выборочных обследований.