Форма 1 закупки инструкция по заполнению. Готовим отчет о закупках у смп и соно

Часто бывает так, что необходимо проанализировать какое-либо конкретное социальное явление и получить информацию о нем. Такие задания часто возникают в статистике и при статистических исследованиях. Проверить полностью определенное социальное явление чаще всего бывает невозможным. Например, как узнать мнение населения или всех жителей определенного города по какому-либо вопросу? Спрашивать абсолютно всех – дело практически невозможное и очень трудоемкое. В таких случаях нам и необходима выборка. Это именно то понятие, на котором основаны практически все исследования и анализы.

Что такое выборка

При анализе конкретного социального явления необходимо получить информацию о нем. Если взять любое исследование, то можно заметить, что исследованию и анализу подлежит не каждая единица совокупности объекта исследования. Во внимание берется только определенная часть всей этой совокупности. Вот этот процесс и является выборкой: когда исследуются только определенные единицы из множества.

Конечно же, многое зависит от вида выборки. Но есть и основные правила. Главное из них гласит, что отбор из совокупности должен быть абсолютно случайным. Единицы совокупности, которые будут использованы, не должны быть выбраны из-за какого-либо критерия. Грубо говоря, если необходимо набрать совокупность из населения определенного города и отобрать только мужчин, то в исследовании будет ошибка, потому что отбор был проведен не случайно, а отобран по гендерному признаку. Практически все методы выборки основаны на этом правиле.

Правила выборки

Для того чтобы отобранная совокупность отражала основные качества всего явления, она должна быть построена по конкретным законам, где основное внимание необходимо уделять следующим категориям:

  • выборка (выборочная совокупность);
  • генеральная совокупность;
  • репрезентативность;
  • ошибка репрезентативности;
  • единица совокупности;
  • способы построения выборки.

Особенности выборочного наблюдения и составления выборки заключаются в следующем:

  1. Все полученные результаты основаны на математических законах и правилах, то есть при правильном проведении исследования и при правильных расчетах результаты не будут искажены по субъективному признаку
  2. Дает возможность значительно быстрее и с меньшими затратами времени и ресурсов получить результат, изучая не весь массив событий, а только их часть.
  3. Может быть применено для изучения различных объектов: от конкретных вопросов, например, возраст, пол интересующей нас группы, к изучению общественного мнения или уровня материального обеспечения населения.

Выборочное наблюдение

Выборочное - это такое статистическое наблюдение, при котором исследованию подвергается не вся совокупность изучаемого, а лишь некоторая, отобранная определенным образом ее часть, а полученные результаты изучения этой части распространяются на всю совокупность. Эта часть называется выборочной совокупностью. Это единственный способ изучения большого массива объекта исследования.

Но выборочное наблюдение может использоваться только в тех случаях, когда необходимо исследовать лишь малую группу единиц. Например, при исследовании соотношения мужчин к женщинам в мире, будет использоваться выборочное наблюдение. По понятным причинам – взять во внимание каждого жителя нашей планеты невозможно.

А вот при таком же исследовании, но не всех жителей земли, а определенного 2 «А» класса в конкретной школе, определенного города, определенной страны, может обойтись без выборочного наблюдения. Ведь проанализировать весь массив объекта исследования – вполне возможно. Необходимо посчитать мальчиков и девочек этого класса - вот и будет соотношение.


Выборочная и генеральная совокупность

На самом деле все не так сложно, как звучит. В любом объекте изучения есть две системы: генеральная и выборочная совокупность. Что же это такое? Все единицы относятся к генеральной. А к выборочной – те единицы общей совокупности, которые были взяты для выборки. Если все правильно сделано, то отобранная часть будет составлять уменьшенный макет всей (генеральной) совокупности.

Если говорить о генеральной совокупности, то можно выделить всего две ее разновидности: определенная и неопределенная генеральная совокупность. Зависит от того, известно ли общее количество единиц данной системы или нет. Если это определенная генеральная совокупность, то выборку будет делать легче из-за того, что известно, какой процент от общего количества единиц будет составлять выборка.

Этот момент очень необходим в исследованиях. Например, если необходимо исследовать процент недоброкачественной продукции кондитерских изделий на конкретном заводе. Допустим, что генеральная совокупность уже определена. Точно известно, что в год это предприятие производит 1000 кондитерских изделий. Если сделать выборку 100 случайных кондитерских изделий из этой тысячи и отправить их на экспертизу, то погрешность будет минимальной. Грубо говоря, исследованию подлежало 10 % всей продукции, и по результатам можем, приняв во внимание ошибку репрезентативности, говорить о недоброкачественности всей продукции.

А если провести выборку 100 кондитерских изделий из неопределенной генеральной совокупности, где их на самом деле было, допустим, 1 млн единиц, то результат выборки и самого исследования будет критически неправдоподобным и неточным. Чувствуете разницу? Поэтому определенность генеральной совокупности в большинстве случаев крайне важна и очень сильно влияет на результат исследования.


Репрезентативность совокупности

Итак, теперь один из самых главных вопросов - какой должна быть выборка? Это самый главный момент исследования. На этом этапе необходимо рассчитать выборку и отобрать единицы из общего числа в нее. Совокупность была отобрана правильно, если определенные особенности и характеристики генеральной совокупности остается и в выборочной. Это называется репрезентативностью.

Иными словами, если после отбора часть сохраняет те же самые тенденции и особенности что и все количество исследуемого, то такая совокупность называется репрезентативной. Но не каждая определенная выборка может быть отобрана из репрезентативной совокупности. Бывают и такие объекты исследования, выборка которых просто не может быть репрезентативной. Отсюда и возникает понятие ошибки репрезентативности. Но об этом поговорим подробнее чуть больше.

Как сделать выборку

Итак, чтобы репрезентативность была максимальной, выделяют три основные правила выборки:

  1. Самым уникальным показателем числа выборки считается 20 %. Статистическая выборка в 20 % будет практически всегда давать результат максимально приближенный к действительности. В то же самое время нет необходимости переносить в собранную большую часть генеральной совокупности. 20 % выборки – это тот показатель, который выработан многими исследованиями. Приведем еще немного теории. Чем больше выборка, тем меньше ошибка репрезентативности и точнее результат исследования. Чем ближе будет выборочная совокупность к генеральной по количеству единиц, тем более точными и правильными будут результаты. Ведь если исследовать всю систему, тогда результат будет 100 %. Но здесь уже нет выборки. Это те исследования, в которых исследуется весь массив, все единицы, поэтому это нас не интересует.
  2. В случае нецелесообразности обработки 20 % генеральной совокупности допускается изучение единиц совокупности в количестве не менее 1001. Это также один из показателей исследования массива объекта исследования, который выработался со временем. Конечно же, он не даст точных результатов при больших массивах исследования, но максимально приблизит к возможной точности выборки.
  3. В статистике существует множество формул и сведенных таблиц. В зависимости от объекта исследования и от критерия выборки, существует целесообразность выбора той или иной формулы. Но этот пункт используется в сложных и многоэтапных исследованиях.

Погрешность (ошибка) репрезентативности

Главной характеристикой качества выбранной выборки является понятие «погрешности репрезентативности». Что же это такое? Это определенные расхождения между показателями выборочного и сплошного наблюдения. По показателям погрешности репрезентативность делят на надежную, обычную и приближенную. Иначе говоря, допустимыми являются отклонения в размере до 3 %, от 3 до 10 % и от 10 до 20 % соответственно. Хотя в статистике желательно, чтобы погрешность не превышал 5-6 %. В противном случае есть повод говорить о недостаточной репрезентативности выборки. Для вычисления погрешности репрезентативности и того, как она влияет на выборочную или генеральную совокупность, во внимание берутся многие факторы:

  1. Вероятность, с которой необходимо получить точный результат.
  2. Количества единиц выборочной совокупности. Как уже упоминалось ранее, чем меньше единиц составит выборка, тем больше будет ошибка репрезентативности, и наоборот.
  3. Однородность исследуемой совокупности. Чем более разнородной является совокупность, тем больше будет погрешность репрезентативности. Возможность совокупности быть репрезентативной зависит от однородности всех ее составляющих единиц.
  4. Способ отбора единиц в выборочную совокупность.

В конкретно заданных исследованиях процент погрешности среднего значения обычно задается самим исследователем на основании программы наблюдения и согласно данным ранее проведенных исследований. Как правило, считается допустимой предельная ошибка выборки (ошибка репрезентативности) в пределах 3-5 %.


Больше – не всегда лучше

Также стоит помнить, что главное при организации выборочного наблюдения - это доведение его объема до допустимого минимума. При этом не следует стремиться к чрезмерному уменьшению границ погрешности выборки, так как это может привести к неоправданному увеличению объема данных выборки и, следовательно, к повышению расходов на проведение выборочного наблюдения.

В то же время нельзя и чрезмерно увеличивать размер погрешности репрезентативности. Ведь в этом случае, хотя и произойдет уменьшение объема выборочной совокупности, это приведет к ухудшению достоверности полученных результатов.

Какие вопросы обычно ставится перед исследователем

Любое исследование если и проводится, то для какой-то цели и для получения каких-то результатов. При проведении выборочного исследования, как правило, ставятся начальные вопросы:

  1. Определение необходимого количества единиц выборочной совокупности, то есть то, сколько единиц будет исследоваться. К тому же, для точного исследования совокупность должна быть репрезентативной.
  2. Расчет погрешности репрезентативности с установленным уровнем вероятности. Сразу стоит отметить, что выборочных исследований не бывает с уровнем вероятности 100 %. Если та инстанция, которая проводила изучение определенного сегмента, утверждает, что их результаты точны с вероятностью 100 %, то это ложь. Многолетняя практика уже установила процент вероятности правильно проведенного выборочного исследования. Этот показатель равняется 95,4 %.

Способы отбора единиц исследования в выборку

Не каждая выборка является репрезентативной. Иногда один и тот же признак по-разному выражен в целом и в ее части. Для достижения требований репрезентативности целесообразным является использование различных приемов создания выборки. Причем использование того или иного способа зависит от конкретных обстоятельств. Среди таких приемов создания выборки выделяют:

  • случайный отбор;
  • механический отбор;
  • типичный отбор;
  • серийный (гнездовой) отбор.

Случайный отбор представляет собой систему мероприятий, направленных на случайный отбор единиц совокупности, когда вероятность попасть в выборку является равной для всех единиц генеральной совокупности. Этот прием целесообразно применять только в случае однородности и небольшого количества присущих ей признаков. В противном случае некоторые характерные черты рискуют быть не отраженным в выборке. Признаки случайного отбора лежат в основе всех других способов построения выборки.

При механическом отбор единиц проводится через определенный интервал. Если необходимо сформировать выборку конкретных преступлений, можно изымать из всех карточек статистического учета зарегистрированных преступлений каждую 5-ю, 10-ю или 15-ю карточку в зависимости от их общего количества и имеющихся размеров выборки. Недостатком этого способа является то, что перед отбором необходимо иметь полный учет единиц совокупности, затем нужно провести ранжирование и только после этого можно проводить выборку с определенным интервалом. Этот метод занимает много времени, поэтому он и не часто используется.


Типичный (районированный) отбор – вид выборки, при котором генеральную совокупность разделяют на однородные группы по определенному признаку. Иногда исследователи употребляют вместо «групп» другие термины: «районы» и «зоны». Затем из каждой группы в случайном порядке отбирается определенное количество единиц пропорционально удельному весу группы в общей совокупности. Типичный отбор часто осуществляется в несколько этапов.

Серийный отбор - это такой метод, при котором отбор единиц проводится группами (сериями) и обследованию подлежат все единицы отобранной группы (серии). Преимуществом этого способа является то, что иногда отобрать отдельные единицы сложнее, чем серии, например, при изучении личности, которая отбывает наказание. В рамках отобранных районов, зон применяется изучение всех единиц без исключения, например, изучение всех лиц, отбывающих наказание в каком-то определенном учреждении.

Тема: Выборочный метод в статистике

1. Понятие о выборочном наблюдении, его задачи

Статистическое наблюдение можно органи­зовать сплошное и несплошное. Сплошное наблюдение предусмат­ривает обследование всех единиц изучаемой совокупности и свя­зано с большими трудовыми и материальными затратами. Изуче­ние не всех единиц совокупности, а лишь некоторой части, по ко­торой следует судить о свойствах всей совокупности в целом, мож­но осуществить несплошным наблюдением. В статистической прак­тике самым распространенным является выборочное наблюдение.

Выборочное наблюдение - это такой вид несплошного наблюдения, при котором отбор подлежащих обследованию единиц осуществляется в случайном порядке, отобранная часть изучается, а результаты распро­страняются на всю исходную совокупность. Наблюдение организует­ся таким образом, что эта часть отобранных единиц в уменьшенном масштабе репрезентирует (представляет) всю совокупность.

Совокупность, из которой производится отбор, называется ге­неральной, генеральными.

Совокупность отобранных единиц именуют выборочной сово­купностью, и все ее обобщающие показатели - выборочными.

Имеется ряд причин, в силу которых, во многих слу­чаях выборочному наблюдению отдается предпочтение перед сплошным. Наиболее существенны из них следующие:

Экономия времени и средств в результате сокращения объ­ема работы;

Сведение к минимуму порчи или уничтожения исследуемых объектов (определение прочности пряжи при разрыве, ис­пытание электрических лампочек на продолжительность горения, проверка консервов на доброкачественность);

Необходимость детального исследования каждой единицы наблюдения при невозможности охвата всех единиц (при изучении бюджета семей);

Достижение большой точности результатов обследова­ния благодаря сокращению ошибок, происходящих при регистрации.

Преимущество выборочного наблюдения по сравнению со сплошным можно реализовать, если оно организовано и проведено в строгом соответствии с научными принципами теории выбороч­ного метода. Такими принципами являются: обеспечение случайно­сти (равной возможности попадания в выборку) отбора единиц и достаточного их числа. Соблюдение этих принципов позволяет по­лучить объективную гарантию репрезентативности полученной вы­борочной совокупности. Понятие репрезентативности отобранной совокупности не следует понимать как ее представительство по всем признакам изучаемой совокупности, а только в отношении тех признаков, которые изучаются или оказывают существенное влияние на формирование сводных обобщающих характеристик.

Основная задача выборочного наблюдения в экономике со­стоит в том, чтобы на основе характеристик выборочной сово­купности (средней и доли) получить достоверные суждения о показателях средней и доли в генеральной совокупности. При этом следует иметь в виду, что при любых статистических ис­следованиях (сплошных и выборочных) возникают ошибки двух видов: регистрации и репрезентативности.

Ошибки регистрации могут иметь случайный (непреднамеренный) и систематический (тенденциозный) характер. Случайные ошибки обычно уравновешивают друг друга, поскольку не имеют преимущественного направления в сторону преувеличения или преуменьшения значения изучаемого показателя. Систематические ошибки направлены в одну сторону вследствие преднамеренного нарушения правил отбора (предвзятые цели). Их можно избежать при правильной организации и проведении наблюдения.

Ошибки репрезентативности присущи только выборочно­му наблюдению и возникают в силу того, что выборочная сово­купность не полностью воспроизводит генеральную. Они пред­ставляют собой расхождение между значениями показателей, по­лученных по выборке, и значениями показателей этих же вели­чин, которые были бы получены при проведенном с одинаковой степенью точности сплошном наблюдении, т. е. между величи­нами выборных и соответствующих генеральных показателей.

Для каждого конкретного выборочного наблюдения значе­ние ошибки репрезентативности может быть определено по со­ответствующим формулам, которые зависят от вида, метода и способа формирования выборочной совокупности.

По виду различают индивидуальный, групповой и комби­нированный отбор. При индивидуальном отборе в выборочную совокупность отбираются отдельные единицы генеральной со­вокупности; при групповом отборе - качественно однородные группы или серии изучаемых единиц; комбинированный отбор предполагает сочетание первого и второго видов.

По методу отбора различают повторную и бесповтор­ную выборки.

При повторной выборке общая численность единиц генеральной совокупности в процессе выборки остается неизменной. Ту или иную единицу, попавшую в выборку, после регистрации снова возвращают в генеральную совокупность, и она сохраняет равную возможность со всеми прочими единицами при повторном отборе единиц вновь попасть в выборку («отбор по схеме возвращенного шара»). Повторная выборка в социально-экономической жизни встречается редко. Обычно выборку организуют по схеме беспо­вторной выборки.

При бесповторной выборке единица совокупности, попавшая в выборку, в генеральную совокупность не возвращается и в дальнейшем в выборке не участвует; т. е. последующую выборку делают из генеральной совокупности уже без отобранных ранее единиц («отбор по схеме невозвращенного шара»). Таким обра­зом, при бесповторной выборке численность единиц генераль­ной совокупности сокращается в процессе исследования.

Способ отбора определяет конкретный механизм или процедуру выборки единиц из генеральной совокупности.

По степени охвата единиц совокупности различают большие и малые (n <30) выборки.

В практике выборочных исследований наибольшее распро­странение получили следующие виды выборки: собственно-случайная, механическая, типическая, серийная, комбинированная.

Основные характеристики параметров гене­ральной и выборочной совокупностей обозначаются символами:

N-объем генеральной совокупности (число входящих в нее единиц);

п - объем выборки (число обследованных единиц);

- генеральная средняя (среднее значение признака в генеральной совокупности);

Выборочная средняя;

P - генеральная доля (доля единиц, обладающих дан­ным значением признака в общем числе единиц генеральной совокупности);

w - выборочная доля;

- генеральная дисперсия (дисперсия признака в ге­неральной совокупности);

S 2 - выборочная дисперсия того же признака;

- среднее квадратическое отклонение в генеральной совокупности;

S - среднее квадратическое отклонение в выборке.

2. Ошибки выборки

При выборочном наблюдении должна быть обеспечена слу­чайность отбора единиц. Каждая единица должна иметь равную с другими возможность быть отобранной. Именно на этом ос­новывается собственно-случайная выборка.

К собственно-случайной выборке относится отбор единиц из всей генеральной совокупности (без предварительного рас­членения ее на какие-либо группы) посредством жеребьевки (преимущественно) или какого-либо иного подобного спосо­ба, например, с помощью таблицы случайных чисел. Случай­ный отбор - это отбор не беспорядочный. Принцип случай­ности предполагает, что на включение или исключение объ­екта из выборки не может повлиять какой-либо фактор, кро­ме случая. Примером собственно-случайного отбора могут служить тиражи выигрышей: из общего количества выпущен­ных билетов наугад отбирается определенная часть номеров, на которые приходятся выигрыши. Причем всем номерам обеспечивается равная возможность попадания в выборку. При этом количество отобранных в выборочную совокупность единиц обычно определяется исходя из принятой доли выборки.

Доля, выборки есть отношение числа единиц выборочной со­вокупности к числу единиц генеральной совокупности:

Так, при 5%-ной выборке из партии деталей в 1000 ед. объ­ем выборки п составляет 50 ед., а при 10%-ной выборке -100 ед. и т.д. При правильной научной организации выборки ошибки репрезентативности можно свести к минимальном значениям, в результате - выборочное наблюдение становится достаточно точным.

Собственно-случайный отбор «в чистом виде» применяет­ся в практике выборочного наблюдения редко, но он является исходным среди всех других видов отбора, в нем заключаются и реализуются основные принципы выборочного наблюдения.

Рассмотрим некоторые вопросы теории выборочного метода и формулы ошибок для простой случайной выборки.

Применяя выборочный метод в статистике, обычно используют два основных вида обобщающих показателей: среднюю величину ко­личественного признака и относительную величину альтернативного признака (долю или удельный вес единиц в статистической сово­купности, которые отличаются от всех других единиц этой сово­купности только наличием изучаемого признака).

Выборочная доля ( w ), или частость, определяется отношением числа единиц, обладающих изучаемым признаком т, к общему числу единиц выборочной совокупности п:

w = т/п.

Например, если из 100 деталей выборки (и = 100), 95 деталей оказались стандартными =95), то выборочная доля

w = 95 / 100 = 0,95 .

Для характеристики надежности выборочных показателей различают среднюю и предельную ошибки выборки.

Ошибка выборки или, иначе говоря, ошибка репрезента­тивности представляет собой разность соответствующих выбо­рочных и генеральных характеристик:

(1)

(2)

Ошибка выборки свойственна только выборочным наблюде­ниям. Чем больше значение этой ошибки, тем в большей степе­ни выборочные показатели отличаются от соответствующих ге­неральных показателей.

Выборочная средняя и выборочная доля по своей сути яв­ляются случайными величинами, которые могут принимать раз­личные значения в зависимости от того, какие единицы сово­купности попали в выборку. Следовательно, ошибки выборки также являются случайными величинами и могут принимать различные значения. Поэтому определяют среднюю из возмож­ных ошибок - среднюю ошибку выборки.

От чего зависит средняя ошибка выборки! При соблюдении принципа случайного отбора средняя ошибка выборки определяется, прежде всего объемом выборки: чем больше численность при прочих равных условиях, тем меньше величина средней ошибки выборки. Охватывая выборочным обследованием все большее количество единиц генеральной совокупности, всё более точно характеризуем всю генеральную совокупность.

Средняя ошибка выборки также зависит от степени варьи­рования изучаемого признака. Степень варьирования, как из­вестно, характеризуется дисперсией или w (1 - w ) - для альтернативного признака. Чем меньше вариация признака, а следовательно, и дисперсия, тем меньше средняя ошибка вы­борки, и наоборот. При нулевой дисперсии (признак не варь­ирует) средняя ошибка выборки равна нулю, т. е. любая еди­ница генеральной совокупности будет совершенно точно ха­рактеризовать всю совокупность по этому признаку.

Зависимость средней ошибки выборки от ее объема и степе­ни варьирования признака отражена в формулах, с помощью которых можно рассчитать среднюю ошибку выборки в услови­ях выборочного наблюдения, когда генеральные характеристики (х,р) неизвестны, и следовательно, не представляется возмож­ным нахождение реальной ошибки выборки непосредственно по формулам (1), (2).

При случайном повторном отборе средние ошибки теоретически рассчитывают по следующим формулам:

для средней количественного признака

(3)

для доли (альтернативного признака)

(4)

Поскольку практически дисперсия признака в генеральной совокупности точно неизвестна, на практике пользуются

значением дисперсии S 2 , рассчитанным для выборочной сово­купности на основании закона больших чисел, согласно кото­рому выборочная совокупность при достаточно большом объеме выборки достаточно точно воспроизводит характеристики гене­ральной совокупности.

Таким образом, расчетные формулы средней ошиб­ки выборки при случайном повторном отборе будут следующие:

для средней количественного признака

для доли (альтернативного признака)

(6)

Однако дисперсия выборочной совокупности не равна диспер­сии генеральной совокупности, и следовательно, средние ошибки выборки, рассчитанные по формулам (5) и (6), будут прибли­женными. Но в теории вероятностей доказано, что генеральная дисперсия выражается через выборочную следующим соотношением:

(7)

Так как п / (n -1) при достаточно больших п - величина, близкая к единице, то можно принять, что = S 2 , а следова­тельно, в практических расчетах средних ошибок выборки мож­но использовать формулы (5) и (6). И только в случаях ма­лой выборки (когда объем выборки не превышает 30) необхо­димо учитывать коэффициент п/(п-1) и исчислять среднюю ошибку малой выборки по формуле:

(8)

в приведенные выше формулы расчета средних ошибок выборки необходимо подко­ренное выражение умножить на 1-(п/ N ), поскольку в процес­се бесповторной выборки сокращается численность единиц ге­неральной совокупности. Следовательно, для бесповторной вы­борки расчетные формулы средней ошибки выборки примут такой вид:

для средней количественного признака

(9)

для доли (альтернативного признака)

(10)

Так как п всегда меньше N , то дополнительный множи­тель 1 - (n / N ) всегда будет меньше единицы. Отсюда следу­ет, что средняя ошибка при бесповторном отборе всегда будет меньше, чем при повторном. В то же время при сравнительно небольшом проценте выборки этот множитель близок к еди­нице (например, при 5%-ной выборке он равен 0,95; при 2%-ной - 0,98 и т.д.). Поэтому иногда на практике пользуются для определения средней ошибки выборки формулами (5) и (6) без указанного множителя, хотя выборку и организуют как бесповторную. Это имеет место в тех случаях, когда число единиц генеральной совокупности N неизвестно или безгра­нично, или когда п очень мало по сравнению с N, и по су­ществу, введение дополнительного множителя, близкого по значению к единице, практически не повлияет на значение средней ошибки выборки.

Механическая выборка состоит в том, что отбор единиц в выборочную совокупность из генеральной, разбитой по ней­тральному признаку на равные интервалы (группы), произво­дится таким образом, что из каждой такой группы в выборку отбирается лишь одна единица. Чтобы избежать систематиче­ской ошибки, отбираться должна единица, которая находится в середине каждой группы.

При организации механического отбора единицы совокуп­ности предварительно располагают (обычно в списке) в опре­деленном порядке (например, по алфавиту, местоположению, в порядке возрастания или убывания значений какого-либо по­казателя, не связанного с изучаемым свойством, и т.д.), после чего отбирают заданное число единиц механически, через оп­ределенный итервал. При этом размер интервала в генеральной совокупности равен обратному значению доли выборки. Так, при 2%-ной выборке отбирается и проверяется каждая 50-я единица (1: 0,02), при 5 %-ной выборке - каждая 20-я едини­ца (1: 0,05), например, сходящая со станка деталь.

При достаточно большой совокупности механический отбор по точности результатов близок к собственно-случайному. По­этому для определения средней ошибки механической выборки используют формулы собственно-случайной бесповторной вы­борки (9), (10).

Для отбора единиц из неоднородной совокупности применя­ется, так называемая типическая выборка, которая используется в тех случаях, когда все единицы генеральной совокупности можно разбить на несколько качественно однородных, однотипных групп по признакам, влияющим на изучаемые показатели.

При обследовании предприятий такими группами могут быть, например, отрасль и подотрасль, формы собственности. Затем из каждой типической группы собственно-случайной или механической выборкой производится индивидуальный отбор единиц в выборочную совокупность.

Типическая выборка обычно применяется при изучении слож­ных статистических совокупностей. Например, при выборочном обследовании семейных бюджетов рабочих и служащих в отдель­ных отраслях экономики, производительности труда рабочих пред­приятия, представленных отдельными группами по квалификации.

Типическая выборка дает более точные результаты по сравнению с другими способами отбора единиц в выбороч­ную совокупность. Типизация генеральной совокупности обеспечивает репрезентативность такой выборки, представи­тельство в ней каждой типологической группы, что позволяет исключить влияние межгрупповой дисперсии на среднюю ошибку выборки,

При определении средней ошибки типической выборки в ка­честве показателя вариации выступает средняя из внутригрупповых дисперсий.

Среднюю ошибку выборки находят по формулам:

для средней количественного признака

(повторный отбор); (11)

(бесповторный отбор); ( 12)

для доли (альтернативного признака)

(повторный отбор); (13)

(бесповторный отбор), (14)

где - средняя из внутригрупповых дисперсий по вы­борочной совокупности;

Средняя из внутригрупповых дисперсий доли (альтер­нативного

признака) по выборочной совокупности.

Серийная выборка предполагает случайный отбор из генераль­ной совокупности не отдельных единиц, а их равновеликих групп (гнезд, серий) с тем, чтобы в таких группах подвергать наблюде­нию все без исключения единицы.

Применение серийной выборки обусловлено тем, что многие товары для их транспортировки, хранения и продажи упаковываются в пачки, ящики и т.п. Поэтому при контроле качества упакованного товара рациональнее проверить не­сколько упаковок (серий), чем из всех упаковок отбирать не­обходимое количество товара.

Поскольку внутри групп (серий) обследуются все без исключе­ния единицы, средняя ошибка выборки (при отборе равновеликих серий) зависит только от межгрупповой (межсерийной) дисперсии.

Среднюю ошибку выборки для средней количественного при­знака при серийном отборе находят по формулам:

(повторный отбор); (15 )

(бесповторный отбор), (16 )

где r - число отобранных серий; R - общее число серий.

Межгрупповую дисперсию серийной выборки вычисляют сле­дующим образом:

где - средняя i-й серии; - общая средняя по всей выбо­рочной совокупности.

Средняя ошибка выборки для доли (альтернативного при­знака) при серийном отборе:

(повторный отбор); (17 )

(бесповторный отбор). (18 )

Межгрупповую (межсерийную) дисперсию доли серийной вы­борки определяют по формуле:

(19)

где w i - доля признака в i-и серии; - общая доля признака во всей выборочной совокупности.

В практике статистических обследований помимо рассмот­ренных ранее способов отбора применяется их комбинация (комбинированный отбор).

3. Распространение выборочных результатов на генеральную совокупность

Конечной целью выборочного наблюдения является ха­рактеристика генеральной совокупности на основе выбороч­ных результатов.

Выборочные средние и относительные величины распро­страняют на генеральную совокупность с учетом предела их возможной ошибки.

В каждой конкретной выборке расхождение между выбороч­ной средней и генеральной, т. е. может быть меньше средней ошибки выборки , равно ей или больше ее.

Причем каждое из этих расхождений имеет различную веро­ятность (объективную возможность появления события). По­этому фактические расхождения между выборочной средней и генеральной можно рассматривать как некую предельную ошибку, связанную со средней ошибкой и гарантируемую с оп­ределенной вероятностью Р.

Предельную ошибку выборки для средней () при повторном отборе можно рассчитать по формуле:

(20)

где t - нормированное отклонение - «коэффициент доверия», за­висящий от вероятности, с которой гарантируется предельная ошибка выборки;

Средняя ошибка выборки.

Аналогичным образом может быть записана формула предельной ошибки выборки для доли при повторном отборе:

(21)

При случайном бесповторном отборе в формулах расчета пре­дельных ошибок выборки (20) и (21) необходимо умножить подкоренное выражение на 1 - (n / N ) .

Формула предельной ошибки выборки вытекает из основных положений теории выборочного метода, сформулированных в ряде теорем теории вероятностей, отражающих закон больших чисел.

На основании теоремы П.Л. Чебышева (с уточ­нениями А.М. Ляпунова) с вероятностью, сколь угодно близкой к единице, можно утверждать, что при достаточно большом объеме выборки и ограниченной генеральной дисперсии выборочные обоб­щающие показатели (средняя, доля) будут сколь угодно мало отли­чаться от соответствующих генеральных показателей.

Применительно к нахождению среднего значения признака эта теорема может быть записана так:

(22)

а для доли признака:

(23 )

где(24)

Таким образом, величина предельной ошибки выборки мо­жет быть установлена с определенной вероятностью.

Значения функции Ф( t ) при различных значениях t как ко­эффициента кратности средней ошибки выборки, определяются на основе специально составленных таблиц. Приведем некото­рые значения, применяемые наиболее часто для выборок дос­таточно большого объема (n 30):

t 1,000 1,960 2,000 2,580 3,000

Ф( t ) 0,683 0,950 0,954 0,990 0,997

Предельная ошибка выборки отвечает на вопрос о точности выборки с определенной вероятностью, значение которой оп­ределяется коэффициентом t (в практических расчетах, как правило, заданная вероятность не должна быть менее 0,95). Так, при t = 1 предельная ошибка составит = . Следова­тельно, с вероятностью 0,683 можно утверждать, что разность между выборочными и генеральными показателями не превы­сит одной средней ошибки выборки. Другими словами, в 68,3% случаев ошибка репрезентативности не выйдет за пределы ±1.

При t = 2 с вероятностью 0,954 она не выйдет за пределы ±2 ,

при t = 3 с вероятностью 0,997 - за пределы ±3 и т.д.

Как видно из приведённых выше значений функции Ф (t ) (см. последнее значение), вероятность появления ошибки, равной или большей утроенной средней ошибки выборки, т. е. 3 крайне мала и равна 0,003, т. е. 1-0,997. Такие маловероятные события считаются практически невозможными, а потому величину = 3можно принять за предел возможной ошибки выборки.

Выборочное наблюдение проводится в целях распростране­ния выводов, полученных по данным выборки, на генеральную совокупность. Одной из основных задач является оценка по данным выборки исследуемых характеристик (параметров) гене­ральной совокупности.

Предельная ошибка выборки позволяет определить предель­ные значения характеристик генеральной совокупности и их дове­рительные интервалы:

для средней (25)

для доли (26)

Это означает, что с заданной вероятностью можно утвер­ждать, что значение генеральной средней следует ожидать в пределах от - до +

Аналогичным образом может быть записан доверительный интервал генеральной доли:

Наряду с абсолютным значением предельной ошибки вы­борки рассчитывается и предельная относительная ошибка выбор­ки, которая определяется как процентное отношение предель­ной ошибки выборки к соответствующей характеристике выбо­рочной совокупности:

для средней, %: (27)

для доли, %: (28)

Рассмотрим нахождение средних и предельных ошибок вы­борки, определение доверительных пределов средней и доли на конкретных примерах.

Задача 1. Для определения скорости расчетов с кредиторами предприятий корпорации в коммерческом банке была проведена случайная выборка 100 платежных документов, по которым сред­ний срок перечисления и получения денег оказался равным 22 дням ( = 22) со стандартным отклонением 6 дней (S= 6).

Необходимо с вероятностью Р = 0,954 определить пре­дельную ошибку выборочной средней и доверительные пределы средней продолжительности расчетов предприятий данной кор­порации.

Решение. Предельную ошибку = t определяем по формуле по­вторного отбора (6.20), так как численность генеральной совокупности N неизвестна. Из представленных значений Ф (t ) (см. с. 98) для вероятности Р = 0,954 находим t = 2.

Следовательно, предельная ошибка выборки, дней:

Генеральная средняя будет равна = ± , а доверительные интервалы (пределы) генеральной средней исчисляем, исходя из двойного неравенства:

Таким образом, с вероятностью 0,954 можно утверждать, что средняя продолжительность расчетов предприятий данной корпо­рации колеблется в пределах от 20,8 до 23,2 дней.

Задача 2. Среди выборочно обследованных 1000 семей региона по уровню душевого дохода (выборка 2%-ная, механическая) мало­обеспеченных оказалось 300 семей.

Требуется с вероятностью 0,997 определить долю мало­обеспеченных семей во всем регионе.

Решение. Выборочная доля (доля малообеспеченных семей сре­ди обследованных семей) равна:

По представленным ранее данным Ф(t ) для вероятности 0,997 находим t = 3 (см. с. 99). Предельную ошибку доли определя­ем по формуле бесповторного отбора (механическая выборка всегда является бесповторной):

Предельная относительная ошибка выборки, %:

Генеральная доляа доверительные пределы генеральной доли исчисляем, исходя из двойного неравенства:

В нашем примере:

Таким образом, почти достоверно, с вероятностью 0,997 можно утверждать, что доля малообеспеченных семей среди всех семей региона колеблется от 28,6 до 31,4%.

Задача 3. Для определения урожайности зерновых культур про­ведено выборочное обследование 100 хозяйств региона различных форм собственности, в результате которого получены сводные дан­ные (табл.6.1). Необходимо с вероятностью 0,954 опреде­лить предельную ошибку выборочной средней и доверительные пределы средней урожайности зерновых культур по всем хозяйст­вам региона.

Таблица 6.1

Распределение урожайности по хозяйствам региона, имеющим различную форму собственности

Решение. Поскольку обследованные хозяйства региона сгруппи­рованы по формам собственности, предельную ошибку средней урожайности определяем по формуле для типической выборки, осуществляемой методом повторного отбора (численность гене­ральной совокупности N неизвестна):

В этой формуле неизвестна средняя из внутригрупповых дис­персий.

Она исчисляется по формуле:

По представленным ранее (см. с. 98) данным Ф (t ) для вероят­ности Р =0,954 находим t = 2.

Тогда предельная ошибка выборки, ц/га:

Генеральная средняя: = ± . Для нахождения ее границ вначале нужно исчислить среднюю урожайность по выборочной со­вокупности , ц/га:

Предельная относительная ошибка выборки, %:

Доверительные пределы генеральной средней исчисляем, исхо­дя из двойного неравенства:

Таким образом, с вероятностью 0,954 можно гарантировать, что средняя урожайность зерновых культур по региону будет не менее чем 20 ц/га, но и не более чем 22 ц/га.

Определение необходимого объема выборки. При проектирова­нии выборочного наблюдения с заранее заданным значением допустимой ошибки выборки очень важно правильно опреде­лить численность (объем) выборочной совокупности, которая с определенной вероятностью обеспечит заданную точность ре­зультатов наблюдения. Формулы для определения необходимой численности выборки п легко получить непосредственно из формул ошибок выборки.

Так, из формул предельной ошибки выборки для повтор­ного отбора нетрудно (предварительно возведя в квадрат обе части равенства) выразить необходимую численность выборки:

для средней количественного признака

для доли (альтернативного признака)

(30 )

Аналогично из формул предельной ошибки выборки для бес­повторного отбора находим, что

(для средней); (31 )

(для доли). (32 )

Эти формулы показывают, что с увеличением предполагае­мой ошибки выборки значительно уменьшается необходимый объем выборки.

Для расчета объема выборки нужно знать дисперсию. Она может быть заимствована из проводимых ранее обследований данной или аналогичной совокупности, а если таковых нет, то­гда для определения дисперсии надо провести специальное вы­борочное обследование небольшого объема.

Задача 4. Для определения среднего возраста 1200 студентов факультета необходимо провести выборочное обследование мето­дом случайного бесповторного отбора. Предварительно установле­но, что среднее квадратическое отклонение возраста студентов рав­но 10 годам.

Сколько студентов нужно обследовать, чтобы с вероятно­стью 0,954 средняя ошибка выборки не превышала 3 года?

Решение. Рассчитаем необходимую численность выборки, чел., по формуле бесповторного отбора (6.31), учитывая, что t = 2 при Р = 0,954:

Таким образом, выборка численностью 47 чел. обеспечивает задан­ную точность при бесповторном отборе.

Выборочный метод широко используется в статистической практике для получения экономической информации.

Большую актуальность приобретает выборочный метод в со­временных условиях перехода к рыночной экономике. Изменения в характере экономических отношений, аренда, собственность от­дельных коллективов и лиц обусловливают изменения функций учета и статистики, сокращение и упрощение отчетности. Вместе с тем, возрастающие требования к менеджменту усиливают потреб­ность в обеспечении надежной информацией, дальнейшего повы­шения ее оперативности. Все это обусловливает более широкое применение выборочного метода в экономике.

В отечественной статистике уже накоплен определенный опыт выборочных обследований.

Суммарная численность объектов наблюдения (люди, домохозяйства, предприятия, населенные пункты и т.д.), обладающих определенным набором признаков (пол, возраст, доход, численность, оборот и т.д.), ограниченная в пространстве и времени. Примеры генеральных совокупностей

  • Все жители Москвы (10,6 млн. человек по данным переписи 2002 года)
  • Мужчины-Москвичи (4,9 млн. человек по данным переписи 2002 года)
  • Юридические лица России (2,2 млн. на начало 2005 года)
  • Розничные торговые точки, осуществляющие продажу продуктов питания (20 тысяч на начало 2008 года) и т.д.

Выборка (Выборочная совокупность)

Часть объектов из генеральной совокупности, отобранных для изучения, с тем чтобы сделать заключение обо всей генеральной совокупности. Для того чтобы заключение, полученное путем изучения выборки, можно было распространить на всю генеральную совокупность, выборка должна обладать свойством репрезентативности.

Репрезентативность выборки

Свойство выборки корректно отражать генеральную совокупность. Одна и та же выборка может быть репрезентативной и нерепрезентативной для разных генеральных совокупностей.
Пример:

  • Выборка, целиком состоящая из москвичей, владеющих автомобилем, не репрезентирует все население Москвы.
  • Выборка из российских предприятий численностью до 100 человек не репрезентирует все предприятия России.
  • Выборка из москвичей, совершающих покупки на рынке, не репрезентирует покупательское поведение всех москвичей.

В то же время, указанные выборки (при соблюдении прочих условий) могут отлично репрезентировать москвичей-автовладельцев, небольшие и средние российские предприятия и покупателей, совершающих покупки на рынках соответственно.
Важно понимать, что репрезентативность выборки и ошибка выборки – разные явления. Репрезентативность, в отличие от ошибки никак не зависит от размера выборки.
Пример:
Как бы мы не увеличивали количество опрошенных москвичей-автовладельцев, мы не сможем репрезентировать этой выборкой всех москвичей.

Ошибка выборки (доверительный интервал)

Отклонение результатов, полученных с помощью выборочного наблюдения от истинных данных генеральной совокупности.
Ошибка выборки бывает двух видов – статистическая и систематическая. Статистическая ошибка зависит от размера выборки. Чем больше размер выборки, тем она ниже.
Пример:
Для простой случайной выборки размером 400 единиц максимальная статистическая ошибка (с 95% доверительной вероятностью) составляет 5%, для выборки в 600 единиц – 4%, для выборки в 1100 единиц – 3% Обычно, когда говорят об ошибке выборки, подразумевают именно статистическую ошибку.
Систематическая ошибка зависит от различных факторов, оказывающих постоянное воздействие на исследование и смещающих результаты исследования в определенную сторону.
Пример:

  • Использование любых вероятностных выборок занижает долю людей с высоким доходом, ведущих активный образ жизни. Происходит это в силу того, что таких людей гораздо сложней застать в каком-либо определенном месте (например, дома).
  • Проблема респондентов, отказывающихся отвечать на вопросы (доля «отказников» в Москве, для разных опросов, колеблется от 50% до 80%)

В некоторых случаях, когда известны истинные распределения, систематическую ошибку можно нивелировать введением квот или перевзвешиванием данных, но в большинстве реальных исследований даже оценить ее бывает достаточно проблематично.

Типы выборок

Выборки делятся на два типа:

  • вероятностные
  • невероятностные

1. Вероятностные выборки
1.1 Случайная выборка (простой случайный отбор)
Такая выборка предполагает однородность генеральной совокупности, одинаковую вероятность доступности всех элементов, наличие полного списка всех элементов. При отборе элементов, как правило, используется таблица случайных чисел.
1.2 Механическая (систематическая) выборка
Разновидность случайной выборки, упорядоченная по какому-либо признаку (алфавитный порядок, номер телефона, дата рождения и т.д.). Первый элемент отбирается случайно, затем, с шагом ‘n’ отбирается каждый ‘k’-ый элемент. Размер генеральной совокупности, при этом – N=n*k
1.3 Стратифицированная (районированная)
Применяется в случае неоднородности генеральной совокупности. Генеральная совокупность разбивается на группы (страты). В каждой страте отбор осуществляется случайным или механическим образом.
1.4 Серийная (гнездовая или кластерная) выборка
При серийной выборке единицами отбора выступают не сами объекты, а группы (кластеры или гнёзда). Группы отбираются случайным образом. Объекты внутри групп обследуются сплошняком.

2.Невероятностные выборки
Отбор в такой выборке осуществляется не по принципам случайности, а по субъективным критериям – доступности, типичности, равного представительства и т.д..
2.1. Квотная выборка
Изначально выделяется некоторое количество групп объектов (например, мужчины в возрасте 20-30 лет, 31-45 лет и 46-60 лет; лица с доходом до 30 тысяч рублей, с доходом от 30 до 60 тысяч рублей и с доходом свыше 60 тысяч рублей) Для каждой группы задается количество объектов, которые должны быть обследованы. Количество объектов, которые должны попасть в каждую из групп, задается, чаще всего, либо пропорционально заранее известной доле группы в генеральной совокупности, либо одинаковым для каждой группы. Внутри групп объекты отбираются произвольно. Квотные выборки используются в достаточно часто.
2.2. Метод снежного кома
Выборка строится следующим образом. У каждого респондента, начиная с первого, просятся контакты его друзей, коллег, знакомых, которые подходили бы под условия отбора и могли бы принять участие в исследовании. Таким образом, за исключением первого шага, выборка формируется с участием самих объектов исследования. Метод часто применяется, когда необходимо найти и опросить труднодоступные группы респондентов (например, респондентов, имеющих высокий доход, респондентов, принадлежащих к одной профессиональной группе, респондентов, имеющих какие-либо схожие хобби/увлечения и т.д.)
2.3 Стихийная выборка
Опрашиваются наиболее доступные респонденты. Типичные примеры стихийных выборок – в газетах/журналах, отданные респондентам на самозаполнение, большинство интернет-опросов. Размер и состав стихийных выборок заранее не известен, и определяется только одним параметром – активностью респондентов.
2.4 Выборка типичных случаев
Отбираются единицы генеральной совокупности, обладающие средним (типичным) значением признака. При этом возникает проблема выбора признака и определения его типичного значения.

Курс лекций по теории статистики

Более подробную информацию по выборочным наблюдениям можно получить просмотрев .

Выборочное наблюдение применяется, когда применение сплошного наблюдения физически невозможно из-за большого массива данных или экономически нецелесообразно . Физическая невозможность имеет место, например, при изучении пассажиропотоков, рыночных цен, семейных бюджетов. Экономическая нецелесообразность имеет место при оценке качества товаров, связанной с их уничтожением, например, дегустация, испытание кирпичей на прочность и т.п.

Статистические единицы, отобранные для наблюдения, составляют выборочную совокупность или выборку , а весь их массив - генеральную совокупность (ГС). При этом число единиц в выборке обозначают n , а во всей ГС - N . Отношение n/N называется относительный размер или доля выборки .

Качество результатов выборочного наблюдения зависит от репрезентативности выборки , то есть от того, насколько она представительна в ГС. Для обеспечения репрезентативности выборки необходимо соблюдать принцип случайности отбора единиц , который предполагает, что на включение единицы ГС в выборку не может повлиять какой-либо иной фактор кроме случая.

Существует 4 способа случайного отбора в выборку:

  1. Собственно случайный отбор или «метод лото», когда статистическим величинам присваиваются порядковые номера, заносимые на определенные предметы (например, бочонки), которые затем перемешиваются в некоторой емкости (например, в мешке) и выбираются наугад. На практике этот способ осуществляют с помощью генератора случайных чисел или математических таблиц случайных чисел.
  2. Механический отбор, согласно которому отбирается каждая (N/n )-я величина генеральной совокупности. Например, если она содержит 100 000 величин, а требуется выбрать 1 000, то в выборку попадет каждая 100 000 / 1000 = 100-я величина. Причем, если они не ранжированы, то первая выбирается наугад из первой сотни, а номера других будут на сотню больше. Например, если первой оказалась единица № 19, то следующей должна быть № 119, затем № 219, затем № 319 и т.д. Если единицы генеральной совокупности ранжированы, то первой выбирается № 50, затем № 150, затем № 250 и так далее.
  3. Отбор величин из неоднородного массива данных ведется стратифицированным (расслоенным) способом, когда генеральная совокупность предварительно разбивается на однородные группы, к которым применяется случайный или механический отбор.
  4. Особый способ составления выборки представляет собой серийный отбор, при котором случайно или механически выбирают не отдельные величины, а их серии (последовательности с какого-то номера по какой-то подряд), внутри которых ведут сплошное наблюдение.

Качество выборочных наблюдений зависит и от типа выборки : повторная или бесповторная.
При повторном отборе попавшие в выборку статистические величины или их серии после использования возвращаются в генеральную совокупность, имея шанс попасть в новую выборку. При этом у всех величин генеральной совокупности одинаковая вероятность включения в выборку.
Бесповторный отбор означает, что попавшие в выборку статистические величины или их серии после использования не возвращаются в генеральную совокупность, а потому для остальных величин последней повышается вероятность попадания в следующую выборку.

Бесповторный отбор дает более точные результаты, поэтому применяется чаще. Но есть ситуации, когда его применить нельзя (изучение пассажиропотоков, потребительского спроса и т.п.) и тогда ведется повторный отбор.

Ошибки выборки

Выборочную совокупность можно сформировать по количественному признаку статистических величин, а также по альтернативному или атрибутивному. В первом случае обобщающей характеристикой выборки служит величина, обозначаемая , а во втором — выборочная доля величин, обозначаемая w . В генеральной совокупности соответственно: генеральная средняя и генеральная доля р .

Разности — и W р называются ошибкой выборки , которая делится на ошибку регистрации и ошибку репрезентативности . Первая часть ошибки выборки возникает из-за неправильных или неточных сведений по причинам непонимания существа вопроса, невнимательности регистратора при заполнении анкет, формуляров и т.п. Она достаточно легко обнаруживается и устраняется. Вторая часть ошибки возникает из-за постоянного или спонтанного несоблюдения принципа случайности отбора. Ее трудно обнаружить и устранить, она гораздо больше первой и потому ей уделяется основное внимание.

Величина ошибки выборки может быть разной для разных выборок из одной генеральной совокупности, поэтому в статистике определяется средняя ошибка повторной и бесповторной выборки по формулам:

Повторная;

- бесповторная;

Где Дв - выборочная дисперсия .

Например, на заводе с численностью работников 1000 чел. проведена 5%-ая случайная бесповторная выборка с целью определения среднего стажа работников. Результаты выборочного наблюдения приведены в первых двух столбцах следующей таблицы:

X , лет
(стаж работы)

f , чел.
(число работников в выборке)

X и

X иf

В 3-м столбце определены середины интервалов X (как полусумма нижней и верхней границ интервала), а в 4-м столбце - произведения X И f для нахождения выборочной средней по формуле средней арифметической взвешенной :

143,0/50 = 2,86 (года).

Рассчитаем выборочную дисперсию взвешенную:
= 105,520/50 = 2,110.

Теперь найдем среднюю ошибку бесповторной выборки:
= 0,200 (лет).

Из формул средних ошибок выборки видно, что ошибка меньше при бесповторной выборке, и, как доказано в теории вероятностей, она возникает с вероятностью 0,683 (то есть если провести 1000 выборок из одной генеральной совокупности, то в 683 из них ошибка не превзойдет средней ошибки выборки). Такая вероятность (0,683) является невысокой, поэтому она мало пригодна для практических расчетов, где нужна более высокая вероятность. Чтобы определить ошибку выборки с более высокой, чем 0,683 вероятностью, рассчитывают предельную ошибку выборки :

Где t – коэффициент доверия, зависящий от вероятности, с которой определяется предельная ошибка выборки.

Значения коэффициента доверия t рассчитаны для разных вероятностей и имеются в специальных таблицах (интеграл Лапласа), из которых в статистике широко применяются следующие сочетания:

Вероятность 0,683 0,866 0,950 0,954 0,988 0,990 0,997 0,999
t 1 1,5 1,96 2 2,5 2,58 3 3,5

Задавшись конкретным уровнем вероятности, выбирают из таблицы соответствующую ей величину t и определяют предельную ошибку выборки по формуле.
При этом чаще всего применяют = 0,95 и t = 1,96, то есть считают, что с вероятностью 95% предельная ошибка выборки в 1,96 раза больше средней. Такая вероятность (0,95) считается стандартной и применяется по умолчанию в расчетах.

В нашем , определим предельную ошибку выборки при стандартной 95%-ой вероятности (из берем t = 1,96 для 95%-ой вероятности): = 1,96*0,200 = 0,392 (года).

После расчета предельной ошибки находят доверительный интервал обобщающей характеристики генеральной совокупности . Такой интервал для генеральной средней величины имеет вид
То есть средний стаж работников на всем заводе лежит в интервале от 2,468 года до 3,252 года.

Определение численности выборки

Разрабатывая программу выборочного наблюдения, иногда задаются конкретным значением предельной ошибки с уровнем вероятности. Неизвестной остается минимальная численность выборки, обеспечивающая заданную точность. Ее можно получить из формул средней и предельной ошибок в зависимости от типа выборки. Так, подставляя и в и, решая ее относительно численности выборки, получим следующие формулы:
для повторной выборки n =
для бесповторной выборки n = .

Кроме того, при статистических величинах с количественными признаками надо знать и выборочную дисперсию, но к началу расчетов и она не известна. Поэтому она принимается приближенно одним из следующих способов (в приоритетном порядке):

При изучении не численных признаков, если даже нет приблизительных сведений о выборочной доле, принимается w = 0,5, что по формуле дисперсии доли соответствует выборочной дисперсии в максимальном размере Дв = 0,5*(1-0,5) = 0,25.