2.4.3. Определение объема выборки и ее размещение ее по слоям

КонсультантПлюс: примечание.

Нумерация подпунктов дана в соответствии с официальным текстом документа.

2.4.3. Определение объема выборки и ее размещение ее по слоям.

Введем следующие обозначения:

┌──────────────────────────────┬──────────────────────┬───────────────────┐

│ │ Совокупность │ Выборка │

├──────────────────────────────┼──────────────────────┼───────────────────┤

│ Объем страты h │ N │ n │

│ │ h │ h │

├──────────────────────────────┼──────────────────────┼───────────────────┤

│ Общая численность │ N = SUM N │ n = SUM n │

│ │ h h │ h h │

├──────────────────────────────┼──────────────────────┼───────────────────┤

│Количество единиц, обладающих │ A │ a │

│определенным свойством (в │ h │ h │

│обследовании качества │ │ │

│статистического регистра - │ │ │

│доля единиц, имеющих │ │ │

│правильную информацию в │ │ │

│статистическом регистре по │ │ │

│контрольным показателям) │ │ │

├──────────────────────────────┼──────────────────────┼───────────────────┤

│Доля единиц, обладающих │ A │ a │

│определенным свойством (в │ h │ h │

│обследовании качества │ P = --- │ p = --- │

│статистического регистра - │ h N │ h n │

│доля единиц, имеющих │ h │ h │

│правильную информацию в │ │ │

│статистическом регистре по │ │ │

│контрольным показателям) │ │ │

└──────────────────────────────┴──────────────────────┴───────────────────┘

Пусть V - желательное значение дисперсии при оценивании доли P, которое можно определить исходя из задаваемой длины доверительного интервала.

00000001.wmz, где 00000002.wmz - квантиль стандартного нормального распределения, соответствующий доверительной вероятности 00000003.wmz, L - 1/2 длины доверительного интервала.

Варьируя длину доверительного интервала, можно рассчитывать для конкретной совокупности различные соответствующие значения объема выборки.

При оптимальном (обеспечивающем минимальное значение оценки дисперсии) размещении объема выборки по слоям общий объем выборки 00000004.wmz 00000005.wmz.

Из-за большого объема генеральной совокупности здесь не учитывается поправка на конечность совокупности и считается 00000006.wmz.

Так как мы не имеем никакой информации о распределении значений долей по слоям, то мы предполагаем самый худший вариант и задаем 00000007.wmz, тогда 00000008.wmz.

Таким образом, в нашем случае объем выборки в слое зависит от общего объема выборки и фактически соответствует пропорциональному размещению.

Пример. Рассмотрим применение этого алгоритма на данных Генеральной совокупности предприятий и организаций одного из регионов России. В таблице 2 представлено распределение единиц по укрупненным видам деятельности и типам организации.