Второй массив

Расслоение второго массива производится по признаку "всего поступило средств" и по видам экономической деятельности по ОКВЭД2. Для расчета объема выборки во втором массиве определяем количество слоев по исследуемому признаку (показателю) "всего поступило средств" по каждому исследуемому виду экономической деятельности по ОКВЭД2.

Границы слоев выбираются по правилу Экмана.

Nj (Cj - Cj-1) = const,

где

Cj, j = 1, ..., J

-

границы слоев;

C0 = xmin

-

минимальное значение показателя в исследуемом виде экономической деятельности;

Cj = xmax

-

максимальное значение показателя в слое j исследуемого вида экономической деятельности;

x

-

количественный признак;

Nj

-

количество организаций в слое j.

Количество организаций в каждом слое должно быть больше или равно (>=) 4.

Слои по каждому виду экономической деятельности по ОКВЭД2 должны быть сформированы таким образом, чтобы:

в них попали все СОНКО, образующих основу выборки исследуемого вида экономической деятельности второго массива;

слои должны быть закрытыми, т.е. для каждого слоя должна быть определена минимальная и максимальная границы по значению показателя "всего поступило средств";

разница между минимальной и максимальной границами соседних слоев должна быть равна единице;

организации с одинаковым значением показателя "всего поступило средств" не могут быть отнесены к разным слоям.

Далее определяем объем выборки по каждому виду экономической деятельности по ОКВЭД2 по показателю "всего поступило средств".

Рисунок 2,

где

n2g

-

объем выборки в g виде экономической деятельности во 2 массиве;

N2gj

-

количество организаций слоя j, принадлежащего g-му виду экономической деятельности во 2 массиве;

X2g

-

суммарное значение показателя ("всего поступило средств") для организаций, относящихся ко 2 массиву базовой совокупности по виду экономической деятельности g;

S2gj

-

среднеквадратическое отклонение по показателю "всего поступило средств" для организаций слоя j, принадлежащего g-му виду экономической деятельности во 2 массиве;

RE

-

заданная относительная погрешность этого показателя.

рекомендуется для выборки значение RE = 0,05;

tp

-

квантиль стандартного нормального распределения или распределения Стьюдента, соответствующий доверительной вероятности p = 0,95.

Если количество объектов, относящихся ко второму массиву базовой совокупности по виду экономической деятельности g по ОКВЭД2, больше 60, то tp берется из таблиц стандартного нормального распределения, в противном случае tp находится по таблице распределения Стьюдента. Для нормального распределения при доверительной вероятности 0,95 tp = 1,96.

По исследуемому виду экономической деятельности по ОКВЭД2 распределяем объем выборки по слоям. Объем выборки в j-м слое:

Рисунок 3,

где

n2gj

-

объем выборки в j слое g-го вида экономической деятельности во 2 массиве;

n2g

-

объем выборки в g виде экономической деятельности во 2 массиве;

N2gj

-

количество организаций слоя j, принадлежащего g-му виду экономической деятельности во 2 массиве;

S2gj

-

среднеквадратическое отклонение по показателю "всего поступило средств" для организаций слоя j, принадлежащего g-му виду экономической деятельности во 2 массиве.

Далее определяем объем выборки для второго массива:

Рисунок 4,

где

n2

-

объем выборки во 2 массиве;

n2g

-

объем выборки в g виде экономической деятельности во 2 массиве.