Приложение N 4

к Официальной статистической

методологии формирования

показателей бизнес-демографии

(в части юридических лиц)

АЛГОРИТМ
ИМПУТАЦИИ ПРОПУЩЕННЫХ ДАННЫХ ОБ ОБОРОТЕ ПРЕДПРИЯТИЙ
В ПРОГРАММЕ SPSS

Номер шага

Операция

Ключевая переменная

Контролируемые атрибуты

Действие

Примечания

1

Расчет описательных статистик для возможных регрессантов и оборота, проверка на нормальность распределений

Независимые переменные: фиктивные OKFS, OKOPF, OKVED,

и количественные VYRUCHKA, DURATION, YEARDATREG, YEARDATREGIZ

2

Тестирование регрессантов для построения регрессионной функции

oborot

Независимые переменные: фиктивные OKFS, OKOPF, OKVED,

и количественные VYRUCHKA, DURATION, YEARDATREG, YEARDATREGIZ

Пошаговый отбор.

Переменная отбора наблюдений statusDEM > 0

3

Построение модели и оценка качества модели

Статистики: изменение КОЭФФИЦИЕНТ ДЕТЕРМИНАЦИИ R2,

КАНОНИЧЕСКИЕ И стандартизованные коэффициенты

Построение графика гистограммы для контроля нормальности распределения Модель регрессии без константы модели, так как формально константа - это значение функции при нулевом значении всех факторов

Сравнение R2 для разной формы функции регрессии

Опция: параметры анализа

Пошаговый отчет не нужен.

4

Сохранить значение регрессионной функции

Новая переменная oborotPRED

Скорректированное значение функции регрессии

Сохранить предсказанные значения

5

Импутация пропущенных данных

Новая переменная oborotIMPUT

oborot, statusDEM

Контроль располагаемых значений обучающей выборки

oborotIMPUT =

1) = OborotPred, если Oborot = 0 и statusDEM = 1;

2) = Oborot, если Oborot > 0 и statusDEM = 1

3) = 0, если statusDEM = 0

6

Сохранить

OborotIMPUT

Запускаем процесс