Анализ пропущенных значений

2.7. Анализ пропущенных значений помогает в борьбе с рядом серьезных проблем, порождаемых неполнотой данных. Существование пропущенных значений при организации мониторинга одинаковых групп показателей для одинаковой продукции может быть обусловлено только ошибкой ввода.

Если наблюдения с пропущенными значениями имеют систематические отличия от наблюдений без пропущенных значений, результаты могут вводить в заблуждение.

Пропущенные данные также могут снизить точность рассчитанной статистики, поскольку информации окажется меньше, чем планировалось. Во многих статистических процедурах подразумевается, что анализ основан на полных наблюдениях, а для учета отсутствующих значений требуется более сложная теория.

2.8. Удаление строчек с пропущенными значениями необходимо для показателей, участвующих в расчете калорийности, в случае, если потенциальный вклад компоненты в калорийность составляет 15% и более.

2.9. Замена пропущенных значений средним, медианой, модой (по соответствующей выборке) допускается в случае, если пропущенные показатели составляют менее 15%, и только с целью анализа достоверности данных.

2.10. После получения новой статистики (среднее, стандартное отклонение и дисперсия) необходимо оценить, привела ли замена к логической согласованности полученных данных с результатами.