Приложение

к Методологическим положениям

по организации процессов производства

официальной статистической информации,

утвержденным приказом Росстата

от 07.12.2018 N 732

ГЛОССАРИЙ

Выброс (или нетипичное значение) - это результат измерения, выделяющийся из общей выборки. Они являются следствием ошибки измерения или необычной природы входных данных. Нетипичные значения могут быть как объективно достоверными, так и ошибочными. Попавшие в выборку нетипичные единицы могут существенно исказить результаты наблюдения, так как их вклад в оценку суммы признака (умноженное на выборочный вес значение признака) будет неоправданно завышен. Выбросы приходится обнаруживать (желательно - автоматически) и исключать из выборки. Идентификация нетипичных единиц и проверка достоверности соответствующих значений признаков является обязательным этапом обработки первичных данных наблюдения.

Генеральная совокупность объектов федерального статистического наблюдения - перечень юридических лиц, их филиалов, представительств, других объектов статистического наблюдения, осуществляющих деятельность на территории Российской Федерации, характеризующийся установленным набором индивидуальных признаков, необходимых для организации конкретных статистических наблюдений. В качестве генеральной совокупности объектов наблюдения в обследованиях населения и домашних хозяйств используется первичный информационный фонд, построенный на основе материалов Всероссийской переписи населения 2010 года (ВПН-2010). Первичный информационный фонд - это совокупность переписных листов населения частных домохозяйств, постоянно проживающего на территории России (формы Л и П), распределенных по счетным, инструкторским и переписным участка согласно оргплану ВПН-2010.

Геоинформационная система (ГИС) - система сбора, хранения, анализа и графической визуализации пространственных (географических) данных и связанной с ними информации о необходимых объектах. В органах государственной статистики геоинформационная система (ГИС) представляет собой информационную систему, предназначенную для подготовки статистических картограмм с целью использования в официальных публикациях, информационно-статистических материалов и размещения картографических материалов на Интернет-портале и Интранет-портале Росстата. Представление статистической информации в графическом виде позволяет значительно облегчить восприятие большого количества данных, увидеть взаимосвязь разнородной информации и проанализировать закономерности развития регионов.

Калибрация - это процедура по использованию дополнительной (вспомогательной) информации для расчета оценок показателей по результатам выборочного наблюдения, применяемая в целях сокращения ошибки выборки. В процессе этой процедуры при помощи коэффициентов, называемых факторами калибрации, корректируются выборочные веса, что делает оценки показателей согласованными с уже известными дополнительными данными. Получающиеся веса называются весами калибрации или конечными весами оценивания. Эти веса калибровки в общем случае приводят к оценкам, которые согласованы с планом выборки и эти оценки имеют меньшую выборочную дисперсию, чем оценка Горвица-Томпсона.

Когнитивное интервью. Методы когнитивного интервью направлены на вовлечение респондента в процесс тестирования вопросника. Они построены на расширении задач, предлагаемых респонденту, от которого требуется не только адекватно ответить на вопрос, но и отрефлексировать причины ответа. Для этого его просят артикулировать свои размышления по поводу вопроса и показать интервьюеру, как он понимает конкретный вопрос и формулирует на него ответ. Методы когнитивного интервью позволяют получить от респондента детальную информацию о когнитивных процессах, мобилизуемых во время формирования ответа. Выделяют пять основных причин использования методов когнитивного интервью: выявление отдельных понятий или фразеологических оборотов, которые неоднозначно воспринимаются опрашиваемыми; оценка представлений респондентов с точки зрения того, насколько понятия и вопросы расходятся с определениями, представленными в словарях и справочниках; установление вопросов, не отражающих цели исследования или существенно отклоняющихся от них; установление вопросов, дающих лучший результат в измерении установок или действий респондентов; распределение ответов респондентов в зависимости от различных версий вопросов. Метод парафраза заключается в том, что респондента просят изложить услышанный вопрос самостоятельно, используя собственные лексические конструкции. Метод оценки уверенности в ответе позволяет выявить трудности, связанные с формулированием ответа. С помощью метода артикулированного суждения можно установить, что говорит респондент о причинах выбора определенного варианта ответа.

Кодирование поведения. Метод поведенческого кодирования (или мониторинг прохождения интервью) позволяет формализовать коммуникативный переход и выделить переменные, описывающие его отдельные стадии. Кодируется непосредственно коммуникация между респондентом и интервьюером. Приближение тестирования к реальному прохождению интервью отчасти снимает проблемы, вызванные возможными расхождениями между лабораторными и полевыми тестами вопросников.

Коэффициент вариации оценки или относительная стандартная ошибка - это отношение стандартной ошибки выборки к оценке параметра, выражается в долях или чаще в процентах.

Метаданные представляют собой информацию о наблюдении (организационные документы, методика подготовки и проведения наблюдения, описание инструментария и описание микроданных). Назначение метаданных заключается в обеспечении возможностей корректного использования микроданных и других публикуемых результатов наблюдения пользователями.

Микроданные представляют собой файлы данных, содержащие информацию по каждой единице наблюдения. Публикация микроданных производится при обязательном условии запрета доступа к данным, позволяющим идентифицировать респондентов. Публикация микроданных совместно с метаданными наблюдения и средствами интерактивного построения таблиц и диаграмм дает возможность пользователям воспроизводить публикуемые итоговые таблицы, а также получать дополнительные итоговые показатели по данным наблюдения.

Отраслевые субрегистры - генеральные совокупности объектов статистического наблюдения по конкретной отрасли экономики.

Охват - это информация о границах генеральной совокупности и базовом периоде времени. При публикации результатов наблюдения для отдельного статистического показателя важно знать не только то, какая информация собрана, но также и то, какая группа охвачена и соответствующий период времени.

План выборки. На практике в широком смысле выборочный план может представлять собой сочетание различных способов извлечения выборок или выборочных методов, которые варьируются по степени своей эффективности и возможности практического применения. Он может включать стратификацию или кластеризацию основы выборки, а также несколько этапов отбора. Более узко - это перечень единиц со значениями вероятности их включения в выборку. Выбор подходящего для данного наблюдения плана выборки часто определяется выделенным бюджетом наблюдения и сроками его проведения и обработки данных, т.е. влияют прежде всего финансовые и временные ограничения. Кроме того, важным аспектом на этом этапе является наличие дополнительной (вспомогательной) информации, которая служит для построения эффективного плана выборки, (например, для создания страт или кластеров, для определения размера единиц) и повышения качества (точности) показателей на этапе формирования сводных итогов, полученных на основе собранных выборочных данных. Дополнительная информация может содержаться в основе выборки или быть получена из других источников, например, в качестве дополнительной информации могут использоваться подходящие результаты других статистических наблюдений и официальная статистическая информация. Дополнительная информация может быть доступна по каждой единице совокупности или в агрегированном виде.

Средний квадрат ошибки (СКО) равен квадрату суммы смещения и дисперсии оценки показателей. На величину смещения и размер дисперсии оценки показателя влияют такие ошибки, как ошибки основы выборки, ошибки определениях, неответы, ошибки измерения, выборочные ошибки, ошибки обработки данных.

Стандартная ошибка выборки (оценка по выборке) - оцененное по данным выборки среднеквадратическое отклонение дисперсии оценки.

Статистическая основа - это документ (в т.ч. электронный) или устройство, который используется для получения доступа к наблюдаемой совокупности. С ее помощью можно идентифицировать и формировать выборку в соответствии с планом отбора и установить контакт с отобранными элементами (по телефону, посредством посещения на дому, почтовой рассылки форм и т.п.). При этом объекты, составляющие основу, называют единицами отбора. Помимо идентификационной и адресной составляющих в статистическую основу, как правило, включается дополнительная информация (например, данные о размере единицы, демографическая информация и т.п.), которая используется для возможности применения таких методов случайного отбора, как расслоенный отбор и отбор с вероятностями, пропорциональными размеру единиц, а также в процессе оценивания (расчета сводных итогов наблюдения).

Фокус-группа, ее проведение необходимо для исследования мнений аудитории по значимым для исследователя вопросам. Данный метод заключается в глубинном интервьюировании представителей целевой аудитории.

Эффект интервьюера - все погрешности, которые связаны с влиянием интервьюера на качество получаемых данных. Он может даже не осознаваться самим интервьюером, происходить подспудно и проявляться в разговоре, а также в неявных формах: в общем эмоциональном тоне беседы, мимике, поведении ее участников.