2.4.3. Особенности публикации наборов открытых данных

Публикации подлежат первичные данные, не подвергнутые предварительной обработке.

Для каждого набора данных должно быть определено должностное лицо, ответственное по вопросам публикации открытых данных.

Для каждого набора данных должна быть установлена периодичность обновления.

2.4.4. При публикации набора открытых данных на странице набора в обязательном порядке должно присутствовать описание условий использования данных (например, ссылка на открытую лицензию) или ссылка на текст опубликованного документа, устанавливающего такие условия.

Условия использования не должны требовать от пользователей заключения какого-либо договора с государственным органом или органом местного самоуправления.

Условия использования не должны ограничивать потребителей открытых данных в применении данных наборов в некоммерческих и коммерческих целях.

Условия использования должны предполагать безвозмездное предоставление открытых данных.

Должно присутствовать (в условиях использования) требование наличия ссылки на источники публикации наборов данных в проектах, использующих данные наборы.

В условиях использования должны отсутствовать требования регистрации и/или авторизации на сайте для возможности использования открытых данных.

2.4.5. Обязательные способы публикации открытых данных предполагают использование одного из трех способов публикации:

- через раздел открытых данных на официальном сайте государственного (муниципального) органа в сети Интернет;

- через портал открытых данных государственного (муниципального) органа в сети Интернет;

- через портал открытых данных Российской Федерации в сети Интернет (https://data.gov.ru/).

2.4.6. При публикации наборов открытых данных на официальном сайте органа управления архивным делом предлагается следовать следующим рекомендациям:

- на официальном сайте органа управления архивным делом должна быть создана специализированная страница для публикации открытых данных в машиночитаемых форматах (далее - страница открытых данных);

- на главной странице официального сайта органа управления архивным делом должна располагаться визуально различимая гиперссылка на страницу наборов открытых данных с надписью "Открытые данные";

- страница открытых данных должна содержать реестр наборов открытых данных;

- для каждого опубликованного набора открытых данных должна быть предусмотрена прямая ссылка на набор открытых данных;

- в целях доступности страниц открытых данных для поисковых роботов должна быть размещена ссылка на реестр наборов открытых данных: разрешение в robots.txt, указание в sitemap.xml.

2.4.7. Адрес главной страницы раздела "Открытые данные" на официальном сайте органа управления архивным делом должен формироваться по следующему шаблону: "<адрес официального сайта>/opendata". (Допускается публикация из адреса поддоменного уровня "opendata.<адрес официального сайта>").

2.4.8. Реестр наборов открытых данных должен иметь человекочитаемое представление (с использованием средств визуализации) и машиночитаемое представление. Человекочитаемое представление реестра наборов открытых данных должно содержать следующую информацию:

- порядковый номер набора открытых данных;

- наименование набора открытых данных;

- формат представления набора открытых данных;

- ссылка на страницу набора открытых данных.

Машиночитаемое представление реестра наборов открытых данных должно быть реализовано в одном из следующих форматов:

- CSV;

- XML;

- JSON;

- HTML + RDFa;

- HTML + Microdata.

Машиночитаемое представление реестра наборов открытых данных должно содержать следующую информацию о каждом наборе открытых данных:

- идентификационный номер набора открытых данных;

- название набора открытых данных;

- ссылка на машиночитаемое представление паспорта набора открытых данных;

- формат набора открытых данных.

2.4.9. Страница набора открытых данных должна содержать паспорт набора открытых данных.

Заголовок страницы набора открытых данных должен соответствовать названию набора открытых данных.

Паспорт набора открытых данных должен иметь четко заданную структуру следующего вида:

1. Идентификационный номер.

2. Наименование набора открытых данных.

3. Описание набора открытых данных.

4. Владелец набора открытых данных.

5. Ответственное лицо.

6. Телефон ответственного лица.

7. Адрес электронной почты ответственного лица.

8. Гиперссылка (URL) на открытые данные.

9. Формат набора открытых данных.

10. Описание структуры набора открытых данных.

11. Дата первой публикации набора открытых данных.

12. Дата последнего внесения изменений.

13. Содержание последнего изменения.

14. Дата актуальности набора данных.

15. Ключевые слова, соответствующие содержанию набора данных.

16. Гиперссылки (URL) на версии открытых данных.

17. Гиперссылки (URL) на версии структуры набора данных.

18. Версия методических рекомендаций.

Рекомендуется реализовать для каждого набора открытых данных возможность автоматического подсчета и публикации на сайте числа просмотров и скачиваний для каждого набора. Это поможет оценить степень востребованности наборов данных и спланировать создание новых наборов.

2.4.10. Открытые данные должны публиковаться в форматах CSV, XML, JSON, RDF или с применением API (в случае наборов открытых данных со специфическими особенностями). В формате CSV рекомендуется публиковать данные, имеющие плоскую табличную форму, при этом в содержании записи не допускается использование символа перевода строки. Сложные иерархические данные рекомендуется публиковать в форматах XML, JSON.

2.4.11. Атрибуты (названия столбцов таблицы) каждого набора открытых данных должны иметь краткое англоязычное представление (в виде англоязычных имен или краткого текста транслитерации).

2.4.12. Машиночитаемое представление набора открытых данных (в соответствующем формате или через API) должно обеспечивать возможность автоматической идентификации и обработки информационными системами составных элементов набора (записей, сущностей и т.д.) и атрибутов этих элементов; не допускается представление данных в неструктурированной форме, затрудняющей или исключающей автоматическую обработку.

2.4.13. Рекомендуется применять инструменты автоматической визуализации наборов открытых данных. При визуальном представлении наборов открытых данных, содержащих географические координаты в качестве атрибутов объектов открытых данных, необходимо обеспечить корректное отображение данных объектов на карте местности в соответствии с координатными данными.

Для визуализации табличных данных рекомендуется использовать инструменты, позволяющие осуществить предварительный просмотр данных в веб-браузере в табличном виде.

Ссылки на различные инструменты визуализации можно найти в приложении 3 к Методическим рекомендациям по публикации открытых данных государственными органами и органами местного самоуправления, а также в технических требованиях к публикации открытых данных <15>.

--------------------------------

<15> Методические рекомендации по публикации открытых данных государственными органами и органами местного самоуправления, а также технические требования к публикации открытых данных: приняты на заседании Правительственной комиссии по координации деятельности Открытого правительства от 29 мая 2014 г. (протокол N 4). Версия 3. URL: https://data.gov.ru/metodicheskie-rekomendacii-po-publikacii-otkrytyh-dannyh-versiya-30 (дата обращения: 27.07.2022).

2.4.14. Наборы открытых данных разделяются на оперативные данные (высокая периодичность актуализации данных - чаще чем 1 раз в неделю) и долговременные (реже чем 1 раз в неделю).

Для каждого набора открытых данных в паспорте набора должна быть указана дата его актуальности.

Частота обновления набора может быть следующей:

- оперативные данные:

- - больше 1 раза в день;

- - ежедневно;

- - еженедельно.

- долговременные данные:

- - ежемесячно;

- - ежеквартально;

- - каждые полгода;

- - ежегодно;

- - по мере изменения данных.

2.4.15. В случае значительных объемов (более 30 Мб), частых обновлений (чаще 1 раза в неделю) или необходимости формирования специфических выборок открытые данные должны предоставляться через программный интерфейс (API), имеющий опубликованную спецификацию. API должен обеспечивать возможность полностью автоматического (без участия человека) доступа ко всем сведениям набора открытых данных (спецификации протоколов, форматов данных, первичные параметры доступа к сервису и др.).

2.4.16. Примеры реализации порталов открытых данных можно увидеть на сайтах:

- Федерального архивного агентства (https:// archives.gov.ru/opendata),

- Министерства культуры Российской Федерации (https://opendata.mkrf.ru/opendata),

- портала открытых данных Правительства США (Data.gov) (https://catalog.data.gov/dataset?publisher=National+Archives+and+Records+Administration&sort=score+desc%2C+name+asc&q=Nara),

- портала "Архивы Франции" (FranceArchives) (https://francearchives.fr/fr/open_data) и др.