Анализ Интернет-ресурсов

Система должна обеспечивать определение категории Интернет-ресурса путем сопоставления URL-адреса с базой URL-адресов Реестра НСОР. Система должна поддерживать множество категорий Интернет-ресурсов.

Система должна обеспечивать возможность анализ поисковых HTTP-запросов путем разбора запроса, сформированного поисковыми машинами, и сравнением составных частей запроса со словарем слов, словосочетаний и словообразований, включенных в запрещенные категории в Реестре НСОР. Система должна поддерживать множество категорий запрещенных слов, словообразований и словосочетаний.

Если Интернет-ресурс не попадает ни под одну категорию, то система должна обеспечивать анализ с применением семантического и морфологического анализа.

Система должна обеспечивать возможность семантического и морфологического анализа информации Интернет-ресурсов, получаемых по HTTP протоколу, на основе списков запрещенных слов, словообразований и словосочетаний, сформированных в Реестре НСОР, а также сочетаний слов из разных категорий, образующие совокупности запрещенных выражения. Информация Интернет-ресурсов должна интерпретироваться строго согласно стандартам на протокол передачи гипертекста и язык разметки гипертекста, в том числе должна корректно определяться кодировка передаваемых данных.

Система должна обеспечивать сопоставление категории Интернет-ресурса с категорией пользователя и принимать решение о доступе пользователя к информации.