Обмен данными

Метод обмена данными (свопинг данных или многомерная трансформация) основан на модификации данных. Суть подхода заключается в том, чтобы преобразовать базу данных, поменяв местами значения конфиденциальных переменных индивидуальных записей. Эта перестановка осуществляется таким образом, чтобы частоты низкого порядка сохранялись в том же состоянии.

Другой вариант перестановки данных в массивах микроданных - перестановка рангов. Значения переменной Рисунок 8 ранжируются в порядке возрастания, затем каждое ранжированное значение Рисунок 9 меняется местами с другим значением, случайно выбранным в некотором ограниченном диапазоне.

С целью избежать избыточной защиты (модификации) данных для модификации только изолированных единиц наблюдения используется метод вменения значений ближайшей кластерной единицы. Вменение следует применять с использованием значений ближайших (относительно функции расстояния, использованной в алгоритме кластеризации) не подверженных риску соседей, в противном случае увеличение неопределенности может оказаться недостаточным.

Метод сводится к следующей процедуре:

1. Пусть Рисунок 10 - значение, которое требуется защитить.

2. Находим ближайшую кластерную единицу Рисунок 11, для которой:

Рисунок 12, где С - множество всех кластерных единиц.

3. Защищенное значение Рисунок 13 принимает значение Рисунок 14.