Что такое деанонимизация
Деанонимизация - это метод добычи данных, который повторно идентифицирует зашифрованную или обобщенную информацию. Деанонимизация, также называемая повторной идентификацией данных, сопоставляет анонимизированную информацию с другими доступными данными для идентификации лица, группы или транзакции.
BREAKING DOWN Деанонимизация
Эра, разбирающаяся в технологиях, быстро разрушает традиционный способ ведения дел в различных секторах экономики. В последние годы финансовая индустрия увидела множество цифровых продуктов, введенных в этот сектор финтех-компаниями. Эти инновационные продукты способствовали расширению доступа к финансовым услугам, благодаря чему все больше потребителей имеют доступ к финансовым продуктам и услугам по более низкой цене, чем позволяют традиционные финансовые учреждения. Рост внедрения технологий привел к увеличению сбора, хранения и использования данных. Технологические инструменты, такие как платформы социальных сетей, платформы цифровых платежей и технологии смартфонов, представили тонну данных, используемых различными компаниями для улучшения взаимодействия с потребителями. Эта тонна данных называется большими данными и вызывает обеспокоенность у отдельных лиц и регулирующих органов, призывающих к принятию большего количества законов, защищающих личность и конфиденциальность пользователей.
Как работает анонимизация
В эпоху больших данных, когда конфиденциальная информация о действиях пользователя в сети мгновенно передается через облачные вычисления, для защиты личности пользователей используются инструменты анонимизации данных. Анонимизация маскирует личную информацию пользователей (PII), осуществляющих операции в различных областях, таких как службы здравоохранения, платформы социальных сетей, сделки электронной торговли и т. Д. PII включает в себя такую информацию, как дата рождения, номер социального страхования (SSN), почтовый индекс и IP. адрес. Необходимость маскировать цифровые следы, оставленные онлайн-активностями, привела к реализации стратегий анонимизации, таких как шифрование, удаление, обобщение и возмущение. Хотя ученые по данным используют эти стратегии для отделения конфиденциальной информации от общих данных, они все же сохраняют исходную информацию, тем самым открывая двери для возможности повторной идентификации.
Деанонимизация обращает вспять процесс анонимизации путем сопоставления общих, но ограниченных наборов данных с наборами данных, которые легко доступны в Интернете. Затем майнеры данных могут извлекать некоторую информацию из каждого доступного набора данных, чтобы объединить личность или транзакцию человека. Например, майнер данных может извлечь набор данных, совместно используемый телекоммуникационной компанией, сайтом социальных сетей, платформой электронной коммерции и общедоступным результатом переписи, чтобы определить имя и частые действия пользователя.
Как используется деанонимизация
Повторная идентификация может быть успешной, когда новая информация выпущена или когда реализованная стратегия анонимизации не выполнена должным образом. Обладая огромным запасом данных и ограниченным количеством времени, доступного в день, аналитики данных и майнеры внедряют ярлыки, известные как эвристика, при принятии решений. Хотя эвристика экономит ценное время и ресурсы при прохождении набора данных, она также может создать пробелы, которые можно было бы использовать, если бы был применен неправильный эвристический инструмент. Эти пробелы могут быть выявлены специалистами по сбору данных, которые стремятся деанонимизировать набор данных либо в законных, либо в незаконных целях.
Личная информация, полученная незаконно с помощью методов анонимизации, может продаваться на подпольных торговых площадках, которые также являются формой платформ анонимизации. Информация, попадающая в чужие руки, может быть использована для принуждения, вымогательства и запугивания, что может привести к проблемам с конфиденциальностью и огромным расходам для предприятий, которые становятся жертвами.
Де-анонимизация также может быть использована на законных основаниях. Например, веб-сайт Шелкового пути, подземный рынок для незаконных наркотиков, размещался в анонимной сети Tor, которая использует луковую стратегию для маскировки IP-адресов своих пользователей. В сети Tor также есть несколько других нелегальных рынков, торгующих оружием, украденными кредитными картами и конфиденциальной корпоративной информацией. При использовании сложных инструментов де-обезличивания, ФБР успешно взломан и закрыли шелкового пути и сайты участия в детской порнографии.
Успех процессов повторной идентификации доказал, что анонимность не гарантируется. Даже если сегодня были внедрены революционные инструменты анонимизации для маскировки данных, данные могут быть повторно идентифицированы через пару лет, когда появятся новые технологии и новые наборы данных.