Что такое анонимизация данных
Анонимность данных направлена на защиту личных или конфиденциальных данных путем удаления или шифрования личной информации из базы данных. Анонимизация данных осуществляется с целью защиты частной деятельности отдельного лица или компании при сохранении целостности собранных и переданных данных. Анонимизация данных также известна как «обфускация данных», «маскировка данных» или «де-идентификация данных».
Преодоление анонимности данных
Корпорации генерируют, хранят и обрабатывают огромные объемы конфиденциальных данных в ходе своей обычной деятельности. Развитие технологий процветает благодаря соответствующей информации, найденной в данных, которые были сгенерированы и распространены по различным секторам и странам. Финансовые инновации в области технологий (fintech) достигли безграничного прогресса в том, как финансовые услуги настраиваются для клиентов, благодаря данным, которые были предоставлены такими секторами, как социальные сети и предприятия электронной коммерции. Обмен данными между цифровыми медиа и фирмами электронной коммерции помог обоим секторам лучше рекламировать продукты на своих сайтах для конкретного пользователя или потребителя. Однако для того, чтобы общие данные были полезными без ущерба для идентификаторов клиентов, скомпилированных в базе данных, необходимо использовать анонимность.
Анонимизация данных на практике
Анонимизация данных осуществляется большинством отраслей, которые работают с конфиденциальной информацией, таких как здравоохранение, финансы и цифровые мультимедиа, обеспечивая при этом целостность обмена данными. Анонимизация данных снижает риск непреднамеренного раскрытия при обмене данными между странами, отраслями и даже отделами одной и той же компании. Например, больница, которая делится конфиденциальными данными о своих пациентах с медицинской исследовательской лабораторией или фармацевтической компанией, сможет сделать это с соблюдением этических норм, если она сохранит анонимность своих пациентов. Это можно сделать, удалив имена, номера социального страхования, даты рождения и адреса своих пациентов из общего списка, оставив при этом важные компоненты, необходимые для медицинских исследований, такие как возраст, болезни, рост, вес, пол, раса и т. Д.
Методы анонимизации данных
Анонимизация данных осуществляется различными способами, включая удаление, шифрование, обобщение и множество других. Компания может либо удалить личную информацию (PII) из собранных данных, либо зашифровать эту информацию с помощью надежной парольной фразы. Бизнес также может принять решение обобщить информацию, собранную в его базе данных. Например, таблица содержит точный валовой доход, полученный пятью руководителями в секторе розничной торговли. Давайте предположим, что зарегистрированные доходы составляют 520 000, 230 000, 109 000, 875 000 и 124 000 долларов. Эта информация может быть обобщена на такие категории, как «<500 000 долларов США» и «500 000 долларов США». Хотя данные запутаны, они все равно будут полезны для пользователя.
Обоснование анонимизации данных
Анонимизация данных заключается в том, что секретная информация подвергается дезинфекции и маскировке, поэтому ее следует выполнять таким образом, чтобы в случае нарушения полученные данные были бесполезны для преступников. Необходимость защиты данных должна быть приоритетной в каждой организации, поскольку секретная информация, попадающая в чужие руки, может быть использована не по назначению, умышленно или непреднамеренно. Отсутствие чувствительности при работе с конфиденциальной клиентской информацией может дорого обойтись бизнесу из-за того, что регулирующие органы подавляют грубую небрежность. Законодательные и нормативные требования, такие как PCI DSS (Стандарт безопасности данных индустрии платежных карт), налагают огромные штрафы на финансовые учреждения в случае нарушения кредитной карты. PIPEDA, канадский закон, регулирует раскрытие и использование личной информации корпорациями. Существуют и другие многочисленные регулирующие органы, которые были созданы для мониторинга использования или использования частными данными в организации.
Расшифровка анонимизированных данных возможна посредством процесса, известного как деанонимизация (или «повторная идентификация»). Из-за того, что анонимные данные могут быть декодированы и распознаны, критики считают, что анонимизация дает ложное чувство безопасности.