기본 콘텐츠로 건너뛰기
개인정보 비식별화 요령 예시
- 가명처리(Pseudonymisation)
개인정보 중 주요식별요소를 다른 값으로 대체하여 개인식별을 곤란하게 함
(예) 홍길동, 35세 서울 거주, 한국대 재학
-> 임꺽정, 30대 서울 거주, 국제대 재학
* 다른 값으로 대체하는 일정한 규칙이 노출되어 역으로 개인을 쉽게 식별할 수 있어서는 안됨.
- 총계처리(Aggregation)
데이터의 총합값을 보임으로서 개별 데이터의 값을 보이지 않도록 함
(예) 임꺽정 180cm, 홍길동 170cm, 이콩쥐 160cm, 김팥쥐
->생물학과 학생키 합 : 660cm, 평균키 165cm
* 단, 특정 속성을 지닌 개인으로 구성된 단체의 속성 정보를 공개하는 것은 그 집단에 속한 개인의 정보를 공개하는 것과 마찬가지 결과가 나타나크로 그러한 정보는 비식별화 처리로 볼 수 없음. 예를 들어, AIDS 환자 집단임을 공개하면서 특정 인물 '갑'이 그 집단에 속함을 알 수 있도록 표시하는 것은 '갑'이 AIDS 환자임을 공개하는 것과 마찬가지임.
- 데이터 값 삭제(Data Reduction)
데이터 공유·개방 목적에 따라 데이터 세트에 구성된 값 중에 필요없는 값 또는 개인식별에 중요한 값을 삭제
(예) 홍길동, 35세, 서울 거주, 한국대 졸업 -> 35세, 서울 거주
(예) 주민등록번호 901206-1234567 -> 90년대생, 남자
(예) 개인과 관련된 날짜 정보(자격취득일자, 합격일 등)는 연단위로 처리
(예) 연예인·정치인 등의 가족 정보(관계정보), 판례 및 보도 등에 따라 공개되어 있는 사건과 관련되어 있음을 알 수 있는 정보
- 범주화(Data Suppression)
데이터의 값을 범주의 값으로 변환하여 명확한 값을 감춤
(예) 홍길동, 35세 -> 홍씨, 30-40세
- 데이터 마스킹(Data Masking)
공개된 정보 등과 결합하여 개인을 식별하는데 기여할 확률이 높은 주요 개인식별자가 보이지 않도록 처리하여 개인을 식별하지 못하도록 함
(예) 홍길동, 35세, 서울 거주, 한국대 재학
->홍**, 35세, 서울 거주, **대학 재학
*남아 있는 정보 그 자체로 개인을 식별할 수 없어야 하며 인터넷 등에 공개되어 있는 정보 등과 결합하였을 경우에도 개인을 식별할 수 없어야 한다.