차분 프라이버시 (DP, Differential Privacy)

1. 차분 프라이버시 (DP, Differential Privacy)의 개요

개념개인정보 추론 방지를 위해 데이터 삽입/삭제 또는 변형에 의한 질의 결과의 변화량을 일정 수준 이하로 유지함으로써 정보 노출을 제한하는 프라이버시 보호 기술
필요성
  • 차분 프라이버시 적용 시 데이터 공개 메커니즘만으로는 임의의 레코드가 포함된 데이터셋과 포함되지 않은 데이터셋을 구별(differentiate) 하기 어려우므로 민감 데이터유출에 대한 안전성 확보 가능

 

2. 차분 프라이버시의 주요 기술

구분주요 기술구현 방법
메커
니즘
라플라스 메커니즘
(Laplace mechanism)
– f(D): 데이터베이스 D 함수로 가정 시 L(D)=f(D)+Z로 정의
– Z: 평균 0, 분산 b인 라플라스 분포 통해 결정
익스퍼넨셜 메커니즘
(Exponential mechanism)
– 입력값 D, 출력값의 범위 T, 스코어 함수 u:(D×T)→R
– 스코어 함수 u:(D×T)→R로 출력값 결정 확률을 정함
– 출력값이 질의목적에 부합시 높은 스코어로 선택확률증가
노이즈
삽입
방식
입력값 교란
(Input perturbation)
– 데이터 자체에 노이즈를 삽입, x’=x+z
결과값 교란
(Output distribution)
– 함수 f(d)의 결과 값에 노이즈를 삽입, F(x)=f(x)+Z
– 노이즈 삽입 수준은 데이터의 입력값에 의해 결정
목적 함수 교란
(Objective perturbation)
– 노이즈를 목적 함수에 삽입
– 알고리즘이 컨벡스 함수(convex fuction) j(g, d)를 수행 시 노이즈 삽입
  • 차분 프라이버시 메커니즘과 노이즈 삽입 방식을 적용한 실제 데이터 처리 프레임워크 유형은 큐레이터 신뢰도에 따라 중앙/지역 모델로 구분하여 서비스 가능

 

3. 차분 프라이버시를 적용한 데이터 처리 모델

항목중앙 모델 또는 신뢰 큐레이터 모델
(centralized model or trusted curator model)
지역 모델
(local model)
개념신뢰받는 큐레이터가 전체 데이터에 대해 차분 프라이버시를 적용하는 모델큐레이터 신뢰하지않고 데이터 소유자가 직접 차분 프라이버시를 적용 후 데이터를 보내는 모델
개념도
특징원본 데이터는 그대로 제공하고 큐레이터가 노이즈 추가데이터 소유자가 원본 데이터 제공 시 노이즈 추가
장점전체 데이터의 노이즈 삽입 수준을 결정가능 하므로 데이터 유용성과 프라이버시 보호에 효율적신뢰할 수 있는 큐레이터가 필요하지 않아 개인 프라이버시를 원천적으로 보호
단점데이터 수집/제공 작업을 처리하는 큐레이터 신뢰가 필수데이터 유용성이 크게 저하될 수 있고, 사용자가 임의로 노이즈 삽입 수준 결정 어려움
  • 차분 프라이버시(또는 차등 프라이버시)는 개인정보 비식별화의 한계점을 개선하여 안전한 프라이버시 보호 수단을 제공하나, 아직 소규모 데이터에 적용된 사례가 부족하고 실제 적용을 위해 많은 비용과 경험이 필요하므로 공학적 연구와 함께 정책적 지원이 필요

 

4. 차분 프라이버시의 한계점 및 대응 방안

한계점대응 방안
– 소규모 데이터 적용된 사례 부족
– 개인정보 직접 활용에 비해 효용성 저하
– 실제 적용을 위한 비용 및 경험 부족
– 개인정보 보호 방식과 법규범 차이 파악
– 상호작용이 가능한 API 개발
– 공학적 논의 가능성과 한계 파악 고려
  • 견고한 프라이버시 보호는 공학적 방법론과 법학을 통한 규범적 논의가 서로 적절한 보완적 역할을 할 때 달성되므로 공학적 논의의 가능성과 한계를 적극적으로 파악 및 고려 필요

 
[참고]

  • KAIST 사이버보안 연구센터, 개인정보의 비식별화와 디퍼렌셜 프라이버시
  • 서강대학교, 차분 프라이버시 기반 비식별화 기술 개발
  • 정보보호학회, 차분 프라이버시 기반 비식별화 기술에 대한 연구

콘텐츠 사용 시 출처 표기 부탁 드리고, 궁금한 점이나 의견은 댓글 남겨주세요^^