HOME > 상세정보

상세정보

데이터 익명화 : 개념 이해 및 최신 기술 동향

데이터 익명화 : 개념 이해 및 최신 기술 동향 (19회 대출)

자료유형
단행본
개인저자
김종선, 저 이혁기, 저 정기정, 저 정연돈, 저
서명 / 저자사항
데이터 익명화 : 개념 이해 및 최신 기술 동향 / 김종선 [외]지음
발행사항
서울 :   휴먼싸이언스,   2018  
형태사항
vii, 258 p. : 삽화, 도표 ; 23 cm
ISBN
9788993712995
일반주기
공저자: 이혁기, 정기정, 정연돈  
서지주기
참고문헌 수록
000 00000cam c2200205 c 4500
001 000045958151
005 20181019164734
007 ta
008 181019s2018 ulkad b 000c kor
020 ▼a 9788993712995 ▼g 93560
035 ▼a (KERIS)BIB000014792205
040 ▼a 241018 ▼c 241018 ▼d 211009
082 0 4 ▼a 005.8 ▼2 23
085 ▼a 005.8 ▼2 DDCK
090 ▼a 005.8 ▼b 2018z7
245 0 0 ▼a 데이터 익명화 : ▼b 개념 이해 및 최신 기술 동향 / ▼d 김종선 [외]지음
260 ▼a 서울 : ▼b 휴먼싸이언스, ▼c 2018
300 ▼a vii, 258 p. : ▼b 삽화, 도표 ; ▼c 23 cm
500 ▼a 공저자: 이혁기, 정기정, 정연돈
504 ▼a 참고문헌 수록
700 1 ▼a 김종선, ▼e
700 1 ▼a 이혁기, ▼e
700 1 ▼a 정기정, ▼e
700 1 ▼a 정연돈, ▼e
945 ▼a KLPA

No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 005.8 2018z7 등록번호 121246288 (6회 대출) 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 2 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 005.8 2018z7 등록번호 121248204 (3회 대출) 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 3 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 005.8 2018z7 등록번호 121248441 (9회 대출) 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 4 소장처 세종학술정보원/과학기술실(5층)/ 청구기호 005.8 2018z7 등록번호 151366765 (1회 대출) 도서상태 대출가능 반납예정일 예약 서비스 B M ?
No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 005.8 2018z7 등록번호 121246288 (6회 대출) 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 2 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 005.8 2018z7 등록번호 121248204 (3회 대출) 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 3 소장처 과학도서관/Sci-Info(1층서고)/ 청구기호 005.8 2018z7 등록번호 121248441 (9회 대출) 도서상태 대출가능 반납예정일 예약 서비스 B M
No. 소장처 청구기호 등록번호 도서상태 반납예정일 예약 서비스
No. 1 소장처 세종학술정보원/과학기술실(5층)/ 청구기호 005.8 2018z7 등록번호 151366765 (1회 대출) 도서상태 대출가능 반납예정일 예약 서비스 B M ?

컨텐츠정보

책소개

데이터 익명화(혹은 비식별화)는 데이터의 주체를 누구인지 알 수 없도록 데이터를 가공하는 일련의 작업을 의미한다. 이 작업은 현재 우리가 살고 있는 빅데이터 시대 이전에도 존재하였던 개념이다. 그러나 근래에 들어 데이터의 대량 생산 및 활용, 컴퓨터 기술의 발달 등에 의해 기존에 생각하지 못했던 문제들이 발생하였고, 그 문제의 사회적 파급 효과 역시 이전과는 비교할 수 없을 만큼 커지고 있다는데 주목하여야 한다. 빅데이터 시대에서 빅데이터를 활용하고 분석하는 산업의 중요성은 이론의 여지가 없지만, 빅데이터 속에 포함되어 있는 개인들의 사생활 정보에 대한 적절한 보호 역시 간과할 수 없다. 이러한 ‘빅데이터 활용’과 ‘개인정보보호’라는 서로 상충될 수 있는 두 가지 목적을 달성하는 기술이 데이터 익명화라고 볼 수 있다.

머리말


빅데이터, 인공지능, 4차 산업혁명과 같은 용어들이 세간의 화두가 되고 있는 시대에 살고 있다. 그리고 이런 기술들의 근간에는 데이터라는 연료가 필요하다. 문제는 이 데이터 중에는 우리 인간들의 정보를 나타내는 것이 많이 포함된다는 점이다. 인간/개인의 정보를 표현하는 데이터는 그 정보 주체의 사생활을 드러내게 마련이다. 가령, 개인의 의료 정보로부터 병명이 드러나거나 신용 정보로부터 개인의 재산 및 신용등급이 드러나는 등의 문제가 발생할 수 있다는 의미이다. 사람의 데이터를 생성, 저장, 처리하는 과정에서 발생할 수 있는 개인의 프라이버시 침해 문제를 다루는 공학 연구 분야를 데이터 프라이버시(data privacy) 혹은 데이터베이스 프라이버시(database privacy)라고 한다. 일반 대중들에게는 데이터 익명화 혹은 데이터 비식별화라는 용어로 널리 알려져 있다.
데이터 익명화(혹은 비식별화)는 데이터의 주체를 누구인지 알 수 없도록 데이터를 가공하는 일련의 작업을 의미한다. 이 작업은 현재 우리가 살고 있는 빅데이터 시대 이전에도 존재하였던 개념이다. 그러나 근래에 들어 데이터의 대량 생산 및 활용, 컴퓨터 기술의 발달 등에 의해 기존에 생각하지 못했던 문제들이 발생하였고, 그 문제의 사회적 파급 효과 역시 이전과는 비교할 수 없을 만큼 커지고 있다는데 주목하여야 한다. 빅데이터 시대에서 빅데이터를 활용하고 분석하는 산업의 중요성은 이론의 여지가 없지만, 빅데이터 속에 포함되어 있는 개인들의 사생활 정보에 대한 적절한 보호 역시 간과할 수 없다. 이러한 ‘빅데이터 활용’과 ‘개인정보보호’라는 서로 상충될 수 있는 두 가지 목적을 달성하는 기술이 데이터 익명화라고 볼 수 있다.
우리나라에서 ‘데이터 익명화(비식별화)’라는 용어가 일반인들에게 대두된 시기는 불과 5년 전이다. 개인정보보호를 담당하는 정부부처인 행정안전부 및 방송통신위원회에서 데이터 산업 활성화를 위해 논의를 시작하였고, 이후 많은 언론과 시민 사회단체들로부터 논란을 야기하고 있다. 인터넷 포털 사이트를 방문하여 ‘익명화’ 혹은 ‘비식별화’라는 단어로 기사를 검색하면 지금도 많은 기사들이 지속적으로 발견된다. 그런데 정부 기관이 발간한 기술적인 문서나 각종 언론에서 발표되는 기사들 중에서 매우 많은 비율은 (데이터 익명화에 대한 찬반을 떠나) 기술적으로 잘못된 내용을 이야기 하고 있다. 그리고 그 내용이 확대 재생산되고 있다.
이 책은 지금 우리나라에서 논의되고 있는 데이터 익명화에 대한 기술적 오해를 없애고자 현재까지 공학/전산학 분야에서 연구되어 온 데이터 프라이버시 기술들을 정리하고 소개하는데 목적이 있다. 기술적으로 올바른 이해를 바탕으로 최근 대두되고 있는 개인정보보호법 개정을 통한 데이터 산업의 활성화와 개인정보보호에 대한 사회적 합의 도출 시도가 잘 이루어지기를 희망한다.
이 책의 구성은 다음과 같다. 먼저 1장은 우리나라의 개인정보보호에 관련한 제도적-법적 배경과 현황에 대해 설명한다. 여기에는 현재 우리의 법제도가 지니는 특성과 그에 따른 문제점이나 한계점이 기술되어 있다. 2장부터 6장까지는 데이터 익명화 기술들에 대해, 데이터의 형태나 익명화 처리 환경에 따라 구분하여 설명한다. 2장과 3장은 가장 널리 사용되는 관계형 데이터에 대한 익명화 기술들을 설명하고, 4장은 비관계형 데이터에 대한 익명화, 위치 데이터에 대한 익명화, 그리고 스트림 환경에서 적용하는 익명화 기술에 대해 설명한다. 5장은 관계형 데이터에서 도출된 통계 정보로부터 발생할 수 있는 개인의 프라이버시 침해를 대비하는, 통계적 프라이버시 보호 개념에 대해 소개한다. 6장은 데이터의 수집 단계에서 사용자가 직접 익명화를 진행하여, 데이터 수집가 조차도 사용자의 원본 데이터를 보유하지 않는 기술에 대해 설명한다. 사용자가 직접 자신의 데이터를 익명화하므로, 이론적으로 사용자의 동의가 필요 없는 방법이 될 수 있다. 7장부터 9장은 앞서 설명하였던 익명화 기술들을 실제 데이터를 가지고 적용한 예시들을 소개한다. 실제 어떤 익명화 기술들이, 어떤 응용 분야에서 사용되는지, 그리고 개인의 프라이버시 보호가 어떤 수준으로 이루어지는지 살펴보는데 도움이 될 것이다.
마지막으로 이 책을 집필하는데 직간접적으로 많은 도움을 준 고려대학교 데이터베이스 연구실 재학생 및 졸업생들에게 감사를 드린다.

2018년 1월 31일
저자일동


정보제공 : Aladin

목차

제1장	데이터 익명화의 개념 및 제도 현황	1 
1.1	개인정보 그리고 개인정보보호법	2 
1.2	우리나라의 데이터 익명화 제도	5 
1.3	개인정보보호 vs. 개인의 프라이버시 보호	10 
1.4	데이터 익명화 환경 및 응용에 대한 분류	16 

제2장	관계형 데이터의 익명화: 프라이버시 모델	23 
2.1	용어 및 개념 정리	25 
2.2	프라이버시 유출/공격 유형	27 
2.3	프라이버시 모델	31 

제3장	관계형 데이터의 익명화: 기술 및 방법	73 
3.1	익명화 기술	74 
3.2	익명화 알고리즘	85 

제4장	기타 데이터 유형에 대한 데이터 익명화	99 
4.1	그래프 데이터의 익명화	100 
4.2	공간 데이터의 익명화	111 
4.3	스트림 데이터 익명화	118 

제5장	차분 프라이버시: 통계적 프라이버시 보호 모델	127 
5.1	차분 프라이버시의 개요	128 
5.2	차분 프라이버시를 만족하는 데이터 분석:대화형 환경(Interactive setting)	141 
5.3	차분 프라이버시를 만족하는 데이터 분석:비대화형 환경(Non-interactive setting)	146 
5.4	차분 프라이버시를 만족하는 공간 데이터 통계 배포	151 

제6장	프라이버시 보호 데이터 수집	165 
6.1	개요	166 
6.2	P2P 방식의 프라이버시 보호 데이터 수집	166 
6.3	차분 프라이버시 기반 프라이버시 보호 데이터 수집	178 

제7장	응용 1-프라이버시 보호 데이터 배포를 위한 익명화	189 
7.1	익명화 개요	190 
7.2	스키마 분석	190 
7.3	익명화 기법 적용	192 
7.4	익명화 데이터의 활용	195 
7.5	통계분석의 오차를 줄이기 위한 익명화 기법 적용	199 

제8장	응용 2-차분 프라이버시를 만족하는 공간 데이터통계 배포	221 
8.1	개요	222 
8.2	프라이버시를 고려한 공간 분할(PSD) 배포	223 
8.3	PSD를 사용한 범위 질의 분석	240 

제9장	응용 3-지역 차분 프라이버시 모델을 이용한개인정보 수집	247 
9.1	개요	248 
9.2	RAPPOR를 사용한 분포 추정	250

관련분야 신착자료

Harvard Business Review (2025)