개인정보가보호되는 동형암호기반금융데이터분석 - KMFA · 2017-07-01 ·...

29
개인정보가 보호되는 개인정보가 보호되는 동형암호기반 금융데이터분석 동형암호기반 금융데이터분석 천정희 (서울대학교)

Transcript of 개인정보가보호되는 동형암호기반금융데이터분석 - KMFA · 2017-07-01 ·...

Page 1: 개인정보가보호되는 동형암호기반금융데이터분석 - KMFA · 2017-07-01 · 개인정보가보호되는 동형암호기반금융데이터분석 천정희(서울대학교)

개인정보가 보호되는개인정보가 보호되는개인정보가 보호되는

동형암호기반 금융데이터분석

개인정보가 보호되는

동형암호기반 금융데이터분석

천정희 (서울대학교)

Page 2: 개인정보가보호되는 동형암호기반금융데이터분석 - KMFA · 2017-07-01 · 개인정보가보호되는 동형암호기반금융데이터분석 천정희(서울대학교)

� 1세대 암호 : Password (인증 기술)

� 2세대 암호 : 대칭키 암호 (데이터 암호화)

� 3세대 암호 : 공개키 암호 (키 암호화)

암호의 분류

� 3세대 암호 : 공개키 암호 (키 암호화)

� 4세대 암호 : 동형/함수암호 (NoKey 암호)

– 암호화된 상태에서의 계산이 가능한 암호

2

Page 3: 개인정보가보호되는 동형암호기반금융데이터분석 - KMFA · 2017-07-01 · 개인정보가보호되는 동형암호기반금융데이터분석 천정희(서울대학교)

미래 컴퓨팅 환경

� 우리가 원하는 “완벽한 하인”

� 내가 하려는 일을 빠르게 대신 수행

� 비밀을 알지 못한다.

� 사례1: 개인 클라우드

� 스토리지 클라우드: Dropbox, Google email/calendar, NAS� 스토리지 클라우드: Dropbox, Google email/calendar, NAS

� 계산 클라우드: DNA 계산, 헬쓰케어, 개인성향분석 통한 추천

� 사례2: 빅데이터 분석

� 개인정보기반 마케팅 (구글, 페이스북, 네이버 ...)

� 정부 데이터베이스: 교육, 의료, 납세

3

Page 4: 개인정보가보호되는 동형암호기반금융데이터분석 - KMFA · 2017-07-01 · 개인정보가보호되는 동형암호기반금융데이터분석 천정희(서울대학교)

The Future of Encryption (NSF)

4

http://www.math.snu.ac.kr/~jhcheon/xe2/index.php?mid=board_vpVy56&document_srl=762

Page 5: 개인정보가보호되는 동형암호기반금융데이터분석 - KMFA · 2017-07-01 · 개인정보가보호되는 동형암호기반금융데이터분석 천정희(서울대학교)

Homomorphic Encryption

� 4세대암호: 암호화된 데이터를 복호화 없이 연산하는 암호-10 Emerging Technologies (MIT Technical Review 2011)

Ciphering: Gentry's system allows encrypted data to be analyzed in the cloud. In this example, we wish to add 1 and 2. The data is encrypted so that 1 becomes 33 and 2 becomes 54. The encrypted data is sent to the cloud and processed: the result (87) can be downloaded from the cloud and decrypted to provide the final answer (3). Credit: Steve Moors

5

Page 6: 개인정보가보호되는 동형암호기반금융데이터분석 - KMFA · 2017-07-01 · 개인정보가보호되는 동형암호기반금융데이터분석 천정희(서울대학교)

동형암호

Real World Cyber World

yx Enc( )E(y)E(x)yx

Enc-1( )

f(E(x))f(x)

E-1

(f(E(x)))

Secret!

=

6

Page 7: 개인정보가보호되는 동형암호기반금융데이터분석 - KMFA · 2017-07-01 · 개인정보가보호되는 동형암호기반금융데이터분석 천정희(서울대학교)

Pros and Cons

� 장점� 컴퓨터에서 데이터의 모든 계산은 AND, OR, NOT의 논리 게이트로 연산� 암호화된 상태로 AND/OR/Not연산 � 컴퓨터로 하는 모든 연산이 가능

� 암호화후 검색/통계처리/Machine Learning� 해커의 데이터 유출 원천봉쇄

� 단점� 암호문 확장: 10-100 K배 � 0.1-1 K배(대칭키방식)� 암복호화 속도: 수십 ms (AES 1us, RSA 1ms)� 암호문 연산: 곱셈 수백ms� 응용연산 종류에 따른 속도의 차이가 큼 � 개별적 최적화

7

Page 8: 개인정보가보호되는 동형암호기반금융데이터분석 - KMFA · 2017-07-01 · 개인정보가보호되는 동형암호기반금융데이터분석 천정희(서울대학교)

동형암호칩 (in near future)

� Encrypted CPU�비트당 재부팅시간: 30분(2011), 0.32초(2013), 0.02초(2015)

8

Page 9: 개인정보가보호되는 동형암호기반금융데이터분석 - KMFA · 2017-07-01 · 개인정보가보호되는 동형암호기반금융데이터분석 천정희(서울대학교)

CRT 기반 동형암호

� RAD PH [1]

– 비밀키: two large primes p and q– 공개키: n = pq– 암호화: E(m) = (m mod p, m mod q)– 복호화: 중국인의 나머지정리– E(m1)+E(m2)=( m1 mod p, m1 mod q)– E(m1)+E(m2)=( m1 mod p, m1 mod q)

+( m2 mod p, m2 mod q)= ( m1+m2 mod p, m1+m2 mod q) = E(m1+m2)

– 안전한가?

� 동형암호[2]

– E(m) = (m+2100e1 mod p, m+2100e2 mod q)

[1] Rivest-Adleman-Dertouzos, On data banks and privacy homomorphism, FOSC’78.[2] C.-Kim-Lee. Batch Fully Homomorphic Encryption over the Integers, Eurocrypt 2013

0100200

me

9

Page 10: 개인정보가보호되는 동형암호기반금융데이터분석 - KMFA · 2017-07-01 · 개인정보가보호되는 동형암호기반금융데이터분석 천정희(서울대학교)

재부팅 Bootstrapping

�입력: 노후화된 암호문, 암호화된 비밀키

�출력: 신규 암호문

�과정 :곱을 반복하여 노이즈가 커진 암호문을노이즈가 작은 암호문으로 변경

10

Page 11: 개인정보가보호되는 동형암호기반금융데이터분석 - KMFA · 2017-07-01 · 개인정보가보호되는 동형암호기반금융데이터분석 천정희(서울대학교)

동형암호 효율성

공개키크기

암호문크기 Encrypt Decrypt Mult Recrypt Maessage

space

[RSA-2048] 2048bit 2048bit 6.1ms 205.5ms - - -

� 암호문 크기, 암복호화 시간

[ECC-193] 193bit 80B 8.7ms 18.1ms - - -

Helib (IBM) 53KB 16KB 20ms 7ms 51ms(23ms+28ms)

-

SEAL (MS) 60KB 15KB 32ms 17ms 143ms(71ms+72ms)

-

FPHE(SNU) 80KB 21KB 7.5ms 6ms 27ms -

Helib:OSX에서 test, SEAL:Window에서 test함. 둘 다 내장되어 있는 parameter 상용

/11

16bit 복소수에 대한유효숫자연산으로 연산후에 상위 16bit를메시지로 가지고 있다.

Page 12: 개인정보가보호되는 동형암호기반금융데이터분석 - KMFA · 2017-07-01 · 개인정보가보호되는 동형암호기반금융데이터분석 천정희(서울대학교)

이종기관 데이터기반이종기관 데이터기반신용정보계산

12

Page 13: 개인정보가보호되는 동형암호기반금융데이터분석 - KMFA · 2017-07-01 · 개인정보가보호되는 동형암호기반금융데이터분석 천정희(서울대학교)

이종기관 데이터기반 신용평가

13

Page 14: 개인정보가보호되는 동형암호기반금융데이터분석 - KMFA · 2017-07-01 · 개인정보가보호되는 동형암호기반금융데이터분석 천정희(서울대학교)

이종기관 데이터기반 신용평가

14

Page 15: 개인정보가보호되는 동형암호기반금융데이터분석 - KMFA · 2017-07-01 · 개인정보가보호되는 동형암호기반금융데이터분석 천정희(서울대학교)

Interactive Data Fusion

xx := := HEncHEncsksk (x)(x)

f(f(x,yx,y)):=:=f(f(xx,y,y))

f(f(x,yx,y)=)=HDecHDecsksk ((f(f(x,yx,y))))

A

A

A 기관금융정보

B 기관신용정보

15

Page 16: 개인정보가보호되는 동형암호기반금융데이터분석 - KMFA · 2017-07-01 · 개인정보가보호되는 동형암호기반금융데이터분석 천정희(서울대학교)

Interactive Data Fusion

16

Page 17: 개인정보가보호되는 동형암호기반금융데이터분석 - KMFA · 2017-07-01 · 개인정보가보호되는 동형암호기반금융데이터분석 천정희(서울대학교)

동형암호와 데이터분석동형암호와 데이터분석

17

Page 18: 개인정보가보호되는 동형암호기반금융데이터분석 - KMFA · 2017-07-01 · 개인정보가보호되는 동형암호기반금융데이터분석 천정희(서울대학교)

판별대상 데이터

머신러닝

Raw 전처리데이터

학습

x1, x2, …, xn

함수 f

예측Raw Data

Page 19: 개인정보가보호되는 동형암호기반금융데이터분석 - KMFA · 2017-07-01 · 개인정보가보호되는 동형암호기반금융데이터분석 천정희(서울대학교)

동형암호 머신러닝

대출정보통신요금공과금

개인정보보호 데이터분석 기술: 신용평가모델

공과금

� 현재 기술의 문제점- 이종기관 데이터 병합시 개인정보보호법 위반- 비식별화 후 데이터의 유용성 감소

� 돌파기술 : 동형암호화된 데이터의 머신러닝

Page 20: 개인정보가보호되는 동형암호기반금융데이터분석 - KMFA · 2017-07-01 · 개인정보가보호되는 동형암호기반금융데이터분석 천정희(서울대학교)

데이터 가정

DB1(신용데이터) DB2(통신데이터)

주민번호주민번호주민번호주민번호((((Index)Index)Index)Index)

총대출금총대출금총대출금총대출금 ((((AAAA1111)))) …………최장연체일수최장연체일수최장연체일수최장연체일수(A(A(A(Annnn))))

780212-2211123

10,000 … 15

… … …

890607-1789711

25,000 --- 50

주민번호주민번호주민번호주민번호(Index)(Index)(Index)(Index)

요금납부실적요금납부실적요금납부실적요금납부실적(B(B(B(B1111))))

…………최장연체일수최장연체일수최장연체일수최장연체일수((((BBBBmmmm))))

780212-2211123

A … 3

… … … …

890607-1789711

C … 80

IndexIndexIndexIndex AAAA1111 ………… AAAAnnnn BBBB1111 ………… BBBBmmmm

Hash(…) Enc(..) … Enc(..) Enc(..) … Enc(..)

… … … … … … …

Hash(…) Enc(..) --- Enc(..) Enc(..) … Enc(..)

가중치 a1 … an an+1 … an+m

1789711 1789711

19

Page 21: 개인정보가보호되는 동형암호기반금융데이터분석 - KMFA · 2017-07-01 · 개인정보가보호되는 동형암호기반금융데이터분석 천정희(서울대학교)

암호화 DB Fusion

1. 비식별화분석: 비식별화 후 병합

2. 동형분석: 데이터 동형암호화2. 동형분석: 데이터 동형암호화

3. 혼합: 동형암호화 후 가공하여 비식별화분석

20

Page 22: 개인정보가보호되는 동형암호기반금융데이터분석 - KMFA · 2017-07-01 · 개인정보가보호되는 동형암호기반금융데이터분석 천정희(서울대학교)

방법 1: 비식별화 분석

DB1(신용데이터) DB2(통신데이터)

주민번호주민번호주민번호주민번호((((Index)Index)Index)Index)

총대출금총대출금총대출금총대출금((((AAAA1111))))

…………최장연체일수최장연체일수최장연체일수최장연체일수(A(A(A(Annnn))))

780212780212780212780212----2211123221112322111232211123

10,00010,00010,00010,000 ………… 15151515

………… ………… …………

890607890607890607890607----1789711178971117897111789711

25,00025,00025,00025,000 ------------ 50505050

주민번호주민번호주민번호주민번호(Index)(Index)(Index)(Index)

요금납부실적요금납부실적요금납부실적요금납부실적(B(B(B(B1111))))

…………최장연체일수최장연체일수최장연체일수최장연체일수((((BBBBmmmm))))

780212780212780212780212----2211123221112322111232211123

AAAA ………… 3333

………… ………… ………… …………

890607890607890607890607----1789711178971117897111789711

CCCC ………… 80808080

주민번호주민번호주민번호주민번호((((Index)Index)Index)Index)

총대출금총대출금총대출금총대출금((((AAAA1111))))

…………최장연체일수최장연체일수최장연체일수최장연체일수

(A(A(A(Annnn))))

Hash(Hash(Hash(Hash(…)…)…)…) 10,00010,00010,00010,000 ………… 15151515

………… ………… …………

Hash(Hash(Hash(Hash(…)…)…)…) 25,00025,00025,00025,000 ------------ 50505050

주민번호주민번호주민번호주민번호(Index)(Index)(Index)(Index)

요금납부실적요금납부실적요금납부실적요금납부실적(B(B(B(B1111))))

…………최장연체일수최장연체일수최장연체일수최장연체일수((((BBBBmmmm))))

Hash(Hash(Hash(Hash(…)…)…)…) AAAA ………… 3333

………… ………… ………… …………

Hash(Hash(Hash(Hash(…)…)…)…) CCCC ………… 80808080

1. 비식별화 : ID를 난수로 대치2. 데이터 병합3. 재식별방지 조치 : k-익명성,

l-다양성, t-근접성

IndexIndexIndexIndex AAAA1111 ………… AAAAnnnn BBBB1111 ………… BBBBmmmm

Hash(Hash(Hash(Hash(…………)))) 10,00010,00010,00010,000 ………… 15151515 AAAA ………… 3333

………… ………… ………… ………… ………… ………… …………

Hash(Hash(Hash(Hash(…………)))) 25,00025,00025,00025,000 ………… 50505050 CCCC ………… 80808080

가중치가중치가중치가중치 aaaa1111 ………… aaaannnn aaaan+1n+1n+1n+1 ………… aaaan+mn+mn+mn+m

1789711178971117897111789711 1789711178971117897111789711Hash(Hash(Hash(Hash(…)…)…)…) 25,00025,00025,00025,000 ------------ 50505050 Hash(Hash(Hash(Hash(…)…)…)…) CCCC ………… 80808080

단점 : 비식별조치 이후에는데이터의 유용성 감소

21

Page 23: 개인정보가보호되는 동형암호기반금융데이터분석 - KMFA · 2017-07-01 · 개인정보가보호되는 동형암호기반금융데이터분석 천정희(서울대학교)

DB1(신용데이터) DB2(통신데이터)

주민번호주민번호주민번호주민번호((((Index)Index)Index)Index)

총대출금총대출금총대출금총대출금 ((((AAAA1111)))) …………최장연체일수최장연체일수최장연체일수최장연체일수

(A(A(A(Annnn))))

780212-2211123

10,000 … 15

… … …

890607-1789711

25,000 --- 50

주민번호주민번호주민번호주민번호(Index)(Index)(Index)(Index)

요금납부실적요금납부실적요금납부실적요금납부실적(B(B(B(B1111))))

…………최장연체일수최장연체일수최장연체일수최장연체일수((((BBBBmmmm))))

780212-2211123

A … 3

… … … …

890607-1789711

C … 80

주민번호주민번호주민번호주민번호((((Index)Index)Index)Index)

총대출금총대출금총대출금총대출금 ((((AAAA1111)))) …………최장연체일수최장연체일수최장연체일수최장연체일수

(A(A(A(Annnn))))

Hash(Hash(Hash(Hash(…)…)…)…) HE(..)HE(..)HE(..)HE(..)AAAA11111111 ………… HE(..)HE(..)HE(..)HE(..)AAAAn1n1n1n1

………… ………… ………… …………

Hash(Hash(Hash(Hash(…)…)…)…) HE(..)HE(..)HE(..)HE(..)AAAA1l1l1l1l ………… HE(..)HE(..)HE(..)HE(..)AAAAnlnlnlnl

주민번호주민번호주민번호주민번호(Index)(Index)(Index)(Index)

요금납부실적요금납부실적요금납부실적요금납부실적(B(B(B(B1111))))

…………최장연체일수최장연체일수최장연체일수최장연체일수((((BBBBmmmm))))

Hash(Hash(Hash(Hash(…)…)…)…) HE(..)HE(..)HE(..)HE(..)BBBB11111111 ………… HE(..)HE(..)HE(..)HE(..)BBBBm1m1m1m1

………… ………… ………… …………

Hash(Hash(Hash(Hash(…)…)…)…) HE(..)HE(..)HE(..)HE(..)BBBB1l1l1l1l ………… HE(..)HE(..)HE(..)HE(..)BBBBmlmlmlml

방법 2: 동형 분석

22

1. 동형암호화(ID를 난수로 대치)

2. 데이터 병합3. 암호화 분석4. 그룹복호화

(비밀키는 다중 기관 분산)

IndexIndexIndexIndex AAAA1111 ………… AAAAnnnn BBBB1111 ………… BBBBmmmm

Hash(Hash(Hash(Hash(…………)))) HE(..)HE(..)HE(..)HE(..)AAAA11111111 ………… HE(..)HE(..)HE(..)HE(..)AAAAn1n1n1n1 HE(..)HE(..)HE(..)HE(..)BBBB11111111 ………… HE(..)HE(..)HE(..)HE(..)BBBBm1m1m1m1

………… ………… ………… ………… ………… ………… …………

Hash(Hash(Hash(Hash(…………)))) HE(..)HE(..)HE(..)HE(..)AAAA1l1l1l1l ………… HE(..)HE(..)HE(..)HE(..)AAAAnlnlnlnl HE(..)HE(..)HE(..)HE(..)BBBB1l1l1l1l ………… HE(..)HE(..)HE(..)HE(..)BBBBmlmlmlml

1789711 1789711Hash(Hash(Hash(Hash(…)…)…)…) HE(..)HE(..)HE(..)HE(..) 1l1l1l1l ………… HE(..)HE(..)HE(..)HE(..) nlnlnlnl Hash(Hash(Hash(Hash(…)…)…)…) HE(..)HE(..)HE(..)HE(..) 1l1l1l1l ………… HE(..)HE(..)HE(..)HE(..) mlmlmlml

단점 : 동형암호 후에는자동화된 데이터분석만 가능

IndexIndexIndexIndex AAAA1111 ………… AAAAnnnn BBBB1111 ………… BBBBmmmm

Hash(Hash(Hash(Hash(…………)))) HE(..)HE(..)HE(..)HE(..)AAAA11111111 ………… HE(..)HE(..)HE(..)HE(..)AAAAn1n1n1n1 HE(..)HE(..)HE(..)HE(..)BBBB11111111 ………… HE(..)HE(..)HE(..)HE(..)BBBBm1m1m1m1

………… ………… ………… ………… ………… ………… …………

Hash(Hash(Hash(Hash(…………)))) HE(..)HE(..)HE(..)HE(..)AAAA1l1l1l1l ………… HE(..)HE(..)HE(..)HE(..)AAAAnlnlnlnl HE(..)HE(..)HE(..)HE(..)BBBB1l1l1l1l ………… HE(..)HE(..)HE(..)HE(..)BBBBmlmlmlml

암호화된암호화된암호화된암호화된가중치가중치가중치가중치

HEHEHEHE1111(..)(..)(..)(..) ………… HEHEHEHEnnnn(..)(..)(..)(..) HEHEHEHEn+1n+1n+1n+1(..)(..)(..)(..) ………… HEHEHEHEn+mn+mn+mn+m(..)(..)(..)(..)

IndexIndexIndexIndex AAAA1111 ………… AAAAnnnn BBBB1111 ………… BBBBmmmm

Hash(Hash(Hash(Hash(…………)))) HE(..)HE(..)HE(..)HE(..)AAAA11111111 ………… HE(..)HE(..)HE(..)HE(..)AAAAn1n1n1n1 HE(..)HE(..)HE(..)HE(..)BBBB11111111 ………… HE(..)HE(..)HE(..)HE(..)BBBBm1m1m1m1

………… ………… ………… ………… ………… ………… …………

Hash(Hash(Hash(Hash(…………)))) HE(..)HE(..)HE(..)HE(..)AAAA1l1l1l1l ………… HE(..)HE(..)HE(..)HE(..)AAAAnlnlnlnl HE(..)HE(..)HE(..)HE(..)BBBB1l1l1l1l ………… HE(..)HE(..)HE(..)HE(..)BBBBmlmlmlml

암호화된암호화된암호화된암호화된가중치가중치가중치가중치

HEHEHEHE1111(..)(..)(..)(..) ………… HEHEHEHEnnnn(..)(..)(..)(..) HEHEHEHEn+1n+1n+1n+1(..)(..)(..)(..) ………… HEHEHEHEn+mn+mn+mn+m(..)(..)(..)(..)

가중치가중치가중치가중치 aaaa1111 ………… aaaannnn aaaan+1n+1n+1n+1 ………… aaaan+mn+mn+mn+m

Page 24: 개인정보가보호되는 동형암호기반금융데이터분석 - KMFA · 2017-07-01 · 개인정보가보호되는 동형암호기반금융데이터분석 천정희(서울대학교)

방법 3: 혼합(동형 계산후 평문 분석)

1. 동형암호화2. 데이터 병합

IndexIndexIndexIndex AAAA1111 ………… AAAAnnnn BBBB1111 ………… BBBBmmmm

Hash(Hash(Hash(Hash(…………)))) HE(..)HE(..)HE(..)HE(..)AAAA11111111 ………… HE(..)HE(..)HE(..)HE(..)AAAAn1n1n1n1 HE(..)HE(..)HE(..)HE(..)BBBB11111111 ………… HE(..)HE(..)HE(..)HE(..)BBBBm1m1m1m1

………… ………… ………… ………… ………… ………… …………

Hash(Hash(Hash(Hash(…………)))) HE(..)HE(..)HE(..)HE(..)AAAA1l1l1l1l ………… HE(..)HE(..)HE(..)HE(..)AAAAnlnlnlnl HE(..)HE(..)HE(..)HE(..)BBBB1l1l1l1l ………… HE(..)HE(..)HE(..)HE(..)BBBBmlmlmlml

2. 데이터 병합3. 동형데이터를 가공

(속성병합, 변환)4. 복호화 후 분석하여

가중치 계산

23

IndexIndexIndexIndex AAAA1111+B+B+B+B2222 2A2A2A2A2222----BBBB3333 ………… AAAAnnnn+2B+2B+2B+2Bmmmm

Hash(Hash(Hash(Hash(…………))))HE(..)HE(..)HE(..)HE(..)AAAA11111111+HE(..)+HE(..)+HE(..)+HE(..)BBBB21212121

2HE(..)2HE(..)2HE(..)2HE(..)AAAA21212121----HE(..)HE(..)HE(..)HE(..)BBBB31313131

…………HE(..)HE(..)HE(..)HE(..)AAAAn1n1n1n1+2HE(..)+2HE(..)+2HE(..)+2HE(..)BBBBm1m1m1m1

………… ………… ………… ………… …………

Hash(Hash(Hash(Hash(…………))))HE(..)HE(..)HE(..)HE(..)AAAA1l1l1l1l+HE(..)+HE(..)+HE(..)+HE(..)BBBB2l2l2l2l

2HE(..)2HE(..)2HE(..)2HE(..)AAAA2l2l2l2l----HE(..)HE(..)HE(..)HE(..)BBBB3l3l3l3l

HE(..)HE(..)HE(..)HE(..)AAAAnlnlnlnl+2HE(..)+2HE(..)+2HE(..)+2HE(..)BBBBmlmlmlml

가중치가중치가중치가중치

IndexIndexIndexIndex AAAA1111+B+B+B+B2222 2A2A2A2A2222----BBBB3333 ………… AAAAnnnn+2B+2B+2B+2Bmmmm

Hash(Hash(Hash(Hash(…………)))) HDecHDecHDecHDec(..(..(..(..)))) HDecHDecHDecHDec(..)(..)(..)(..) ………… HDecHDecHDecHDec(..(..(..(..))))

………… ………… ………… ………… …………

Hash(Hash(Hash(Hash(…………)))) HDecHDecHDecHDec(..(..(..(..)))) HDecHDecHDecHDec(..(..(..(..)))) HDecHDecHDecHDec(..(..(..(..))))

가중치가중치가중치가중치

IndexIndexIndexIndex AAAA1111+B+B+B+B2222 2A2A2A2A2222----BBBB3333 ………… AAAAnnnn+2B+2B+2B+2Bmmmm

Hash(Hash(Hash(Hash(…………)))) HDecHDecHDecHDec(..(..(..(..)))) HDecHDecHDecHDec(..)(..)(..)(..) ………… HDecHDecHDecHDec(..(..(..(..))))

………… ………… ………… ………… …………

Hash(Hash(Hash(Hash(…………)))) HDecHDecHDecHDec(..(..(..(..)))) HDecHDecHDecHDec(..(..(..(..)))) HDecHDecHDecHDec(..(..(..(..))))

가중치가중치가중치가중치 bbbb1111 bbbb2222 bbbbkkkk

Page 25: 개인정보가보호되는 동형암호기반금융데이터분석 - KMFA · 2017-07-01 · 개인정보가보호되는 동형암호기반금융데이터분석 천정희(서울대학교)

Prediction Phase: 내적 암호

24

Page 26: 개인정보가보호되는 동형암호기반금융데이터분석 - KMFA · 2017-07-01 · 개인정보가보호되는 동형암호기반금융데이터분석 천정희(서울대학교)

� 동형암호 vs 함수암호

• 동형암호 Enc(m1),…, Enc(mn) ���� Enc(f(m1, m2, …, mn)) 모든 f

• 함수암호 Enc(m1),…, Enc(mn) ���� f(m1, m2, …, mn) 특정한 f

함수암호 (Functional Encryption)

�함수암호의 응용

• 생체인식 : EncK(m1), EncK(m2) � m1=m2인지 판별

�양자컴퓨터 시대에 안전한 암호기법

25

Page 27: 개인정보가보호되는 동형암호기반금융데이터분석 - KMFA · 2017-07-01 · 개인정보가보호되는 동형암호기반금융데이터분석 천정희(서울대학교)

앞으로의 논의 사항

�제도적 문제– 암호화된 데이터의 개인정보보호법 적용 문제– 동형암호 : 복호화 권한 분산– 익명성/동형암호/함수암호 등의 안전성 분류

�기술적 문제– 동형기계학습 (homomorphic machine learning) 알고리즘– 효율적 동형암호 알고리즘 개발– 동향암호 고속 구현

26

Page 28: 개인정보가보호되는 동형암호기반금융데이터분석 - KMFA · 2017-07-01 · 개인정보가보호되는 동형암호기반금융데이터분석 천정희(서울대학교)

결론

27

Page 29: 개인정보가보호되는 동형암호기반금융데이터분석 - KMFA · 2017-07-01 · 개인정보가보호되는 동형암호기반금융데이터분석 천정희(서울대학교)

Q & A

28