/사진=뉴시스/AP
/사진=뉴시스/AP

# 영국의 소설가 조지오웰의 소설 <1984>에는 ‘빅브라더’라는 인물이 등장한다. 절대권력을 가진 빅브라더는 집안과 거리에 설치된 텔레스크린으로 사람들의 행동을 감시하고 정부의 선전 영상과 조작된 통계를 끊임없이 송출한다. 모든 사람의 행동은 빅브라더에게 보고되고 개인의 사적인 영역까지 무차별 수집·관리된다.
최근 페이스북에서 유출된 5000만명의 개인정보가 미국 대선에 사용된 사실이 드러나면서 빅데이터가 IT업계의 뜨거운 감자로 떠올랐다. 업계 전문가들은 이를 ‘데이터 게이트’라 부르며 빅데이터의 오남용이 불러온 참사라 칭한다. 일각에서는 페이스북이 소설 속 빅브라더 역할을 했다며 책임을 추궁했다.

페이스북 데이터 게이트의 전말은 이렇다. 2016년 케임브리지대 심리학과 교수인 알렉산더 코건이 개발한 ‘디스이즈유어디지털라이프’라는 앱에서 게이트는 시작됐다. 이 앱은 사용자와 이들의 친구로 연결된 계정정보를 수집해 케임브리지애널리키타(CA)로 전송했다. CA는 당시 미국 공화당 대선후보였던 도널드 트럼프 캠프의 최고책임자 스티븐 배넌과 트럼프 지지자 로버트 머서가 공동 설립한 회사로 고객정보를 분석·가공해 트럼프 캠프에 제공했다. 트럼프 캠프는 이렇게 수집된 정보를 바탕으로 유권자의 결정에 입김을 불어넣었다.


지난달 17일 CA 전 직원 크리스토퍼 와일의 폭로로 드러난 이 사건은 설립 14년차 세계 최대 IT기업 페이스북을 뒤흔들었다. 페이스북의 주가는 급락했다. 시가총액이 이틀 만에 52조6409억원이 증발했고 마크 저커버그 페이스북 CEO의 지분 가치도 이틀 새 12조6685억원이 줄었다. 금전적인 손실보다 기업신뢰에 대한 타격이 더 심각했다.

사건 보도 직후 엘론 머스크 등 유명인을 중심으로 한 페이스북 이탈현상이 가속화됐다. 이어 미국 연방거래위원회(FTC)는 성명을 내고 “페이스북의 개인정보 취급에 대한 보도를 심각하게 보는 중이며 FTC 법 위반으로 이용자에게 피해를 주는 행위에 페이스북이 얼마나 연루됐는지 확인할 것”이라며 조사에 착수했다.

◆‘엘도라도’ 빅데이터

페이스북을 뿌리부터 흔든 빅데이터는 2010년대 들어 급격하게 떠오른 키워드다. 과거와 차원이 다른 ‘방대한 수준의 데이터’를 일컫는 빅데이터는 생성주기가 짧고 숫자뿐만 아니라 문자, 영상 등을 모두 포함하는 특징을 지닌다. 빅데이터는 디지털산업의 성장으로 생산되기 시작했으며 한사람이 하루에도 수십~수백건을 생산한다.


등장 초기 빅데이터는 부정적인 측면보다 긍정적인 측면이 더 부각됐다. 특히 마케팅시장에서 빅데이터는 ‘엘도라도’였다. 미국 최대의 온라인 전자상거래 플랫폼 아마존은 고객의 취향을 분석해 제품을 추천하는 마케팅방식을 구현했다. 고객이 생산한 빅데이터를 기반으로 맞춤 제품을 추천한 결과 전체 매출이 약 30% 늘었다. 넷플릭스도 빅데이터를 기반으로 성장했다. 고객의 데이터를 기반으로 취향에 맞는 영화를 추천하는 ‘시네매치’를 도입해 2500만명의 이용자를 유치하는데 성공했다.

일본은 빅데이터를 편의점에 도입했다. 일본 편의점 체인업체 로손은 고객이 선호하는 제품과 결제 이력, 방문 매장을 빅데이터로 구축해 해당 점포의 점주가 상품을 발주하는 데 도움을 준다.

국내에서는 카드사와 금융권을 중심으로 빅데이터가 도입됐다. 2013년 롯데카드가 백화점, 대형마트 등 롯데그룹의 유통망을 활용한 이력이 있는 25~39세 여성을 대상으로 상품 할인 쿠폰을 발송한 것을 기점으로 빅데이터시대가 도래했다.

페이스북 주가추이
페이스북 주가추이

◆빅데이터 처리 투명하게 공개해야

빅데이터는 생활에 편리함을 가져왔다. 치킨을 주문하면서 집주소를 이야기하는 번거로움을 덜었으며 인터넷쇼핑에 필요한 시간도 크게 줄였다. 하지만 페이스북의 데이터 게이트를 기점으로 국내에서도 빅데이터의 문제점을 지적하는 목소리가 커졌다.
빅데이터는 ‘재식별화’될 수 있다는 점이 가장 큰 문제로 지적된다. 소량의 데이터만으로는 개인의 정보를 끄집어내는 데 한계가 있다. 하지만 비교분석이 가능한 여러건의 데이터가 축적된다면 이야기는 달라진다. 무수히 많은 데이터를 모으면 지워졌던 개인의 얼굴이 복원된다. 쉽게 말해 빅데이터를 재식별화하면 앞으로의 의사와 행동방향을 분석할 수 있다는 말이다.

대부분의 기업은 비식별화된 빅데이터를 결합하는 재식별화 작업을 거쳐 자사의 이익을 위해 사용한다. 각기 다른 분야의 기업이 보유한 빅데이터를 결합하는 경우도 있다. 지난해 4월 SK텔레콤과 한화생명보험은 각자 보유한 서로 다른 내용의 빅데이터를 결합시켜 신용정보 비보유자의 신용도 등 새로운 데이터를 도출하는 데 성공하면서 업계의 시선을 끌었다.

IT업계 전문가는 “빅데이터는 더 이상 익명의 데이터가 아니다”며 “페이스북사태는 빅데이터가 빅브라더로 악용될 가능성이 높다는 점을 잘 보여준 사례”라고 말했다.

그는 이어 “민간과 공공을 막론하고 빅데이터를 처리하는 과정을 투명하게 공개하고 시민에게 더 높은 정보통제권을 부여해야 빅데이터 혜택을 최대화할 수 있을 것”이라고 조언했다.

☞ 본 기사는 <머니S> 제534호(2018년 4월4~10일)에 실린 기사입니다.