네이버가 만든 한국형 생성 AI… 불투명한 정보 수집 '우려'

[머니S리포트-베일 벗은 '한국형' 초거대 AI②]뉴스 콘텐츠 '공짜 학습'… 언론사들 "정당한 대가 내야"

양진원 기자

8,500

2023.09.14 | 06:40:00

편집자주

오픈AI가 지난해 11월 챗GPT를 공개한 후 전 세계 곳곳에서 인공지능(AI) 주권 확보를 위한 경쟁이 본격화됐다. 네이버는 지난 8월 생성형 AI '하이퍼클로바X'를 선보이면서 국내 기업의 초거대 AI 시장 진출에 신호탄을 쏘아 올렸다. 통신사와 게임사 등 AI 개발에 뛰어든 국내 기업들은 기업 간 거래(B2B) AI 서비스 모델을 통해 새로운 수익원 확보에도 나섰다. 새로운 경제 환경에 적응하고 한국 AI 산업 육성을 위해선 기업간 협업 및 정부 지원이 뒷받침돼야 한다는 목소리가 나온다.

네이버가 생성형 인공지능(AI) '하이퍼클로바X'를 선보인 가운데 공짜 학습 논란에 휘말렸다. /그래픽=강지호 기자

네이버가 생성형 인공지능(AI) '하이퍼클로바X'를 야심차게 선보이며 글로벌 빅테크(대형 정보기술 기업)들이 버티고 있는 AI 시장에 도전장을 내밀었다. 하이퍼클로바X가 한국에 특화된 AI인 만큼 구글, MS와 경쟁에서도 승산이 있다는 판단이다.

하지만 하이퍼클로바X가 학습하는 뉴스 콘텐츠와 관련해 논란이 일고 있다. 언론사들이 네이버를 상대로 콘텐츠 저작권을 주장하며 사용료를 요구했기 때문이다. 네이버는 기존 약관을 토대로 문제없다는 입장이지만 전 세계적으로 해당 이슈를 두고 갑론을박이 이어지고 있어 관심이 모인다.

'하이퍼클로바X', 뉴스 콘텐츠 저작권 논란

국내 검색시장 점유율 그래프. /그래픽=강지호 기자

네이버는 지난 8월24일 생성형 AI를 중심으로 한 회사의 기술 방향성과 사업 전략을 공유하는 콘퍼런스 'DAN 23'을 개최했다. 하이퍼클로바X와 함께 이를 바탕으로 한 대화형 AI 서비스 '클로바X'와 생성형 AI 검색 '큐(CUE):'가 소개됐다. 네이버는 다가올 생성형 AI 시대를 맞이할 준비를 마쳤다고 자신했다. 개인과 기업 모두가 다양성을 유지하면서 혁신하는 일상을 구현할 것이라고 했다.

한국 법과 제도를 모두 이해한 하이퍼클로바X가 구글 대화형 AI 챗봇 '바드', 마이크로소프트 검색엔진 '빙'과 견줘서도 밀리지 않는다고 했다. 지난 20년 동안 검색부터 커머스, 엔터테인먼트 등 여러 서비스를 통해 축적한 데이터를 기반으로 한국 시장에 가장 적합한 AI 서비스를 선보일 수 있다는 자신감이다.

하이퍼클로바X를 공개하며 주춤했던 시장 점유율도 회복하고 있다. 웹사이트 분석업체 인터넷트렌드에 따르면 네이버는 올해 8월 국내 검색 시장에서 7월(56.09%)보다 2.43%포인트 오른 점유율 58.52%를 기록했다. 네이버는 최근 구글 바드 등 생성형 AI 열풍으로 검색 시장 왕좌를 위협받고 있었다. 지난해 말 점유율이 63.82%에 달했지만 5월 55.71%까지 떨어지기도 했다.

네이버는 하이퍼클로바X를 두고 기업 간 거래(B2B) 모델부터 수익화해 검증할 계획이다. 기업과 소비자 간 거래(B2C)에 관해서도 한정된 사용자 대상으로 베타 서비스를 진행해 검증을 이어간다.

이러한 구상에 앞서 콘텐츠 저작권 문제가 고민거리로 떠올랐다. 하이퍼클로바X가 1년 동안 검색되는 뉴스 분량의 50배에 달하는 한국어 데이터를 학습한 것으로 알려졌기 때문이다. 뉴스 저작권자인 국내 언론사들은 네이버가 허락을 받지 않은 채 뉴스를 AI 학습에 이용했다고 지적하며 사용료를 받아야 한다고 주장한다.

하지만 네이버는 하이퍼클로바X를 공개하면서 뉴스 콘텐츠 이용 대가 지급 여부와 기준을 제대로 밝히지 않아 '공짜 학습' 논란이 이어지고 있다.

네이버, 뉴스 콘텐츠 사용료 지급 고민… 전 세계서도 관련 논의 활발

최수연 네이버 최고경영자(CEO)가 지난 8월24일 오전 서울 강남구 그랜드인터컨티넨탈 서울파르나스에서 열린 팀 네이버 콘퍼런스 단23에서 기조연설을 하고 있다. /사진=뉴스1

최수연 대표는 지난 8월24일 하이퍼클로바X 관련 기자간담회를 통해 "여러 논의가 계속해서 진행되고 있는 부분"이라며 "지금까지 학습된 데이터들은 자사 약관에 근거를 두고 학습을 했기 때문에 별로 사용료에 대해서 논의하고 있는 단계는 아니다"라고 했다.

네이버는 과거 제휴 언론사 약관에 '연구 목적'으로 뉴스 데이터를 활용할 시 언론의 동의를 받지 않는다는 내용을 넣은 바 있다. 현재 새 약관을 준비 중이다.

이어 최 대표는 "생성형 AI 모델과 관련해 뉴스를 어떻게 활용할지는 아직 명확한 답변을 주긴 어렵다"고 설명했지만 언론사가 동의하지 않으면 활용하지 않는 방향으로 가닥을 잡겠다고 했다.

언론계는 네이버의 애매한 태도를 꼬집으면서 정당한 대가를 지불하라고 목소리를 높이고 있다. 한국온라인신문협회(온신협)는 성명서를 내고 "AI 학습은 기존 뉴스 서비스 약관에 규정된 서비스와 질적으로 다른 차원의, 원저작물을 가공한 서비스"라며 "공정이용의 원칙은 뉴스 콘텐츠, 데이터베이스를 AI가 무단으로 사용하는 것을 정당화하지 않는다"고 설명했다.

한국신문협회 역시 앞서 언론 뉴스 활용을 위한 기준을 언론과 협의가 필요하고 대가 산정을 위한 논의를 해야 한다고 주장했다.

생성형 AI의 뉴스 저작권 침해 문제는 이미 세계적으로 뜨겁다. 미국 CNN과 월스트리트저널은 생성형 AI 챗GPT를 개발한 오픈AI가 미국의 주요 언론사 뉴스를 학습한 정황이 드러나자 법적 대응을 검토하겠다고 밝혔다.

수많은 미국과 캐나다 언론사들이 가입된 뉴스미디어연합(NMA)도 인공지능의 무단 뉴스 학습을 비판하며 고유 콘텐츠를 사용한 사업자들은 이에 대한 보상을 해야 한다고 목소리를 높였다.

로이터통신, 미국 뉴욕타임스(NYT), CNN, 시카고트리뷴과 호주 ABC방송, 캔버라타임스는 이미 오픈AI의 웹 크롤러 'GPT봇'을 차단했다. 웹 크롤러는 웹사이트에서 정보를 자동 수집하는 프로그램이다.

세계신문협회는 지난 7월 '글로벌 AI 원칙' 초안을 마련했다. 각국 언론의 의견을 취합한 후 오는 11월 최종안을 공개할 예정이다.

<보도자료 및 기사 제보 ( [email protected] )>