![]() |
KT가 자체 개발한 인공지능(AI) 언어모델(LLM) '믿음 2.0'을 통해 AI 자강 기조로 선회한다. 김영섭 대표 취임 이후 미국 마이크로소프트(MS)와 협력을 강조해왔지만 이재명 정부의 소버린AI 기조가 확실한 만큼 자체 개발 AI 모델 개발에 힘을 쏟겠다는 전략이다.
KT는 3일 오전 10시 온라인 기자간담회를 열고 '한국적 AI'라는 철학을 반영한 언어모델 믿음 2.0을 소개했다. 믿음 2.0은 2023년 발표한 '믿음 1.0'의 상위 버전이다. KT는 그동안 믿음 1.0을 자사 AI 고객센터(AICC), 지니TV, AI 전화 등 다양한 서비스에 이를 적용해왔다.
이번 믿음 2.0은 115억 파라미터 규모의 '믿음 2.0 베이스'와 23억 파라미터 규모의 '믿음 2.0 미니' 2종이다. 모두 한국어와 영어를 지원한다. 110억 파라미터 이상 한국어 범용 LLM을 누구나 상업적으로 쓸 수 있도록 오픈소스 형태로 공개한 것은 KT가 처음이다.
KT는 믿음이 자사와 고려대학교가 공동 개발한 한국어 AI 역량 평가 지표인 '코-소버린' 벤치마크에서 유사 규모 국내 기성 모델을 비롯해 글로벌 최고 수준의 오픈소스 모델을 능가하는 점수를 기록했다고 부연했다. 한국과 관련한 전문 지식의 이해도를 측정하는 대표적 벤치마크 'KMMLU'와 한국어 언어모델 평가 지표인 'HAERAE'에서도 믿음은 국내외 주요 오픈소스 모델보다 더 우수한 성능을 기록했다고 덧붙였다.
김영섭 대표 부임 이후 지난해 사티아 나델라 마이크로소프트 최고경영자(CEO)와 전략적 파트너십을 맺기도 하며 MS와의 긴밀한 관계를 강화해왔다. 비용이 많이 드는 자체 개발보다 MS와 기술 및 인사 교류 같은 빅테크와의 협력이 유리하다는 판단에서다.
KT는 믿음 2.0을 토대로 국내 AI 생태계에 '한국적 AI'를 확산할 계획이다. 신동훈 KT Gen AI Lab장(상무)은 "KT는 믿음 AI 개발을 멈춘 적이 없다"며 "믿음은 여러가지 상황과 목적에서 고객의 니즈를 충족시킬 수 있다. 최신기술을 활용해서 종합적 성능을 갖추도록 노력하겠다"고 했다.
AI 학습에 필요한 데이터 안정성에도 공을 들였다고 설명했다. 신 상무는 "데이터 라이선스 이슈 해결을 위해 데이터 얼라이언스에서 데이터를 수급하고 합법적으로 구매한 데이터만 활용했다"며 "공개된 데이터 모음 중에서 상업적 이용이 불가능하고 판단이 어려운 회색지대 데이터는 배제해 투명한 데이터만 썼다"고 말했다. "믿음 모델은 데이터를 준비하고 학습하는 과정에 이르기까지 자체 기술로 개발한 모델인 만큼 데이터 관점에서 저작권 이슈가 없다"고 부연했다.
정부의 독자 AI 개발 노선에도 적극 협력하겠다고 했다. 신 상무는 "독자 AI 파운데이션 개발 프로젝트에 참여하도록 노력하겠다"며 "데이터 얼라이언스를 통해 구축한 데이터들이 독자적 파운데이션에 강점이 있다고 생각한다"고 전했다.
믿음 2.0이 소버린AI를 대표할 수 있다고 강조했다. 신 상무는 "KT 소버린AI는 4가지 철학으로 서비스를 개발한다 데이터주권. 사용자 데이터 주권 보장. 사용자들에게 사용환경과 목적에 맞는 선택권 제공해야 한다는 것. 모든 모델과 서비스는 한국적 가치관과 문화를 잘 담아야 한다. 제공 서비스는 안전을 준수해 책임있게 운영돼야 한다. 믿음 모델은 데이터 구축부터 학습 전 과정 자체 기술. 소버린AI 대표한다고 생각.
정부에도 데이터 활용도를 높여달라고 주문했다. 신 상무는 "데이터 사용 규제를 완화하는 것이 필요하다"며 "법적으로 위반되는 것은 안 되지만 이밖의 국가 데이터들이 막혀 있어 활용하지 못한다"고 했다. 그는 "국가가 통제하는 데이터는 예산을 투입해서 독자 모델 프로젝트 과정에서 기업들이 활용하면 좋겠다"고 말했다.