벤치마크 점수 자랑해도 골목대장 수준
‘스크래치’ 외치지만 뒤에선 GPT 복제
소버린 핵심은 설계·운용 자율성 확보

KT 기술혁신부문 연구원들이 서초구 KT 우면연구센터에서 믿음 20을 테스트하고 있는 모습 /KT
KT 기술혁신부문 연구원들이 서초구 KT 우면연구센터에서 믿음 20을 테스트하고 있는 모습 /KT

KT가 한국형 생성형 AI 모델 ‘믿:음 2.0’을 전격 공개하며 “스크래치부터  자체 기술로 만들었다”는 자신감을 내비쳤다. 하지만 글로벌 인공지능(AI) 시장의 기술 지형과 비교할 때 ‘소버린AI’라는 이름 아래 완전한 독립을 외치기에는 여전히 많은 의문 부호가 붙는다.

3일 KT는 온라인 기술 브리핑을 열고 115억 파라미터 규모의 ‘믿:음 2.0 Base’와 23억 파라미터의 ‘믿:음 2.0 Mini’를 공개했다. 신동훈 젠 AI Lab 상무는 “KT는 한국의 말과 문화를 깊이 이해하는 모델을 만드는 것이 목표였다”며 “지난 1년간 스크래치부터 자체 기술로 모델을 재구축했고 개발을 멈춘 적은 한 번도 없다”고 강조했다.

KT는 이번 모델을 통해 한국적 가치관, 언어·문화적 맥락을 반영한 AI 생태계를 구축하겠다고 밝혔다. 실제로 고려대와 협력해 한국문화 표현력을 반영한 독자적 벤치마크 ‘코-소버린(Ko-Sovereign)’까지 개발했고 이 지표에서 믿:음 2.0은 국내외 모델을 능가하는 성적을 거뒀다고 설명했다.

하지만 전문가들은 KT의 이 같은 발표를 곧이곧대로 받아들이지 않는다. 소버린AI의 ‘독자성’이 과장된 것 아니냐는 의혹이 여전하기 때문이다. 실제 믿:음 2.0은 분명 KT가 설계한 토크나이저와 데이터 파이프라인을 통해 학습됐지만 B2B 특화라는 제한된 활용도와 범용성 부족이 약점으로 지적된다.

특히 KT가 “모든 작업에 GPT 같은 고성능 모델이 필요한 것은 아니다”라며 고성능 모델 영역은 MS와 공동 개발 중인 GPT 기반 모델로 커버하겠다고 밝힌 대목은 시선을 끈다. 이는 사실상 ‘투트랙 전략’을 공인한 것으로 독립을 강조하면서도 글로벌 거대 기술사에 일정 부분 의존하는 구조다.

업계 한 관계자는 “KT의 독자 LLM이 ‘국산 자존심’이라는 상징성을 부각시키려 했지만, 진정한 기술 주권 확보를 논하려면 글로벌 SOTA급(최고 수준) 모델과의 격차를 메울 수 있어야 한다”며 “지금 단계에선 MS GPT 생태계의 보완재 역할에 그칠 가능성이 높다”고 지적했다.

이날 발표된 SKT의 ‘에이닷 X 4.0’과 비교 구도도 빠질 수 없다. SKT는 외부 공개모델인 큐웬(Qwen) 2.5에 한국어 데이터를 추가 학습시키는 방식으로 비용과 개발 시간을 단축했다. 이에 반해 KT는 “스크래치부터 독자 기술로 개발했다”는 점을 강조하며 외산 LLM 의존도를 최소화한 국산 모델임을 내세웠다.

AI 업계에서 말하는 ‘스크래치부터 개발’은 단순히 외부 모델을 가져다 쓰지 않고 데이터셋 구성부터 모델 아키텍처 설계, 파라미터 초기화, 학습 알고리즘 구현까지 모든 과정을 자체 기술로 수행한다는 의미다. 하지만 이 표현은 시장에서 종종 과장되거나 오해의 소지가 있다.

진정한 의미의 스크래치 개발은 기존 생태계나 라이브러리에 의존하지 않고 완전한 독립 구조를 구현하는 것을 뜻하지만, 현실에서는 대부분 오픈소스 프레임워크(PyTorch, TensorFlow 등)를 기반으로 한 ‘부분적 스크래치’에 그친다. 결국 KT의 ‘믿음 2.0’도 스크래치 개발을 내세우고 있지만, 이는 완전한 구조 독립이 아닌 데이터 파이프라인 및 토크나이저 수준의 차별화일 가능성이 크다는 지적이 나온다.

즉 SKT가 자랑하는 토큰 효율성이나 KT의 국산화 설계가 기술적 강점임은 분명하지만, AI 내부에 맥락 유지와 추론 일관성을 확보할 수 있는 고급 목표 형성 메커니즘을 심어 넣기까지는 갈 길이 멀다는 지적이 나온다. 표면적 성능 지표와 벤치마크 점수가 높아도, 이는 여전히 외부에서 주입한 데이터와 파이프라인 위에서 작동하는 ‘모델’ 수준에 머무르는 한계가 있다.

결국 ‘한국형’이라는 딱지만 붙인다고 소버린 AI가 완성되는 것은 아니라는 지적이 제기된다. 인공지능 한 전문가는 여성경제신문에 "소버린 AI는 단순히 한국어와 문화를 이해하는 것을 넘어 설계 단계부터 자체적 판단 기준과 지속적 학습·적응 능력을 갖춘 구조를 요구한다"며 "현재 SKT와 KT의 모델은 기존 설계를 변형한 수준에 가까워 유지 관리 비용만 발생시키는 구조"라고 지적했다.

여성경제신문 이상헌 기자 liberty@seoulmedia.co.kr

관련기사

저작권자 © 여성경제신문 무단전재 및 재배포 금지