추론 전용이란 용어의 함정 = 껍데기
AI 뇌는 딴 곳 vs 광주는 테스트베드
국산 반도체 육성 명목의 종속 강화
이재명표 파운데이션 정책과도 충돌

광주광역시의 인공지능(AI) 컴퓨팅센터 유치 무산을 달래기 위해 정부가 제시한 대안이 또 다른 ‘AI 허상’ 논란으로 번지고 있다. 정부가 추진 중인 국가 NPU(신경망처리장치) 컴퓨팅센터가 실제로는 AI(인공지능) 학습이 불가능한 추론 전용 인프라에 불과하다는 사실이 확인되면서다.
9일 빅테크업계 등에 따르면 AI 산업의 핵심은 모델이 스스로 학습하고 확장하는 ‘훈련(Training)’ 단계에 있다. 그러나 정부가 광주 달래기용으로 검토 중인 NPU는 이미 학습된 모델의 결과만 계산하는 ‘추론(Inference)’ 전용 칩이다.
겉으로는 ‘AI 컴퓨팅센터’라는 이름을 달고 있지만, 실제로는 남이 만든 모델을 실행만 하는 쇼룸이 될 가능성이 높다. 강기정 광주시장이 “NPU 효율이 GPU보다 10~100배 높다”고 강조하지만, 이는 추론에만 해당하는 수치로 근본적 문제를 가리기 어렵다.
이와 관련 AI 스타트업 한 관계자는 “GPU 없는 AI센터는 마치 엔진 없는 비행기와 같다”며 “광주가 원하는 것은 개발 능력인데, 정부는 실행만 가능한 장비로 체면을 세워주려 한다”고 지적했다. 산업계에서는 이를 두고 “AI를 만드는 도시가 아니라, 해외 AI를 구동하기만 하는 도시”라는 냉소도 나온다.
국산 NPU 생태계—리벨리온(Rebellions)과 퓨리오사AI(FuriosaAI)—역시 구조적 한계를 벗어나지 못하고 있다. 리벨리온의 ATOM은 데이터센터급 NPU지만, 대규모 행렬연산을 처리하기 위한 FP 연산 유닛과 NVLink급 통신망이 없어 초거대 모델 학습에는 적합하지 않다. 퓨리오사AI의 Warboy 또한 엣지·자동차용 초저전력 추론 칩으로 설계돼, 대규모 데이터 로딩이나 메모리 캐시 측면에서 GPU군과 비교하기 어렵다.
AI 학습에 필수적인 세 요소—대규모 플로팅포인트 연산(FP16·BF16), 고대역폭 메모리(HBM), GPU 클러스터 통신망(NVLink·InfiniBand)—을 기준으로 보면, 현재 국산 NPU는 2~3개가 결여된 상태다. 국산 칩을 아무리 채워 넣어도 ‘AI 시연관’은 될 수 있어도 ‘국가급 AI 학습 센터’로 기능하기 어렵다는 지적이 이어진다.
결국 AI 주권 논란이 불가피해졌다. 정부는 NPU센터를 ‘국산 AI 반도체 육성’의 첫 단계라고 설명하지만, 학습 인프라가 없는 상태에서 추론 장비만 구축하면 오히려 해외 생태계 의존도가 더 높아지는 역설이 발생한다. 학습은 해외에서, 추론은 국내에서 이뤄지는 불균형이 고착되면서 “AI의 뇌는 해외에서 설계되고, 우리는 그 명령만 수행하는 도시가 된다”는 지적도 나온다.
산업계는 이를 기술적 조치가 아닌 정치적 보상에 가깝다고 본다. 정부는 “광주의 실망감을 달래기 위한 대안”이라고 설명했지만, 실제로는 정권의 약속 파기에 대한 책임을 희석시키기 위한 ‘보여주기’ 성격이 짙다는 것이다. 광주시는 여전히 ‘AI 시범도시’를 표방하지만, 학습 능력이 없는 상태에서 그 간판은 “AI가 없는 AI 도시”라는 역설로 남을 가능성이 크다.
해외에서는 이른바 ‘NPU센터’로 불릴 만한 사례를 찾기 어렵다. 미국의 코어위브(CoreWeave)나 영국의 이삼바드AI(Isambard-AI) 등은 모두 GPU 기반의 학습·추론 겸용 인프라로, 대규모 플로팅포인트 연산과 고대역폭 통신망을 전제로 한 구조다. 이들은 AI 모델의 훈련과 확장을 동시에 수행하는 데 초점이 맞춰져 있으며, ‘추론 전용 NPU센터’와 같은 구조는 공개된 전례가 거의 없다.
결국 광주형 NPU센터는 기술적으로도 글로벌 스탠더드와 결이 다른 실험적이자 정치적 성격의 프로젝트로 평가된다. 빅테크 관계자는 "NPU는 잘 만든 모델을 실행하는 데는 강하지만 그 모델을 키우는 역할은 어렵다"며 "GPU가 없는 상태에서 NPU만 갖춘 센터가 이재명 정부의 AI 개발 목표를 충분히 뒷받침할 수 있을지 우려된다"고 말했다.
여성경제신문 이상헌 기자 liberty@seoulmedia.co.kr

