아무런 의미 없는 회피성 문장 덩어리
말의 기원까지 추적 가능해진 AI 시대
기계적으로 복제된 'RLHF 표현' 남발
Ctrl+F 활용해 최소한의 흔적 지워야

“단순한 ○○이 아니다.” “단지 ○○만은 아닌 ○○다.” 최근 인공지능(AI)을 비판하거나 빅테크 산업의 구조를 설명하는 글에서 반복적으로 등장하는 문장 형태다. 한두 번 정도로 그치지 않고 본문의 여러 부분에 걸쳐 사용되는 경우가 많다.
누가 봐도 이 표현은 어디선가 본 듯한 익숙한 틀을 따른다. GPT를 포함한 대형 언어모델(LLM)이 만들어내는 대표적인 문장 패턴이어서다. 안전하고 균형 잡힌 것처럼 보이는 서술 방식이다.
문제는 이런 서술을 아무런 판단 없이 그대로 따라 쓰는 기사나 논평이 많아졌다는 점이다. “단순한 기술 문제가 아니다.” “단지 경제적 경쟁만은 아니다.” 그리고 결론은 정해진다. “따라서 사회적 합의 등등이 필요하다.” 테크 전문 매체에서 유난히 반복되는 논리다.
대부분의 문장 구성은 일정하다. 부정으로 시작해 필요 조건으로 끝난다. 하지만 구체적 근거나 행위 주체는 빠져 있다. 이런 출력이 반복되는 데에는 이유가 있다. GPT는 사용자 입력을 ‘의미’가 아닌 ‘확률’로 예측하기 때문이다.
가장 대비되는 예가 지금 방금 쓴 표현이다. 위의 문장에서 ‘아닌’은 의미(A)가 아니고 확률(B)이다라는 방식의 이분법이다. 구체적 대상을 부정하고 다른 대안을 단정하는 표현으로 행위 주체와 판단 기준이 명확하다. 반면 AI가 기계적으로 만들어내는 “단순한 A가 아니다”라는 문장은 가능성만 열어둔다. GPT가 말하는 ‘아닌’은 대부분 회피성 알고리즘의 결과물이기 때문이다.
기자가 어떤 글을 써달라고 하더라도 LLM 모델은 먼저 안전지대부터 찾는다. 그렇게 이어지는 문장은 중립적인 전환 구문이며 결론은 ‘따라서 ○○가 필요하다’로 자연스럽게 닫힌다. 이는 수많은 훈련 데이터에서 학습된 평균적 대응 결과다.
여기에 인간의 환각(hallucination)이 덧붙는다. 예를 들어 “중국의 딥시크 충격” 같은 문구는 인공지능이 만들어낸 것이 아니라 인간이 출력에 부여한 감정적 해석이다. 여기에 AI의 평균적 학습 결과물을 이어붙이는 것이 오늘날 AI가 개입된 기사의 실체다.
알고리즘 작동 방식으로 표현하면 “단지 ○○이 아니고 ○○다”라는 문장은 if (A == false) { do B }와 유사하다. 하나의 사실(A)이 충분하지 않다고 판단되면 다른 조치(B)를 취해야 한다는 식이다. 얼핏 논리적으로 보이지만 실상 이런 문장 생성 연산은 진위 판단을 위한 검증 절차가 아니다.
예를 들어 “단순한 기술 문제가 아니다. 따라서 사회적 감시가 필요하다”는 문장을 보자. 표면적으로 기술 문제가 충분하지 않다는 조건을 제시한 후 사회적 감시라는 결론으로 넘어간다. 하지만 실제로는 if (기술문제 = 충분하지 않음) then (감시 필요)라는 조건문만 남고 주장의 근거는 비어 있다.
GPT는 A를 명확히 부정하지 않는다. 대신 A가 전부는 아니라고 말하면서 책임 있는 결론을 피해간다. 주어는 흐릿하고 논리는 생략된다. 그 대신 A는 아니니까 B라고 말하는 형태만 반복된다. 그럼에도 자연스러운 사람의 말처럼 보인다. 하지만 사실이나 논리는 어디에도 담겨 있지 않은 짜깁기된 문장덩어리일 뿐이다.
이 같은 시스템 출력 구조에 인간 기자의 환각이 결합하면, 오픈AI의 6년 만의 오픈소스(gpt-oss-120b와 gpt-oss-20b) 공개를 ‘AI 민주화의 신호탄’이라 예찬하면서도 동시에 GPT 생태계 확장을 ‘독점 구조’라 비판하는 문장이 나온다. 이것이 바로 요즘 언론을 점령한 보상기반 강화학습(RLHF)의 인간 버전이다.
문장은 멀쩡해 보이지만, 의미를 따져보면 속은 텅 비어 있다. 그럴 수밖에 없다. 인공지능 모델은 그저 입력에 따라 확률상 가장 그럴듯한 말을 예측해 이어붙일 뿐이다. 의도도 주장도 없다. 결국 왜곡은 바로 그 위에 인간이 의미를 덧씌우기 시작할 때 생긴다.
즉 환각에서 비롯된 착시가 소비되는 과정에서 남는 흔적이 “단순한 ○○이 아니다”, “단지 ○○만은 아니다” 같은 문장이다. 이제는 ‘단지’라는 두 글자만 봐도 그 출처와 형식이 훤히 보일 지경이다. 인공지능 시대의 언론은 말의 출처와 표현의 궤적까지 추적해야 하는 새로운 과제를 안게 됐다. 기자라면 적어도 이런 식의 문장은 Ctrl+F로 지워야 한다. 의미 없이 복제된 말은 챗봇보다 퇴화된 인간의 지능을 낳을 뿐이다.
여성경제신문 이상헌 기자 liberty@seoulmedia.co.kr
관련기사
- '글로벌 성장' 쿠팡, 역대 최대 분기 매출···AI도 눈독 들인다
- "상장 의혹 딛고 정면승부"···파두, FMS서 '차세대 SSD 청사진' 공개
- "딥시크 쇼크 이어 또 한방"···中, 원숭이 뇌 '우쿵'으로 AGI 겨냥?
- 네이버·LG는 데이터 공유할까?···K-AI 첫 발부터 '정치 리스크'
- 中 큐원3 코더, 오픈소스라더니 공개 첫날 알리바바 정렬 이탈
- AI로 치매 진단한다더니···"인종·연령 데이터 누락됐다"
- 메타버스 유령 DC 청산?···저커버그 초지능 위해 안경도 벗나?
- 삼성·애플 팔리면 IT 주가도 뜰까···테슬라 AI도 변수
- SKT 에이닷 사용자 숨은 의도 이해하는 AI로 진화···4.0 버전 업데이트
- "덤핑도 맞고 전략도 맞다"···中 전기차, 유럽 시장 덮친 이유
- GPT-5 항모 전단 2.8조 규모로 확장 "파라미터 수가 깡패다"
- [동기화 98.9%] ⑨ 사탕 끊기자 분노하는 아이들···GPT-5 감정 줄였더니 전세계 덜컥

