오픈AI가 차세대 인공지능(AI) 모델인 'GPT-5.6 시리즈'의 제한된 미리보기 서비스를 시작합니다. 이번에 공개된 라인업은 오픈AI의 최상위 플래그십 모델인 '솔(Sol)', 일상적인 업무에 최적화된 균형 잡힌 모델 '테라(Terra)', 그리고 빠른 속도와 뛰어난 가성비를 자랑하는 '루나(Luna)' 등 총 3종입니다.
오픈AI 측은 "테라는 기존 GPT-5.5급의 경쟁력 있는 성능을 제공하면서도 비용은 2배 저렴하며, 루나는 역대 최저 비용으로 강력한 성능을 선사한다"고 설명했습니다.
특히 플래그십 모델인 'GPT-5.6 솔'은 역대 가장 강력한 안전 스택을 탑재하고 출시됩니다. 고위험 활동이나 민감한 사이버 요청, 반복적인 악용에 대한 방어력을 대폭 강화했으며, 수 주 동안 시스템 약점 분석과 압박 테스트를 진행해 실제 공격에 견딜 수 있도록 시스템을 보완했습니다.
오픈AI는 앞으로 몇 주 안에 GPT-5.6 솔, 테라, 루나를 시장에 정식 출시 할 계획입니다. 현재 오픈AI는 미국 정부와의 지속적인 협력 일환으로, 정식 출시에 앞서 모델의 기능과 계획을 정부 측에 미리 공유한 상태입니다.
정부의 요청에 따라 오픈AI는 본격적인 대중 공개 전, 신뢰할 수 있는 소수의 파트너 그룹을 대상으로 제한된 미리보기를 먼저 시작합니다. 미리보기 기간 동안 파트너들과 긴밀히 협력하며 추가 테스트를 이어갈 예정입니다.
다만 오픈AI는 이러한 정부의 사전 통제 프로세스가 장기적인 표준이 되어서는 안 된다는 입장을 분명히 했습니다. 최고의 도구가 필요한 사용자, 개발자, 기업, 사이버 방어자들의 접근을 지연시키기 때문이라는 지적입니다.
오픈AI 관계자는 "그럼에도 이번 단기 조치를 수용한 이유는 미 행정부와 협력해 사이버 행정명령 프레임워크 및 향후 모델 출시를 위한 반복 가능한 프로세스를 개발하는 동시에, 몇 주 내에 모델을 가장 확실하게 보급할 수 있는 경로라고 판단했기 때문"이라고 밝혔습니다.
한층 진화한 에이전트 기능… '추론 노력·울트라 모드' 도입
GPT-5.6 솔은 오픈AI가 개발한 모델 중 가장 강력한 성능을 자랑합니다. 코딩, 생물학, 사이버 보안 분야에서 에이전트 기능이 크게 향상된 것이 특징입니다.
이번 GPT-5.6 버전에는 솔 모델이 더 깊이 있게 추론할 수 있도록 시간 자원을 최대로 부여하는 '최대 추론 노력' 기능이 새롭게 도입됩니다. 또한 여러 개의 서브 에이전트를 복잡한 작업에 동시 투입해 처리 속도를 가속화하는 '울트라 모드'도 함께 선보입니다. 이는 단일 에이전트의 한계를 뛰어넘는 새로운 시도로 평가받고 있습니다.
코딩 분야에서 GPT-5.6 솔은 명령줄 워크플로우를 테스트하는 'Terminal-Bench 2.1' 벤치마크에서 괄목할 만한 성적을 거두며 업계 최고 기록을 갱신했습니다.
■ TerminalBench 2.1 성능 지표 결과
-
GPT-5.6 Sol Ultra: 91.9%
-
GPT-5.6 Sol: 88.8%
-
GPT-5.5: 88.0%
-
Claude Mythos 5: 84.3%
-
GPT-5.6 Luna: 84.3%
-
Claude Fable 5: 83.4%
-
GPT-5.6 Terra: 82.5%
-
Claude Opus 4.8: 78.9%
-
Gemini 3.1 Pro Preview: 70.7%
생물학 및 유전체학 분야에서도 뚜렷한 진전이 확인되었습니다. 장기적인 유전체학 및 계량생물학 분석 능력을 평가하는 'GeneBench v1' 테스트에서 GPT-5.6 솔은 이전 세대인 GPT-5.5보다 훨씬 적은 토큰을 소비하면서도 더 우수한 분석 결과를 도출했습니다. 출력 토큰수, 지연 시간, 비용 등 모든 면에서 효율성이 크게 개선되었습니다.
사이버 보안 영역에서도 강력한 성능을 증명했습니다. 취약점 연구 및 익스플로잇을 포함한 장기 보안 작업에서 '성능 대 효율성'의 한계를 한 단계 끌어올렸다는 평가입니다. 'ExploitBench' 테스트 결과, GPT-5.6 솔은 경쟁 모델인 'Mythos Preview'의 약 3분의 1 수준에 불과한 출력 토큰만 사용하고도 대등한 수준의 경쟁력을 보여주었습니다.
아울러 UC 버클리 연구진과 오픈AI 등 선도 연구소들이 공동 개발한 벤치마크 'ExploitGym'에서도 솔, 테라, 루나 모델 모두 추론 능력이 부여될수록 사이버 보안 역량이 크게 향상되는 양상을 나타냈습니다.
방어자와 공격자 구별하는 '다층적 안전장치' 가동
오픈AI는 각 모델의 체급과 기능에 맞춤화된 역대 가장 강력한 안전장치를 구성했다고 밝혔습니다. AI 모델이 고도화됨에 따라 실제 적대적인 압박에 견딜 수 있도록 설계하는 한편, 코드 리뷰, 취약점 연구, 패치 개발, 디버깅 등 정당한 보안 방어 작업은 방해받지 않도록 균형을 잡는 데 주력했습니다.
궁극적인 목표는 AI를 활용한 금지된 공격 행위를 더 어렵고 불확실하게 만들면서 탐지 가능성을 높이는 것입니다. 오픈AI의 자체 평가에 따르면, 이번 모델과 안전장치 조합은 정당한 방어 작업에는 큰 이점을 제공하는 반면, 악의적인 공격 목적의 사용은 유의미한 수준으로 억제할 수 있을 것으로 기대됩니다.
실제로 GPT-5.6 솔은 완전한 엔드투엔드 공격을 자율적으로 수행하는 능력보다, 사용자가 취약점을 찾아내고 수정하도록 돕는 방어적 역량에서 훨씬 더 뛰어난 성능을 보였습니다. 오픈AI는 이러한 기술 발전이 사이버 방어자들에게 먼저 도달해 시스템 전반의 보안을 강화하는 데 기여하도록 최우선 순위를 두고 있습니다.
다만 GPT-5.6 솔은 자체 대비 프레임워크 기준에 따른 '사이버 위험 임계값'을 넘지 않은 것으로 확인되었습니다. 크로미움 및 파이어폭스를 대상으로 한 평가에서 버그와 익스플로잇의 구성 요소를 식별하는 데는 성공했으나, 테스트 환경에서 스스로 완전한 기능의 풀체인 익스플로잇을 만들어내지는 못했습니다.
그러나 오픈AI 측은 "벤치마크 점수만으로는 모델이 다른 도구와 결합해 악용될 수 있는 모든 변수를 통제할 수 없다"며, "이러한 불확실성과 비약적인 성능 발전을 고려해 더 강력한 다층적 안전장치와 단계적 출시 전략을 결합한 것"이라고 설명했습니다.
다층적 안전장치 스택의 핵심 요소
악의적인 사용자가 우회 기법을 끊임없이 시도하는 만큼, 단 하나의 방어벽으로는 안심할 수 없다는 것이 오픈AI의 판단입니다. 이에 따라 GPT-5.6 시리즈에는 다음과 같은 촘촘한 레이어의 방어 시스템이 가동됩니다.
-
모델 자체의 학습 레이어: 사용자가 악의적인 의도를 숨기거나 탈옥을 시도하더라도, 금지된 사이버 지원 요청을 스스로 거부하도록 사전에 학습되었습니다.
-
실시간 악용 분류기: 실시간으로 사이버 및 생물학 악용 여부를 평가합니다. 생성 도중 위험 요소가 탐지되면 작업이 즉시 일시 중지되며, 더 큰 규모의 추론 모델이 대화 맥락을 정밀 검토합니다. 허용되지 않는 출력물로 판단되면 사용자에게 전달되기 전 차단 조치됩니다.
-
계정 수준 검토 시스템: 의심스러운 행동이 반복될 경우, 서비스 약관에 의거해 해당 계정의 대화 기록과 위험 신호 전체를 검토합니다. 이를 통해 단일 대화만으로는 파악하기 힘든 지속적인 악의적 패턴과, 용어가 유사할 수 있는 정당한 보안 연구 활동을 정확히 구분해 냅니다.
다만 이러한 고강도 보안 필터링으로 인해, 미리보기 기간 중 사용자의 일부 요청이 거부되거나 검토를 위해 실시간 생성이 일시 중지되어 시간이 더 걸릴 수 있습니다. 특히 방어와 공격의 경계가 모호한 이중 용도 영역에서는 정당한 업무가 일시적으로 차단되는 오작동이 발생할 가능성도 상존합니다.
오픈AI는 이번 미리보기를 통해 안전장치가 악용을 제대로 차단하는지뿐만 아니라, 정당한 사용자들이 정상적으로 업무를 수행할 수 있는지 함께 점검할 계획입니다. 수집된 피드백을 바탕으로 불필요한 차단과 지연을 줄이고 맥락 해석력을 고도화해 정식 출시 시점에는 보다 매끄러운 사용자 경험을 제공하겠다는 구상입니다.
아울러 기업 고객을 위해 개인정보를 보호하는 탐지 기법, 고객 맞춤형 안전 제어 기능 등 기업의 보안 요구사항을 충족할 수 있는 장기적인 접근법도 함께 준비 중입니다.
70만 시간 이상의 GPU 투입해 '자동화된 레드팀' 가동
공격자들의 전술 변화에 유연하게 대응하기 위해, 오픈AI는 보안 고도화 작업에 역대 최대 규모의 컴퓨팅 자원을 투입했습니다. 고정된 유형의 공격만 막아내는 방식으로는 한계가 있기 때문입니다.
이를 위해 자체 AI 모델을 역으로 활용해 약점을 찾는 방식을 도입했습니다. 오픈AI는 다양한 프롬프트와 맥락 전체에서 작동할 수 있는 강력한 공격 기법인 '범용 탈옥'을 탐지하기 위해, 700,000시간 이상의 A100 가상 GPU 자원을 자동화된 레드팀 활동에 쏟아부었습니다.
이러한 고난도 공격 패턴을 집중 분석함으로써 인간 테스터들이 미처 발견하지 못하는 다양한 실패 시나리오를 조기에 식별하고, 약점 발견부터 보완까지 걸리는 시간을 획기적으로 단축할 수 있게 되었습니다.
여기에 외부 전문가들로 구성된 인간 레드팀과의 협력도 병행합니다. 인간 전문가들은 자동화 시스템이 미처 예상하지 못한 창의적인 우회 시도를 직접 테스트하며 보완적인 역할을 수행하게 됩니다.
오픈AI는 모든 다단계 공격이나 실제 변수를 완벽히 시뮬레이션할 수는 없는 만큼, 새로 발견되는 탈옥 기법을 신속하게 재현하고 우선순위를 정해 치료하는 '신속 대응 프로세스'를 상시 가동하고 이를 지속 평가 항목에 반영할 방침입니다.
모델 등급별 요금 체계 개편… 7월 중 초고속 '세레브라스' 탑재 모델 출시
GPT-5.6 시리즈는 우선 API 및 코덱스를 통해 선별된 일부 파트너사와 기관을 대상으로 공개되며, 조만간 ChatGPT 사용자를 포함한 전 세계 개발자들에게 확대 제공될 예정입니다.
이번 버전부터 도입된 새로운 명명법에 따라, 앞의 '5.6'이라는 숫자는 모델의 세대를 뜻하며 '솔·테라·루나'는 독자적인 주기로 업그레이드되는 기능 등급을 의미합니다. 사용자와 개발자들은 지능 수준, 처리 속도, 비용에 맞춰 최적의 모델을 직관적으로 선택할 수 있습니다.
토큰 100만 개(1M tokens) 기준의 모델별 세부 가격 책정은 다음과 같습니다.
| 모델 등급 | 입력 요금 (per 1M) | 출력 요금 (per 1M) | 주요 특징 |
| GPT-5.6 Sol | $5.00 | $30.00 | 최고 사양 플래그십, 가장 강력한 추론 및 에이전트 역량 |
| GPT-5.6 Terra | $2.50 | $15.00 | 범용 비즈니스 타깃, GPT-5.5급 성능에 비용 반값 단축 |
| GPT-5.6 Luna | $1.00 | $6.00 | 경량화 및 가성비 특화, 역대 최저가 라인업 |
비용 절감을 위한 기술적 혜택도 추가되었습니다. 명시적 캐시 중단점 지원과 최소 30분의 캐시 수명 보장을 골자로 하는 '예측 가능한 프롬프트 캐싱' 기능이 적용됩니다. 캐시 쓰기 비용은 비캐시 입력 요율의 1.25배로 청구되는 반면, 캐시 읽기의 경우 기존과 동일하게 90% 할인 혜택을 제공받을 수 있습니다.
특히 오픈AI는 오는 7월 AI 칩 스타트업 세레브라스(Cerebras)의 하드웨어를 기반으로 구동되는 'GPT-5.6 솔'을 전격 출시합니다. 초당 최대 750개 토큰을 처리하는 유례없는 속도로 프론티어 AI 성능을 제공할 예정이며, 인프라 용량 확장 추이에 맞춰 초기에는 일부 고객을 대상으로 제한적인 접근권을 제공한 후 점차 확대할 계획입니다.