GPT5-2. 전문적인 지식 업무 수행에 뛰어난 AI 모델...GPT5-1은 3개월 후 서비스 종료

11일(현지시간) 블룸버그통신 등에 따르면 오픈AI는 전문적인 지식 업무 수행에 가장 뛰어난 모델 GPT-5.2 시리즈를 출시한다고 밝혔다.
GPT-5.2는 이전의 즉답(Instant), 사고(Thinking) 모드에 프로 모드를 더해 모두 세 가지 모드로 구성됐다.
즉답 모드는 일상적인 업무와 학습을 위한 빠른 답변에 최적화했고, 사고 모드는 코딩이나 수학적 해결, 긴 문서 요약 등에 적합하다.
또 프로 모드는 보다 긴 작업시간을 필요로 하는 어려운 질문에 적합한 도구라고 오픈AI는 소개했다.
오픈AI는 새 버전이 추론과 코딩 능력을 강화하고 환각을 줄였으며, AI 성능을 측정하는 다양한 벤치마크에서 최고 수준을 달성했다고 강조했다.
전문 산업 현장 44개 직종의 업무 수행 능력을 평가하는 GDPval 평가에서 GPT-5.2 사고 모드는 70.9%, 프로 모드는 74.1%를 기록해 인간 전문가들과 대등하거나, 더 뛰어난 능력을 갖춘 것으로 평가됐다.
이전 버전인 GPT-5(38.8%)와 견줘 큰 폭의 성장을 보였다.
소프트웨어 엔지니어링 능력을 평가하는 SWE 벤치마크에서는 80%를 기록해, 제미나이 3프로의 76.2%를 능가했다. 코딩 능력이 뛰어난 것으로 알려진 앤트로픽의 클로드 오퍼스4.5(80.9%)와 거의 차이가 없는 수준이다.
'인간의 마지막 시험'으로 불리는 박사급 추론능력 측정 벤치마크 HLE에서도 구글의 최신 AI 모델을 넘어섰다.
별도 도구를 사용하지 않고 모델 자체의 능력만으로 진행한 평가에서는 GPT-5.2 프로는 36.6%로 제미나이3 프로의 37.5%보다 소폭 낮은 평가를 보였지만, 검색 등 도구를 사용해서 진행한 평가에서는 50%로 제미나이3 프로(45.8%)보다 더 높은 점수를 얻었다.
긴 글의 맥락을 파악하는 능력이나 그래프를 비롯한 그림과 사진을 인식하는 능력, 다단계 업무의 해결 능력 등도 향상됐다.

GPT-5.2는 유료 요금제 구독자에 이날부터 순차적으로 제공되며, 개발자들도 API를 통해 이용할 수 있다.
새 버전 출시에 따라 이전 버전인 GPT-5.1은 앞으로 3개월간 제공된 이후 서비스를 종료한다.
샘 올트먼 오픈AI 최고경영자(CEO)는 제미나이3 프로 출시 이후 사내에 중대경보(코드레드)를 발령하고 다른 일을 제쳐두고 챗GPT 성능과 사용성 개선에 집중하라고 주문한 바 있다.
월스트리트저널(WSJ)은 오픈AI가 내년 1월에 또다시 새로운 모델을 선보인 이후 경보를 해제할 예정이라고 보도했다.
이성구 전문위원 news@beyondpost.co.kr























