이르면 내년 하반기에 박사급 전문가 능가하는 레벨3단계 나올 수도...3단계, 고용시장에 적지 않은 충격 줄 듯

오픈AI가 'GPT 5-1'을 출시한 지 한달 만에 새 버전을 내놨다는 것은 그만큼 플랫폼 시장 장악의 중요성을 반증하고 있는 것이다.
딥 마인드가 2023년 11월에 일반인공지능(AGI)의 성능과 범용성을 기준으로 지식 추론 코딩 등과 같은 비물리적인 작업에서 인간 수준을 초월하는 단계를 5단계로 구분했다.
제미나이 3와 'GPT 5-2'는 2단계에서 3단계로 진화하는 과정에 있어 구글 오픈AI뿐 아니라 앤스로픽 등 선두업체들간에 앞으로도 갈 길이 멀어 경쟁은 당분간 치열할 수 밖에 없는 상황이다.
AGI의 레벨 3단계는 박사급 인간 전문가를 능가하는 단계다. 4단계는 숙련된 성인의 상위 1%를 초과하는 성능을 보여주며 인간을 압도하는 수준이다.
마지막 5단계는 모든 작업에서 인간을 초월하는 단계를 의미한다.
KB증권 김일혁 연구원은 "과학과 수학 벤치마크에서 제미나이3는 91.9%, GPT5-2는 92.4%를 기록하면서 레벨 3단계의 기준이 되는 95%에 육박했다"며 "조만간 3단계 정복이 멀지 않았다"고 전망했다.
김 연구원은 이어 "오픈AI와 구글의 경쟁 심화로 두 회사 모두 LLM(거대언어모델) 성능 향상에 집중하면서 이르면 내년 하반기에 레벨 3단계에 도달할 수도 있다"고 덧붙였다.

하지만 AI 모델 플랫폼이 3단계에 도달하면 고용시장에 적지 않은 충격을 줄 것이라는 우려도 나오고 있다.
2단계에서는 기업들의 생산성 향상이 가장 눈에 띄는 변화이지만 3단계에 가까워질수록 고용시장에 미치는 충격이 가시화 되고 이로 인해 소비심리도 위축될 수도 있다는 지적이다.
11일(현지시간) 블룸버그통신 등에 따르면 오픈AI는 새 버전이 전문적인 지식 업무 수행에 가장 뛰어난 모델이라고 강조했다.
오픈AI는 새 버전이 추론과 코딩 능력을 강화하고 환각을 줄였으며, AI 성능을 측정하는 다양한 벤치마크에서 최고 수준을 달성했다고 강조했다.
전문 산업 현장 44개 직종의 업무 수행 능력을 평가하는 GDPval 평가에서 GPT-5.2 사고 모드는 70.9%, 프로 모드는 74.1%를 기록해 인간 전문가들과 대등하거나, 더 뛰어난 능력을 갖춘 것으로 평가됐다.
이전 버전인 GPT-5(38.8%)와 견줘 큰 폭의 성장을 보였다.
이성구 전문위원 news@beyondpost.co.kr























