구글, 단순 답변 넘어서 어려운 과제 활용가능한 고급 추론 능력 제공...과학 연구 엔지니어링분야 등에 유효

19일(현지시간) 인베스팅닷컴에 따르면 구글은 '제미나이 3.1 프로' 모델을 공개하면서 단순한 답변이 아니라 어려운 과제에 활용할 수 있는 고급 추론 능력을 제공한다고 강조했다.
실제로 이 모델은 새로운 논리 패턴을 풀어내는 능력을 평가하는 'ARC-AGI-2' 성능지표(벤치마크)에서 전작(31.1%)의 갑절 이상인 77.1%의 점수를 얻었다.
경쟁작인 오픈AI 'GPT-5.2'(52.9%)나 앤트로픽 클로드 '오퍼스4.6'(68.8%)보다도 높은 수치다.
코딩 능력을 측정하는 'SWE-벤치 베리파이드'에서도 최고 수준으로 평가받는 오퍼스4.6(80.8%)에 버금가는 80.6%를 기록했다.
학술 추론 능력을 평가하는 '인류의 마지막 시험'(HLE)에서도 도구 미사용 기준 점수 44.4%를 받아 GPT-5.2(34.5%)와 오퍼스4.6(40%)에 앞섰다.

구글은 이 모델이 복잡한 주제를 시각적으로 형상화해 설명하거나 데이터를 통합해 분석하는 등 실용적인 영역에서 쓰일 수 있다고 설명했다.
제미나이3.1 프로는 이날부터 사용할 수 있으나, 일반 소비자 대상 서비스는 우선 유료 요금제 이용자에게 우선 제공된다.
이성구 전문위원 news@beyondpost.co.kr




















