연합뉴스

[AI픽] "안전하다던 AI, 연산 늘리면 위험해질 수도"…오픈AI 경고

입력 2026-07-03 13:31:25

다음 내용이 궁금하다면?

불편하시다면 뒤로 가기를 눌러주세요


AI 안전평가 대부분 저연산 기준…"숨은 능력 놓칠 가능성"


노엄 브라운 "연산량까지 검증하는 새 평가체계 필요"




노엄 브라운 오픈AI 리서치 부문 부사장

노엄 브라운 오픈AI 리서치 부문 부사장이 3일 서울 강남구 웨스틴 서울 파르나스에서 열린 '글로벌 AI 프론티어 심포지엄 2026'에서 기조연설을 발표하고 있다. [권하영 촬영]


(서울=연합뉴스) 권하영 기자 = 노엄 브라운 오픈AI 리서치 부문 부사장이 현재의 인공지능(AI) 안전성 평가 체계에 구조적 허점이 있다고 지적했다.


모델을 평가할 때 얼마나 많은 연산을 투입했는지를 제대로 따지지 않다 보니, 실제로는 훨씬 위험한 능력이 숨어있을 수 있다는 것이다.


브라운 부사장은 3일 서울 강남구 웨스틴 서울 파르나스에서 열린 '글로벌 AI 프론티어 심포지엄 2026' 기조연설에서 '대규모 추론 연산의 시사점'을 주제로 이같이 밝혔다.


◇ "연산 늘릴수록 성능 계속 향상…평가는 대부분 저예산으로만"


브라운 부사장은 최근 모델일수록 답을 내놓기 전 사고 과정에 투입하는 연산량, 이른바 '테스트 타임 컴퓨트'가 늘어날수록 성능이 계속 향상되는 경향을 보인다고 설명했다.


그는 "2025년 나온 GPT-o1 이전 모델은 예산을 아무리 늘려도 성능이 일정 수준에서 정체됐지만, 최근 모델들은 며칠에서 몇 주 단위로 연산을 늘리면 성능이 계속 개선되고 있다"고 짚었다.


문제는 정작 안전성 평가는 이런 흐름을 따라가지 못한다는 점이다. 브라운 부사장은 "안전성 평가는 대부분 저예산으로 이뤄지는데, 어떤 조직이 이보다 훨씬 많은 연산을 투입하면 평가에서 드러난 것보다 훨씬 강력한 능력을 얻을 수 있다"고 말했다.


가령 10달러나 100달러 수준 예산으로 평가해 위험하지 않다고 판단한 뒤 모델을 출시했더라도, 실제로 수십만달러에서 수백만달러를 투입하면 전혀 다른 위험 능력이 나타날 수 있다는 설명이다.


브라운 부사장은 경쟁사인 구글의 '제미나이3 딥싱크' 사례를 들어 이런 문제의식을 뒷받침했다.


그는 "제 추측으로는 제미나이3 딥싱크가 제미나이3나 제미나이3.1에 100배 많은 연산을 투입한 스캐폴드(보조 체계)일 가능성이 큰데, 이는 누구든 같은 연산을 투입하면 동일한 능력을 얻을 수 있었다는 뜻"이라고 지적했다.


그러나 딥싱크 모델은 당시 일종의 안전성 평가 문서에 해당하는 '시스템 카드'가 공개되지 않아 AI 안전 커뮤니티에서 반발을 사기도 했다.


장기간 작동하는 AI 에이전트에 대한 안전성 평가의 어려움도 제기된다. 브라운 부사장은 "모델이 몇 달에 걸쳐 작동할 수 있게 되면, 다음 모델이 나오기 전까지 현재 모델의 능력 상한선을 아무도 제대로 파악하지 못하는 상황에 이르게 된다"며 "이는 이미 우리가 처한 상황일 수 있다"고 말했다.


◇ "연산 늘리면 수학 난제도 반증…미래 능력 미리 엿보는 창"


브라운 부사장은 테스트 타임 컴퓨트가 향후 AI 능력을 가늠하는 지표가 될 수 있다고도 강조했다.


그는 오픈AI 내부 모델이 최근 수학계 난제인 '에르되시 단위 거리 추측'을 반증한 사례를 소개하며 "이후 외부에서는 GPT-5.5에 반복적인 프롬프트 유도만으로도 같은 결과를 재현할 수 있다는 것이 확인됐다"고 말했다.


그는 "오늘 대규모 연산을 투입해야 얻을 수 있는 결과가 내년에는 훨씬 적은 비용으로도 가능해질 수 있다"며 "현재 모델에 많은 연산을 투입해보면 미래 모델의 능력을 미리 가늠할 수 있다"고 설명했다.


정책 제언도 이어졌다.


앞으로 AI 연구소가 새로 출시하는 모델의 벤치마크를 단일 점수가 아니라 비용이나 시간에 따른 성능 곡선 형태로 공개해야 한다는 것이다.


브라운 부사장은 "제3자 평가기관도 모델이 사용한 연산량을 추적해야 하며, 사전 대비 체계와 책임 있는 스케일링 정책 역시 모델이 안전 임계값을 넘는지 판단할 때 테스트 타임 컴퓨트 사용량을 명시적으로 고려해야 한다"고 강조했다.


kwonhy@yna.co.kr



인기상품 확인하고 계속 읽어보세요!

5

원치 않을 경우 뒤로가기를 눌러주세요.

연합뉴스 콘텐츠 더보기

해당 콘텐츠 제공사로 이동합니다.

많이 본 최근 기사

관심 많은 기사