구글판 '딥시크 모멘트'…터보퀀트가 바꾼 AI 판

불편하시다면 뒤로 가기를 눌러주세요

'쩐의 전쟁'서 효율 경쟁으로…비용 구조 전환

빅테크 격차 여전…상용화 여부는 변수

(서울=연합뉴스) 권하영 기자 = 더 빠르고, 더 저렴하게 인공지능(AI)을 구현하려는 경쟁이 본격화되고 있다.

최근 구글이 공개한 메모리 압축 기술 '터보퀀트'는 AI 운영 비용 구조를 근본적으로 바꿀 수 있는 전환점으로 평가된다.

◇ "GPU 덜 쓰고 더 빠르게"…터보퀀트가 바꾼 AI 비용 공식

29일 업계에 따르면 구글 리서치는 대규모언어모델(LLM)의 메모리 사용량을 기존 대비 6분의 1 수준으로 줄일 수 있는 '터보퀀트' 기술을 공개했다.

이 기술은 모델이 이전 대화 내용을 기억해 다음 답변에 활용하는 임시 메모리인 'KV 캐시'를 정확도 손실 없이 약 3비트 수준으로 압축해 효율을 극대화한 것이 특징이다.

이를 통해 AI는 동일한 GPU 환경에서 더 많은 사용자 요청을 더 빠르게 처리할 수 있을 뿐 아니라, 훨씬 더 긴 문맥을 소화하는 것도 가능해진다.

실제 구글 리서치에 따르면 엔비디아 그래픽처리장치(GPU) H100 기준 연산 속도는 최대 8배까지 향상될 수 있다.

AI 업계에서는 이를 두고 저비용 고성능 추론 모델로서 시장 판도를 흔들었던 '딥시크 모멘트'에 비견되는, 이른바 '구글판 딥시크 모멘트'라는 해석이 나온다.

특히 막대한 서버 유지 비용이 요구되던 AI 개발 구조가 완화되면서, 기술 경쟁의 축이 '인프라 투자'에서 '최적화 역량'으로 이동할 수 있다는 관측이다.

신동훈 NC AI AX테크센터장은 "앞으로 AI 인프라 생태계는 단순한 장비 스케일업 경쟁뿐만 아니라, 주어진 자원의 잠재력을 한계까지 끌어내는 소프트웨어 기반의 최적화 기술이 핵심 경쟁력 중 하나로 자리잡을 것"이라고 분석했다.

다만 "파운데이션 모델의 체급과 자본력 격차는 여전히 유효하다"며 "오히려 빅테크가 이러한 압축 기술을 활용해 초거대 모델을 더 빠르고 저렴하게 API 형태로 제공할 가능성도 있다"고 지적했다.

◇ "효율이 수요 키운다"…제번스 역설 vs 상용화 신중론

기술 효율성이 높아지고 자원 비용이 하락하면 오히려 전체 사용량이 늘어나는 '제번스의 역설'이 AI 시장에서 현실화될 수 있다는 기대감도 나온다.

국내 AI 기업 관계자는 "1970~80년대 PC 가격이 낮아지면서 오히려 IT 산업 전체 규모가 커졌던 것처럼, 이 기술이 확산되면 AI 스타트업들의 진입 장벽이 크게 낮아질 것"이라고 내다봤다.

그러나 상용화 가능성과 파급력을 두고 신중론도 제기된다.

국내 LLM 스타트업 모티프테크놀로지 임정환 대표는 "터보퀀트는 데이터 압축 기술이기 때문에 고성능 AI 연산 수요와는 별개 문제"라며 "첨단 GPU 수요는 계속 팽창할 수밖에 없어 당장 저비용 구조를 확립하기 어려울 것"이라고 내다봤다.

이어 "기술이 실제 서비스에 적용되기까지 시간이 필요하고, 상용화 가능성 역시 아직은 불확실하다"고 덧붙였다.

또 다른 업계 관계자도 "이 기술은 AI 학습이 아니라 서비스 단계에서의 효율을 높이는 기술"이라며 "현재는 더 큰 모델을 학습하려는 수요가 여전히 강하기 때문에 단기적인 산업 구조 변화로 이어지기는 어렵다"고 말했다.

kwonhy@yna.co.kr

인기상품 확인하고 계속 읽어보세요!

5

원치 않을 경우 뒤로가기를 눌러주세요.