다음 내용이 궁금하다면?
불편하시다면 뒤로 가기를 눌러주세요
합성데이터·강화학습·GPU까지 전주기 기술 시연
오픈 셸 기반 통제 기술로 기업용 AI 보안·활용 균형 강조

[촬영 오지은]
(서울=연합뉴스) 오지은 기자 = 엔비디아가 정보통신산업진흥원과 함께 21∼24일 '네모트론 개발자 데이'를 연다.
이번 행사는 엔비디아의 최신 오픈소스 기반 AI 모델인 네모트론의 연구 성과를 공유하기 위해 마련됐다.
이날 서울 마포 프론트원에서 열린 행사에서는 연구진이 직접 합성 데이터 생성 전략, 모델 최적화를 위한 강화학습 노하우 등을 소개하고 그래픽처리장치(GPU)부터 학습 기법까지 아우르는 풀스택 AI 기술을 경험할 수 있게 했다.
먼저 네모트론은 엔비디아의 오픈소스 AI 모델로 데이터셋, 학습 기법, 소프트웨어를 모두 포함하는 개념이다.
네모트론은 30억개의 파라미터를 가진 네모트론-3 나노부터 1천200억개 파라미터가 있는 고성능 모델인 네모트론-3-슈퍼까지 다양한 크기로 제공된다.
브라이언 카탄자로 엔비디아 부사장은 "네모트론은 하이브리드 아키텍처를 채택해 메모리 활용도를 높이고 멀티 토큰 예측 기술로 추론 효율을 높였다"라고 설명했다.
엔비디아는 글로벌 AI 모델의 왜곡된 한국어 데이터셋을 바로잡을 수 있는 '네모트론 페르소나 코리아' 데이터셋을 소개하기도 했다.
김현우 엔비디아 연구원은 "기존 글로벌 대형언어모델(LLM)은 한국인의 90%를 요양보호사라고 소개하거나 77%가 농민이라는 식의 왜곡된 인식을 보여줬다"라고 지적했다.
엔비디아는 이러한 오류를 해결하기 위해 통계청, 대법원, 국민건강보험 등 62개 국가 통계와 공공 데이터를 활용해 42개 노드와 75개 엣지로 구성된 페르소나 확률 그래프 모형을 만들었다.
해당 모형은 100만개의 레코드와 700만개의 페르소나를 포함해 17억개 토큰을 포함하고 있다.
김 연구원은 "해당 데이터셋을 AI 학습에 활용하면 AI 모델이 한국 문화와 맥락을 더 정확하게 이해할 수 있고 논리적 추론 문제 생성에 큰 도움이 된다"라고 설명했다.
해당 데이터셋은 상업적 목적으로도 누구나 사용할 수 있도록 허깅페이스에 공개돼있다.

[촬영 오지은]
앤트로픽의 오픈클로는 AI 모델에 높은 자유도를 부여해 생산성을 높이지만 보안 리스크로 작용할 수 있다는 우려를 낳고 있다.
여기서 엔비디아의 오픈 셸(Shell)은 AI 에이전트의 활동 범위를 특정 정책 내로 제한하는 일종의 보호막 역할을 한다.
예컨대 AI 모델이 수신한 이메일에 대한 요약은 생성할 수 있어도, 해당 이메일에 대한 답장은 마음대로 할 수 없도록 제한을 걸어두는 식이다.
이때 엔비디아 네모클로는 오픈클로를 오픈 셸을 활용해 엔터프라이즈 환경에서 안전하게 사용할 수 있도록 지원하는 플랫폼 역할을 한다.
이진수 인공지능정책기획관은 "이번 개발자 데이는 지난해 10월 정부가 엔비디아와 약속한 글로벌 기술 공유와 인재 양성 협력(MOU)의 일환이다"라며 "우리 AI 개발자가 세계적인 기술 흐름을 습득하고 실질적으로 활용할 수 있는 역량을 내재화하는 중요한 계기가 될 것"이라고 말했다.
built@yna.co.kr
Copyright 연합뉴스 All rights reserved. 무단 전재 및 재배포 금지.
인기상품 확인하고 계속 읽어보세요!
원치 않을 경우 뒤로가기를 눌러주세요.
