다음 내용이 궁금하다면?
불편하시다면 뒤로 가기를 눌러주세요
UNIST, AI 간 협력 일부러 깨뜨리며 훈련…"안정성·신뢰성↑"

UNIST 한승열 교수(왼쪽)와 이선우 연구원. [울산과학기술원 제공. 재판매 및 DB 금지]
(울산=연합뉴스) 김용태 기자 = 군집 비행을 하는 드론들이나 공장에서 일하는 인공지능(AI) 로봇들은 서로의 움직임을 고려하며 협력하는 것이 중요한데, 이 중 한 기가 멈추거나 사라지는 상황에서도 임무를 이어갈 수 있게 하는 새로운 학습 기술이 나왔다.
울산과학기술원(UNIST) 인공지능대학원 한승열 교수팀은 AI 에이전트 간 협력 고리를 일부러 끊으면서 훈련하는 다중 에이전트 강화 학습 기술인 '상호작용 차단 적대 학습'(IBAL·Interaction-Breaking Adversarial Learning)을 개발했다고 24일 밝혔다.
IBAL은 일부 AI가 멈추거나 서로의 위치와 상태를 제대로 파악하지 못해도 남은 AI들이 새로운 협력 방식을 찾아 임무를 이어가게 하는 학습법이다.
축구로 비유하면 한 선수가 빠졌을 때 기존 전술만 고집하는 대신, 남은 선수들이 공간을 메우고 공격과 수비 역할을 다시 나누도록 훈련하는 것이다.
IBAL은 이러한 대응 능력을 키우기 위해 학습 과정에서 협력 네트워크가 깨지는 상황을 반복적으로 만든다.
먼저 AI를 두 그룹으로 나누고 어떤 정보와 행동이 그룹 간 협력에 중요한지를 상호 정보량으로 분석해 찾아낸다.
이어 중요한 정보를 가리고 협력을 깨뜨리는 행동을 유도한다. 또 학습 단계마다 그룹 구성을 무작위로 바꾸고 공격 강도를 학습 상황에 맞춰 자동으로 조절함으로써 다양한 형태의 협력 붕괴 상황을 폭넓게 경험하도록 설계됐다.
제1저자인 이선우 연구원은 "기존 다중 에이전트 강화 학습에서는 주로 센서 정보에 의도적으로 잡음을 넣거나 AI가 임무 수행에 불리한 행동을 하도록 만들어 훈련했지만 IBAL은 개별 AI 판단을 방해하는 데 그치지 않고 AI들 협력 관계 자체를 흔든다"며 "이를 통해 일부 AI가 고장 나거나 통신이 끊겨도 남은 AI들이 새로운 협력 방식을 찾아 임무를 이어가도록 훈련할 수 있다"고 설명했다.
연구팀은 유명 전략 게임인 '스타크래프트2' 기반 실험 환경에서 아군 유닛 일부가 갑자기 작동을 멈추는 돌발 상황을 가정해 성능을 검증했다.
실험 결과 기존 AI 모델들은 팀원 결손 시 전체 협력 체계가 도미노처럼 무너지며 일부 모델 승률이 13.3%까지 급락했다. 반면 IBAL로 학습한 경우 체력이 떨어진 유닛을 후방으로 빼고 건강한 유닛을 전면에 내세우는 등 즉각적으로 진형을 재구축해 87.0%라는 높은 승률을 기록했다.
한승열 교수는 "자율 드론과 군집 로봇, 스마트 팩토리처럼 여러 AI가 함께 움직이는 시스템은 일부 장비가 고장 나거나 통신이 끊기면 문제가 된다"며 "이번 기술은 이런 돌발 상황에서도 남은 AI들이 스스로 역할을 다시 나누고 임무를 이어가도록 훈련할 수 있어 다수의 AI가 함께 작동하는 시스템 안정성과 신뢰성을 높이는 기반 기술이 될 것"이라고 말했다.
연구 결과는 세계 3대 인공지능 학회인 '국제머신러닝학회'(ICML·International Conference on Machine Learning)에 채택됐다. 올해 ICML은 7월 6일부터 11일까지 서울 코엑스에서 열린다.
연구는 과학기술정보통신부와 정보통신기획평가원의 '자율 드론 실용화를 위한 목적 지향 강화 학습 핵심 기술 개발', '지역 지능화 혁신 인재 양성', '인공지능대학원 지원' 사업과 한국연구재단의 'End-to-end 대규모 자율 군집 제어를 위한 LLM 기반 다중 에이전트 강화 학습 기술 개발' 과제 지원을 받았다.
yongtae@yna.co.kr
Copyright 연합뉴스 All rights reserved. 무단 전재 및 재배포 금지.
인기상품 확인하고 계속 읽어보세요!
원치 않을 경우 뒤로가기를 눌러주세요.
