다음 내용이 궁금하다면?
불편하시다면 뒤로 가기를 눌러주세요
자율주행 E2E AI 학습데이터 가이드라인 첫 발간
데이터 수집부터 라벨링까지 전 주기 절차·규격 제시

[박은주 제작] 사진합성·일러스트
(서울=연합뉴스) 권하영 기자 = 정부가 자율주행 인공지능(AI) 개발에 필요한 학습데이터를 확보하기 위한 데이터 레퍼런스 정립에 나섰다.
과학기술정보통신부는 자율주행 AI 개발용 학습데이터를 산·학·연이 공동 구축하고 상호 공유할 수 있도록 '자율주행 E2E 데이터 구축 가이드라인 및 규격 정의서'를 발간했다고 19일 밝혔다.
최근 글로벌 자율주행 업계는 대량의 데이터를 학습한 AI 하나가 인지·판단·제어를 통합 수행하는 엔드투엔드(E2E) 방식으로 빠르게 전환되고 있다.
미국 웨이모와 중국 바이두 등 글로벌 선도 기업들도 실증 거리를 확대하며 학습데이터 구축량을 늘리는 데 주력하는 추세다.
반면 국내는 각 기업·기관이 학습데이터를 개별적으로 구축하고 있어 차종별 센서 위치 차이 등으로 데이터 상호 공유가 어려운 상황이다.
이번 가이드라인은 자율주행 E2E AI 학습에 필수적인 데이터 전 주기를 포괄한다.
먼저 데이터 수집·가공·정합·보정·라벨링 등 학습데이터 구축 절차를 정의하고, 센서 구성과 저장 포맷 등 수집 시스템 요구사항 및 원시데이터 검증 방법을 제시한다.
이어 시나리오 선별 등 데이터 가공 방법, 위치 보정·공간 정합 등 정합·보정 방법, 라벨링 항목과 학습데이터 셋 규격 등 라벨링 방법을 담았으며, 이를 기반으로 구축한 학습데이터 사례도 수록했다.
가이드라인은 범부처 '자율주행 기술개발 혁신사업' 과제를 통해 개발됐으며, 정보통신기획평가원(IITP)과 자율주행기술개발혁신사업단(KADIF), 한국전자통신연구원(ETRI)이 주도했다.
과기정통부는 향후 국토교통부와 협력해 도시 단위 대규모 E2E AI 학습데이터 구축을 지원하는 자율주행 실증도시 등에 실제 활용하면서 가이드라인을 보완해나갈 계획이다.
kwonhy@yna.co.kr
Copyright 연합뉴스 All rights reserved. 무단 전재 및 재배포 금지.
인기상품 확인하고 계속 읽어보세요!
원치 않을 경우 뒤로가기를 눌러주세요.
