연합뉴스

크라우드웍스, 고난도 LLM 데이터 구축 사례 공개

입력 2025-07-18 08:51:16

다음 내용이 궁금하다면?

불편하시다면 뒤로 가기를 눌러주세요





크라우드웍스 데이터 구축 사례

[크라우드웍스 제공. 재판매 및 DB 금지]


(서울=연합뉴스) 오지은 기자 = 인공지능(AI) 기업 크라우드웍스[355390]가 고난도 대형언어모델(LLM) 학습 데이터 구축 사례를 공개했다고 18일 밝혔다.



사례에는 인포그래픽 테스트 매칭 데이터셋, 텍스트 기반 SQL(구조적 질의 언어) 데이터셋, 전문 의학지식 질의응답 데이터셋 등이 포함됐다.


이는 AI 레디 데이터(AI-Ready Data)에 대한 높은 수준의 전문성과 데이터 설계 역량이 요구되는 프로젝트다.


해당 데이터들은 텍스트 수집이나 가공을 넘어 도메인 전문 지식, 복잡한 논리 구조 분석, 텍스트와 이미지 정보 간 의미적 일치성 확보가 필요하다.


이에 일반 데이터보다 단가가 20∼30% 높고, 숙련된 인력과 고도화된 품질 관리 역량이 필요하다.


인포그래픽 테스트 매칭 데이터셋 프로젝트는 도표나 순서도 등 복잡한 시각 요소가 포함된 문서 이미지에서 구성 요소와 작업 단계를 식별하고 각 요소를 설명하는 의미 단위 텍스트를 생성하는 작업이다.


김우승 크라우드웍스 대표는 "산업별 AI 고도화를 지원하고 기업들이 데이터 경쟁력을 확보할 수 있도록 앞장서겠다"고 말했다.


built@yna.co.kr



인기상품 확인하고 계속 읽어보세요!

5

원치 않을 경우 뒤로가기를 눌러주세요.

연합뉴스 콘텐츠 더보기

해당 콘텐츠 제공사로 이동합니다.

많이 본 최근 기사

관심 많은 기사