작은 정보로 물체 구별 ‘퓨샷 모델’ 개발
작은 정보로 물체 구별 ‘퓨샷 모델’ 개발
  • 강나리
  • 승인 2022.06.21 21:30
이 기사를 공유합니다

DGIST 박상현 교수팀
딥러닝 모델 학습 효율 향상 기대
1~5개 데이터로 94% 정확도
DGIST-필립치콘테
(왼쪽부터)DGIST 로봇및기계전자공학과 박상현 교수, 김수필 석박사통합과정생, 필립치콘테 박사과정생. DGIST 제공

대구경북과학기술원(DGIST)은 로봇및기계전자공학과 박상현 교수 연구팀이 여러 이미지로부터 상관관계를 학습하는 트랜스포머를 활용, 소수의 정답지를 가진 데이터로 기존 데이터셋에 존재하지 않는 새로운 물체를 정확히 분류하는 ‘퓨샷(few-shot)’ 분류 모델을 개발했다고 21일 밝혔다. 학습데이터에 없었던 물체를 인식하기 위해 대규모 데이터셋 구축을 필요로 했던 기존 딥러닝 모델 학습의 효율성 향상에 기여할 것으로 기대된다.

일반적으로 높은 성능의 딥러닝 분류 모델을 훈련하기 위해서는 대규모 데이터셋을 구축해야 한다. 각 항목마다 수백에서 수천 장의 영상을 모으고 영상 간의 연결성의 유무를 구분하는 레이블링 작업을 진행해야 하기 때문에 오랜 시간과 많은 비용이 발생한다. 이런 문제를 해결하기 위해 소수의 데이터만으로도 새로운 물체를 분류하는 퓨샷 모델이 활발하게 연구되고 있다. 현재 소수의 레이블링이 있는 서포트 데이터들 간의 상관관계를 분석하는 트랜스포머나 픽셀 단위의 영상비교 기법들이 제안됐으나 성능 향상이 제한적이다.

이에 박상현 교수팀은 소수의 레이블링이 있는 서포트 데이터가 주어졌을 때 분류해야 하는 영상에서 추출된 특징들을 효과적으로 비교할 수 있는 기법을 새롭게 제안했다. 박 교수 연구팀은 데이터 사이 상관관계를 보여주는 ‘어텐션 맵’을 활용해 특정 패턴을 갖는 유사한 데이터를 모아 평균화시킨 특징 벡터를 변환하는 트랜스포머를 활용한 모델을 개발했다.

기존 기법들과 달리 양방향으로 특징을 변환해 효과적으로 특징 벡터를 비교할 수 있는 방법을 고안했다. 이를 통해 영상에서 추출한 특징 벡터들이 서로 비교하기 적합한 새로운 벡터 공간으로 변환돼 분류 성능이 크게 개선됐다.

새롭게 개발한 딥러닝 모델은 퓨샷 분류 문제에 있어 1~5개의 데이터만으로 최대 84~94%의 정확도를 보였으며, 기존에 제안됐던 다른 퓨샷 학습 기법들의 성능을 크게 웃돌았다.

이번 연구 결과는 인공지능 관련 분야 최우수 국제학술지 ‘IEEE Conference on Computer Vision and Pattern Recognition’에 게재됐다.

강나리기자

  • 대구광역시 동구 동부로94(신천 3동 283-8)
  • 대표전화 : 053-424-0004
  • 팩스 : 053-426-6644
  • 제호 : 대구신문
  • 등록번호 : 대구 가 00003호 (일간)
  • 등록일 : 1996-09-06
  • 인터넷신문등록번호: 대구, 아00442
  • 발행·편집인 : 김상섭
  • 청소년보호책임자 : 배수경
  • 대구신문 모든 콘텐츠(영상,기사, 사진)는 저작권법의 보호를 받은바, 무단 전재와 복사, 배포 등을 금합니다.
  • Copyright © 2024 대구신문. All rights reserved. mail to micbae@idaegu.co.kr
ND소프트
많이 본 기사
영상뉴스
SNS에서도 대구신문의
뉴스를 받아보세요
최신기사