Sold
Available
IBL-26-0331

시각 인식 기반의 자연어 인스트럭션 생성 방법 및 장치

등록일
2026-06-22
로봇관련 기술 로봇암/매니퓰레이터 제어/AI/SW
1.41
CI (SI)
★★★★★★★★★★
0.54
TR (N)
★★★★★★★★★★
2.62
MC
★★★★★★★★★★
로봇의 조작 궤적 제어 인공지능 모델

본 기술은 시각적 그라운딩(Visual Grounding) 기술을기반으로 이미지에서 객체의 범주, 위치, 속성 정보를 추출하고, 이를 자연어 인스트럭션으로 변환하여 로봇의 조작 궤적을 계획하고 제어하는 인공지능 모델 생성 메커니즘에 관한것입니다.

기존 로봇 제어 방식은 작업자가 물체의 좌표와 작업 내용을 수동으로 입력해야 하므로, 물체 위치가 고정되어야 하고 다수의 객체에 대한 명령어 생성 시 작업 효율이 낮은 문제점이 있었습니다.

이에 본 기술은 이미지로부터 객체를 인식 및 특징을 추출하는 시각적 특징 추출 모듈, 상황에 맞는 자연어 인스트럭션을 생성하는 모듈, 시각적 그라운딩모델을 통해 대상과 위치를 추론하는 모델, 및 로봇 팔의 궤적을 계획하는 조작 모듈로 구성된 제1프레임워크(GVCCI)를 사용하여 학습 데이터 세트를 생성하고 이를 기반으로 인공지능 모델을 훈련하는 방법을 제안합니다.

Key Features:
  • 시각인식 기반의 자연어 인스트럭션 생성 방법을 제공
  • 이미지로부터 이미지 내의 적어도 하나 이상의 오브젝트를 인식
  • 오브젝트들의 특징을 추출하는 단계 및 특징을 기초로 기 설정된 기준 및 요건에 따라 오브젝트에 대한 자연어 인스트럭션을 생성
  • 이미지 데이터가 적은 상황에서도 빠른 적응이 가능하고, 학습 데이터가 축적됨에 따라 인스트럭션 생성 능력을 향상

본 기술은 정보통신기획평가원의 새로운 문제를 해결하는 자기주도 인공지능 연구과제 지원을 통해 개발되었습니다.

서울대학교 산학협력재단
장병탁 | 김정현
문서
출원일:
2024-02-21
|
특허등록번호:
10-2903342
산업
소프트웨어
로봇•자동화
기술
로보틱스
컴퓨터공학
국가
Korea
패밀리 특허

PCT출원 WO2025178174

제시 가격
가격협의
뉴스레터를 구독하시면 최신 특허 정보를 가장 빠르게 받아보실 수 있습니다.
← 목록으로 돌아가기