인공지능(AI, Artificial Intelligence) 학습용 데이터 구축 ( 수집 / 정제 / 가공 )
Ⅰ. 국가에서 진행하는 인공지능 학습용 데이터 구축 사업 참여 - 총 5개 사업 7개 데이터셋 구축
2022년
1. 2022-1. 다중 객체 3차원 표현 데이터 : 12,000개 3D 데이터, 500명 모델 전신 3D 데이터, 24,000개 동작 72,000장 이미지(동작별 전면,우측면,좌측면)
2. 2022-2. 3D 사람간 상호작용 데이터 : 100명 모델 전신 3D 데이터, 비디오 데이터 67,200 Clip
2021년
3. 2021-1. 대용량 3D 객체 데이터 : 600개 객체 3D 데이터, 3D 가공 이미지 30만장
4. 2021-2. 한국인 전신 형상 및 치수 측정 데이터 : 1,000명 모델 전신 3D 데이터, 한국인 전신 촬영 이미지 100만 장
2020년
5. 2020-1. 사람행동영상 AI 데이터 - 사람 동작 영상 데이터 (3D, Multi-person) : 2D 인체 이미지 200만 장 및 3D 프레임 40만 건, 100명 모델 3D 데이터 5,000건
6. 2020-2.. 사람행동영상 AI 데이터 - 신체 말단 움직임 영상 데이터 - 손동작 : 2~5초 손동작 5만 클립(이미지 50만장) , 3D 데이터 10만 개
7. 2020-3. 사람행동영상 AI 데이터 - 신체 말단 움직임 영상 데이터 - 입모양 : 국문 기초단어 1,000개 이상 입모양 10만 클립(이미지 50만장), 3D 데이터 10만 개
Ⅱ. 국가에서 진행하는 인공지능 학습용 데이터 구축 사업에 참여한 내용 소개
1. 2022-1. 다중 객체 3차원 표현 데이터 : 12,000개 전신 3D 데이터, 500명 모델 전신 A자 3D 데이터, 72,000장 이미지(동작별 전면,우측면,좌측면)
[데이터 형태]
• 인공지능 학습용 수집 원천 데이터 : RGB/RGB-D 이미지(FHD(1920*1080) 이상)
• 인공지능 학습용 가공 라벨링 데이터
- 이미지 내에 존재하는 사람 및 객체의 2D/3D 바운딩 박스 및 키포인트 정보
- 사람의 3D 정보(3D 좌표 및 포인트 클라우드 또는 메쉬)
- 객체의 3D 정보(3D 좌표 및 포인트 클라우드 또는 메쉬)
- 이미지 내의 사람-객체의 상호작용 정보
2. 2022-2. 3D 사람간 상호작용 데이터 : 2명의 사람 간의 상호작용 3D 데이터 - 비디오 데이터 67,200 Clip, 100명 모델 전신 3D 데이터
[데이터 형태]
• 인공지능 학습용 수집 원천 데이터 : RGB 비디오(FHD(1920*1080) 이상)
• 인공지능 학습용 가공 라벨링 데이터:
- 2D 키포인트 정보
- 사람의 3D 정보(3D 좌표 및 포인트 클라우드 또는 메쉬)
- 영상 내의 사람들 간 상호작용 정보
3. 2021-1. 대용량 3D 객체 데이터 : 3D 가공 이미지 30만장, 600개 객체 3D 데이터
[데이터 형태]
• 인공지능 (AI) 학습용 수집 원천 데이터 : 객체 3D 이미지
• 인공지능 (AI) 학습용 가공 라벨링 학습 데이터 :
- 객체 3D 포인트 클라우드, 3D 메쉬, 3D 세그멘테이션, 3D 바운딩 박스 등 가공 정보
4. 2021-2. 한국인 전신 형상 및 치수 측정 데이터 : 한국인 전신 촬영 이미지 100만 장, 1,000명 모델 전신 3D 데이터
[데이터 형태]
• 인공지능 (AI) 학습용 수집 원천 데이터 :
- 한국인 신체 촬영 RGB 이미지
- 신체 치수 측정 데이터
• 한국인 신체 촬영 RGB 이미지에 대한 인공지능 (AI) 학습용 가공 라벨링 데이터
- 신체 치수 측정 데이터
- 촬영 당시 착용한 의상의 정보를 포함한 RGB 이미지(JPG/PNG) 및 연관데이터(CSV/JSON/XML)
• 인공지능 (AI) 학습용 가공 신체 치수 측정 데이터
- 성별, 나이, 키, 몸무게, 체지방률을 포함한 신체 주요 부위(허리둘레, 가슴둘레, 어깨넓이, 팔길이, 다리길이 등) 측정 데이터(CSV/JSON/XML)
5. 2020-1. 사람행동영상 AI 데이터
- 사람 동작 영상 데이터 (3D, Multi-person) : 2D 인체 이미지 200만 장 및 3D 프레임 40만 건, 100명 모델 3D 데이터 5,000건
[데이터 형태]
• 인공지능 (AI) 학습용 수집 원본 데이터 형태 : 이미지, 영상, 3D 데이터
• 인공지능 (AI) 학습용 가공 라벨링 데이터 형태 :
- point cloud, mesh, mask 등 3차원 정보
- 3D로 표현되는 인체 자세(관절위치 등) 정보와 형태(3D 인체 표면 폴리곤)
6. 2020-2.. 사람행동영상 AI 데이터 - 신체 말단 움직임 영상 데이터
● 손 : 2~5초 손동작 5만 클립(이미지 50만장), 3D 데이터 10만 개
[데이터 형태]
• 인공지능 (AI) 학습용 수집 원본 데이터 형태 : 이미지, 영상, 3D 데이터
• 인공지능 (AI) 학습용 가공 라벨링 데이터 형태 : point cloud, mesh, mask 등 3차원 정보
7. 2020-3. 사람행동영상 AI 데이터 - 신체 말단 움직임 영상 데이터
● 입 : 국문 기초단어 1,000개 이상 입모양 10만 클립(이미지 50만장), 3D 데이터 10만개
[데이터 형태]
• 인공지능 (AI) 학습용 수집 원본 데이터 형태 : 이미지, 영상, 3D 데이터
• 인공지능 (AI) 학습용 가공 라벨링 데이터 형태 : point cloud, mesh, mask 등 3차원 정보