인공지능(AI, Artificial Intelligence) 학습용 데이터 구축 ( 수집 / 정제 / 가공 )


Ⅰ. 국가에서 진행하는 인공지능 학습용 데이터 구축 사업 참여 - 총 5개 사업 7개 데이터셋 구축


2022년

   1. 2022-1. 다중 객체 3차원 표현 데이터  :  12,000개 3D 데이터, 500명 모델 전신 3D 데이터, 24,000개 동작 72,000장 이미지(동작별 전면,우측면,좌측면)

   2. 2022-2. 3D 사람간 상호작용 데이터  :  100명 모델 전신 3D 데이터, 비디오 데이터 67,200 Clip


2021년

   3. 2021-1. 대용량 3D 객체 데이터  :  600개 객체 3D 데이터, 3D 가공 이미지 30만장

   4. 2021-2. 한국인 전신 형상 및 치수 측정 데이터  :  1,000명 모델 전신 3D 데이터, 한국인 전신 촬영 이미지 100만 장


2020년

   5. 2020-1. 사람행동영상 AI 데이터 - 사람 동작 영상 데이터 (3D, Multi-person) : 2D 인체 이미지 200만 장 및 3D 프레임 40만 건, 100명 모델 3D 데이터 5,000건 

   6. 2020-2.. 사람행동영상 AI 데이터 - 신체 말단 움직임 영상 데이터 - 손동작 :  2~5초 손동작 5만 클립(이미지 50만장) , 3D 데이터 10만 개

   7. 2020-3. 사람행동영상 AI 데이터 - 신체 말단 움직임 영상 데이터 - 입모양 : 국문 기초단어 1,000개 이상 입모양 10만 클립(이미지 50만장), 3D 데이터 10만 개


Ⅱ. 국가에서 진행하는 인공지능 학습용 데이터 구축 사업에 참여한 내용 소개

1. 2022-1. 다중 객체 3차원 표현 데이터  :  12,000개 전신 3D 데이터, 500명 모델 전신 A자 3D 데이터, 72,000장 이미지(동작별 전면,우측면,좌측면)

      [데이터 형태]

      • 인공지능 학습용 수집 원천 데이터 : RGB/RGB-D 이미지(FHD(1920*1080) 이상)

      • 인공지능 학습용 가공 라벨링 데이터

       - 이미지 내에 존재하는 사람 및 객체의 2D/3D 바운딩 박스 및 키포인트 정보

       - 사람의 3D 정보(3D 좌표 및 포인트 클라우드 또는 메쉬)

       - 객체의 3D 정보(3D 좌표 및 포인트 클라우드 또는 메쉬)

       - 이미지 내의 사람-객체의 상호작용 정보


2. 2022-2. 3D 사람간 상호작용 데이터  :  2명의 사람 간의 상호작용 3D 데이터 - 비디오 데이터 67,200 Clip, 100명 모델 전신 3D 데이터

         [데이터 형태]

         • 인공지능 학습용 수집 원천 데이터 : RGB 비디오(FHD(1920*1080) 이상)

         • 인공지능 학습용 가공 라벨링 데이터:

          - 2D 키포인트 정보

          - 사람의 3D 정보(3D 좌표 및 포인트 클라우드 또는 메쉬)

          - 영상 내의 사람들 간 상호작용 정보


3. 2021-1. 대용량 3D 객체 데이터  :  3D 가공 이미지 30만장, 600개 객체 3D 데이터

      [데이터 형태]

       • 인공지능 (AI)  학습용 수집 원천 데이터 : 객체 3D 이미지

       • 인공지능 (AI)  학습용 가공 라벨링 학습 데이터 : 

        - 객체 3D 포인트 클라우드, 3D 메쉬, 3D 세그멘테이션, 3D 바운딩 박스 등 가공 정보


4. 2021-2. 한국인 전신 형상 및 치수 측정 데이터  :  한국인 전신 촬영 이미지 100만 장, 1,000명 모델 전신 3D 데이터

      [데이터 형태]

      • 인공지능 (AI)  학습용 수집 원천 데이터 : 

         - 한국인 신체 촬영 RGB 이미지

         - 신체 치수 측정 데이터

      • 한국인 신체 촬영 RGB 이미지에 대한 인공지능 (AI)  학습용 가공 라벨링 데이터

         - 신체 치수 측정 데이터 

         - 촬영 당시 착용한 의상의 정보를 포함한 RGB 이미지(JPG/PNG) 및 연관데이터(CSV/JSON/XML)

      • 인공지능 (AI)  학습용 가공 신체 치수 측정 데이터

        - 성별, 나이, 키, 몸무게, 체지방률을 포함한 신체 주요 부위(허리둘레, 가슴둘레, 어깨넓이, 팔길이, 다리길이 등) 측정 데이터(CSV/JSON/XML)


5. 2020-1. 사람행동영상 AI 데이터 

                   - 사람 동작 영상 데이터 (3D, Multi-person) : 2D 인체 이미지 200만 장 및 3D 프레임 40만 건, 100명 모델 3D 데이터 5,000건

      [데이터 형태]

      • 인공지능 (AI)  학습용 수집 원본 데이터 형태 : 이미지, 영상, 3D 데이터

      • 인공지능 (AI)  학습용 가공 라벨링 데이터 형태 : 

       - point cloud, mesh, mask 등 3차원 정보

       - 3D로 표현되는 인체 자세(관절위치 등) 정보와 형태(3D 인체 표면 폴리곤)


6. 2020-2.. 사람행동영상 AI 데이터 - 신체 말단 움직임 영상 데이터

                    ● 손 : 2~5초 손동작 5만 클립(이미지 50만장), 3D 데이터 10만 개

      [데이터 형태]

      • 인공지능 (AI)  학습용 수집 원본 데이터 형태 : 이미지, 영상, 3D 데이터

      • 인공지능 (AI)  학습용 가공 라벨링 데이터 형태 : point cloud, mesh, mask 등 3차원 정보 


7. 2020-3. 사람행동영상 AI 데이터 - 신체 말단 움직임 영상 데이터

                   ● 입 : 국문 기초단어 1,000개 이상 입모양 10만 클립(이미지 50만장), 3D 데이터 10만개

      [데이터 형태]

      • 인공지능 (AI)  학습용 수집 원본 데이터 형태 : 이미지, 영상, 3D 데이터

      • 인공지능 (AI)  학습용 가공 라벨링 데이터 형태 : point cloud, mesh, mask 등 3차원 정보