스킵네비게이션

AI Studio 열린 미래 꿈이있는 대학, 동아대학교

AI Materials

Images

  • CIFAR-10 CIFAR-10 (Canadian Institute for Advanced Research - 10)은 이미지 분류 작업을 위한 자주 사용되는 컴퓨터 비전 dataset 중 하나입니다. 이 데이터셋은 총 60,000개의 이미지로 구성되며, 이 중 50,000개는 트레이닝 세트로, 나머지 10,000개는 테스트 세트로 구분되어 있습니다.
  • ImageNet ImageNet은 컴퓨터 비전 및 딥러닝 연구에서 가장 중요하고 규모가 큰 dataset 중 하나입니다. ImageNet은 수백만 개의 이미지와 수천 개의 범주로 이루어진 대규모 이미지 dataset 으로, 객체 인식 및 이미지 분류 작업을 위해 널리 사용됩니다.
  • MNIST MNIST는 기계 학습 및 딥러닝 분야에서 가장 잘 알려진 dataset 중 하나로, 손으로 쓴 숫자 이미지를 포함하고 있습니다. 이 dataset은 주로 이미지 분류 작업을 연구하고 모델을 훈련하고 평가하기 위해 사용됩니다.
  • COCO COCO (Common Objects in Context)는 객체 감지, 객체 분할 및 이미지 캡션 생성과 같은 컴퓨터 비전 작업을 위한 대규모 이미지 dataset 중 하나입니다. COCO dataset은 자연 환경에서 다양한 객체와 장면을 포함하고 있어 컴퓨터 비전 모델의 성능 평가 및 연구에 널리 사용됩니다.
  • PASCAL VOC PASCAL VOC (Visual Object Classes)은 객체 감지, 객체 분류 및 객체 분할과 같은 컴퓨터 비전 작업을 위한 고전적인 dataset 중 하나입니다. 이 dataset 객체 인식 및 이해 모델의 성능을 평가하고 개발하는 데 널리 사용됩니다.
  • Fashion MNIST Fashion MNIST는 MNIST dataset과 유사하지만, 패션 아이템의 이미지를 포함하고 있는 dataset입니다. 이 dataset은 주로 이미지 분류 및 패션 관련 작업을 위해 사용되며, MNIST dataset과 유사한 구성을 가지고 있습니다.

NLP

  • SNLI SNLI (Stanford Natural Language Inference)는 자연어 처리 (NLP) 분야에서 자연어 문장 쌍의 추론 작업을 위해 사용되는 대표적인 dataset 중 하나입니다. 이 dataset은 문장 간 관계를 이해하고 추론하는 데 활용됩니다.
  • SQuAD SQuAD (Stanford Question Answering Dataset)는 자연어 처리 (NLP) 분야에서 질문과 답변을 위한 dataset으로 널리 알려진 대규모 dataset 중 하나입니다. SQuAD는 특정 문맥에서 주어진 질문에 대한 정확한 답변을 추출하는 모델을 훈련하고 평가하기 위한 목적으로 만들어졌습니다.
  • MultiNLI MultiNLI (Multi-Genre Natural Language Inference)는 자연어 처리 (NLP) 분야에서 자연어 문장 쌍의 추론 작업을 위해 사용되는 dataset중 하나입니다. 이 dataset은 문장 간의 논리적 관계를 이해하고 추론하는 데 활용됩니다.
  • Amazon employee reviews Amazon employee reviews는 Amazon.com에서 고용된 직원들에 의해 작성된 직원 평가 및 리뷰 데이터를 포함하는 dataset 입니다. 이 dataset 은 기업 내에서의 직장 분위기, 업무 조건, 경영 및 문화에 대한 피드백을 분석하고 이해하는 데 사용됩니다.
  • Emotions in text Emotions in text는 자연어 처리 (NLP) 분야에서 감정 분석 작업을 위한 dataset 중 하나로, 텍스트 데이터에 포함된 감정을 분류하고 이해하기 위해 사용됩니다. 이 dataset은 주로 텍스트 데이터에 포함된 감정을 식별하고 분류하는 감정 분석 모델을 훈련하고 평가하는 데 활용됩니다.
  • NLU NLU (Natural Language Understanding) dataset 은 자연어 처리 (NLP) 분야에서 자연어 이해 작업을 수행하기 위해 사용되는 dataset 입니다. 이러한 dataset은 모델이 텍스트 데이터를 이해하고 의미를 추론하는 데 활용됩니다. NLU dataset은 다양한 NLP 작업에 관련된 텍스트 및 관련된 정보를 포함하고 있습니다.
  • IMDB/span> IMDB dataset은 영화 리뷰와 관련된 dataset으로, 자연어 처리 (NLP) 분야에서 텍스트 분류와 감정 분석 작업을 위해 널리 사용되는 대표적인 dataset 중 하나입니다. 이 dataset은 영화 리뷰 텍스트와 해당 리뷰가 긍정적인지 부정적인지를 나타내는 레이블로 구성되어 있습니다.

Audio

  • AUdioSet AudioSet은 Google에서 제공하는 대규모 오디오 dataset으로, 다양한 오디오 이벤트와 환경 소리를 수집하고 레이블링한 dataset입니다. 이 dataset은 주로 오디오 인식 및 분류 작업을 위해 사용되며, 오디오 처리 및 기계 학습 연구에 활용됩니다.
  • LibriSpeech LibriSpeech는 대규모 음성 인식 및 음성 처리 연구를 위한 dataset 중 하나로, 다양한 성별과 연령의 사람들이 읽은 영어 오디오북의 오디오 샘플을 수집하고 레이블링한 dataset입니다. 이 데이터셋은 음성 인식 모델의 훈련 및 평가, 음성 변환 및 음성 처리 작업에 사용됩니다.
  • VoxCeleb1 VoxCeleb1은 대규모 음성 인식 및 화자 인식 연구를 위한 공개 dataset 중 하나로, 다양한 화자의 음성 샘플을 수집하고 레이블링한 dataset 입니다. 이 dataset은 음성 처리 및 화자 인식 모델의 훈련 및 평가에 사용되며, 음성 관련 연구와 응용 분야에서 중요한 역할을 합니다.
  • Audio MNIST Audio MNIST는 음성 처리 및 음성 분류 연구를 위한 dataset 중 하나로, MNIST dataset의 음성 버전으로 생각할 수 있습니다. 이 dataset은 음성으로 발음한 숫자를 포함하고 있으며, 주로 음성 분류 및 음성 인식 모델을 훈련하고 평가하기 위해 사용됩니다.
  • IEMOCAP IEMOCAP (Interactive Emotional Dyadic Motion Capture)은 감정 분석 및 음성 감정 인식 연구를 위한 대규모 멀티모달 dataset 중 하나입니다. 이 dataset 은 실제 대화 중의 발화를 포함하는 음성 및 비디오 데이터를 제공하며, 이 데이터를 사용하여 감정을 인식하고 이해하는 모델을 개발하는 데 사용됩니다.
  • Universal Dependencies Universal Dependencies (UD)은 다국적 및 다언어 자연어 처리 (NLP) 연구를 위한 표준화된 형태소 분석 및 의존 구문 분석 dataset의 집합체입니다. 이 dataset은 전 세계에서 다양한 언어로 작성된 텍스트를 분석하고, 각 언어의 문법 구조를 표현하는 데 사용됩니다.

Video

  • UCF101 UCF101 dataset은 동작 인식 (action recognition) 분야의 연구 및 개발을 위한 대규모 비디오 dataset 중 하나입니다. 이 dataset은 다양한 종류의 동작과 운동을 수행하는 사람들의 비디오 클립을 수집하고 레이블링한 것으로, 주로 동작 인식 모델의 훈련 및 평가에 사용됩니다.
  • HMDB51 HMDB51 (Human Motion Database) dataset은 동작 인식 및 분류 연구를 위한 대표적인 비디오 dataset 중 하나입니다. 이 dataset은 다양한 사람들이 다양한 환경에서 다양한 동작을 수행하는 비디오 클립을 수집하고 레이블링한 것으로, 주로 동작 인식 모델의 훈련 및 평가에 사용됩니다.
  • Kinetics Kinetics dataset은 동작 인식 (action recognition) 분야의 연구와 개발을 위한 대규모 비디오 dataset 중 하나입니다. 이 dataset은 다양한 동작과 운동을 수행하는 사람들의 비디오 클립을 수집하고 레이블링한 것으로, 주로 동작 인식 모델의 훈련 및 평가에 사용됩니다.
  • Human3.6M Human3.6M dataset 은 인간의 동작을 분석하고 모델링하기 위한 비디오 기반의 대규모 dataset 중 하나입니다. 이 dataset은 3D 인간 동작 재구성 및 동작 인식과 같은 연구 분야에서 활발하게 사용되며, 컴퓨터 비전 및 인공 지능 분야에서의 연구와 응용에 큰 영향을 미치고 있습니다.
  • DAVIS DAVIS (Densely Annotated Video Segmentation)은 객체 분할 (object segmentation) 연구를 위한 비디오 dataset 중 하나로, 주로 비디오 내에서 개별 객체 또는 물체의 영역을 정확하게 분할하는 작업에 사용됩니다. DAVIS은 객체 분할 알고리즘의 훈련 및 평가에 사용되며, 컴퓨터 비전 및 비디오 처리 분야에서 활용됩니다.
  • 3DPW 3DPW (3D People in the Wild)는 인간의 3D 자세와 동작 추정 연구를 위한 dataset 중 하나입니다. 이 dataset은 다양한 자연 환경에서 촬영된 영상을 사용하여 3D 인간 자세 및 동작을 추정하는 모델을 훈련하고 평가하는 데 사용됩니다.