음성 데이터 Download

반응형
728x90
반응형
 
 
Introduction

 음성 데이터는 여러 산업분야에서 활용이 가능하지만, 특히, 사용자와의 상호작용을 통해 특정명령을 수행하기에 좋은 기능입니다. 그리고 사용자와의 대화를 통해 추가 정보를 획득할 수 도 있죠. 
 
이런 음성데이터들도 어떤 데이터셋이 있는지 하나씩 살펴보도록 할까요?
 
 
 
A curated list of Japanese, Korean and Vietnamese open speech corpora Dataset

 
 
먼저 위의 블로그를 통해 접속을 하게 되면, 일본어,한국어,베트남 공개연설과 관련된 자료로서 각각 다운 받을 수 있습니다. 
 
 
KSS datset

 
 
 
위의 페이지를 접속하게되면, 각 연설문에 대한 음성파일이 정리되어나와있습니다. 용량이 4G정도면 크지 않으니, 부담되지는 않을 것으로 생각되네요. 그리고 kaggle 등에 참가해서 다른 사람과 경쟁하는것도 좋은 공부라고 생각됩니다. 
 
 
 
아래의 두 데이터셋은 꼼꼼하게 확인을 하지는 못했지만, 자료 정리가 잘되어있는 것 같아 살펴보시는것도 좋을 것이라 생각됩니다. 
 
 
 
Zeroth Korean

 
  • Description: Audio data of Project Zeroth for Korean Speech Recognition
  • Type: Multiple speakers (Crowdsourcing)
  • Amount: 76.6 hours, 35139 utterances, 137 speakers, 16472 unique sentences
  • Audio quality: crowdsourcing using MoreCoin (Android phone record devices)
  • License: CC BY 4.0
  • Release year: 2018
 
Pansori-TEDxKR

 
  • Description: Korean speech corpus generated from Korean language TEDx talks
  • Type: Multiple speakers (TEDx talks)
  • Amount: ~3 hours, 41 speakers
  • Audio quality: 16kHz, TEDx talks
  • License: CC BY-NC-ND 4.0
  • Release year: 2019
 
 
728x90
반응형

'Develop > DataSet' 카테고리의 다른 글

Faces Detection Dataset  (0) 2020.06.13
CITYSCAPES Dataset Download  (0) 2020.06.13
ImageNet Dataset download  (0) 2020.06.13
Qucik, Draw! The Data Dataset  (0) 2020.06.13
Pedestrian Dataset Download  (0) 2020.06.13
Visual Tracker Benchmark Dataset Download  (0) 2020.06.13

댓글

Designed by JB FACTORY