{"name":"한국전자통신연구원_한국어 및 영어 음향모델 훈련용 음성 데이터","description":"한국어 및 영어 음성인식 기술을 개발하기 위한 과학기술정보통신부의 R&D인 “언어학습을 위한 자유발화형 음성대화처리 원천기술 개발” 과제에서 산출된 음성 학습데이터로, 음성대화 인터페이스 및 외국어교육을 위한 다양한 음성인식 기술 개발과 관련 데이터입니다. ㅁ 구축방법 및 환경: 한국어- 한국어 자연어 발성 문장, 영어- 한국인이 발성한 영어 문장 ㅁ 적용포맷: 공히 16kHz 샘플링 주파수로 녹음된 16-비트 선형(linear) PCM 파일이며, 부가 정보로서 파일별로 단어 단위의 전사 정보 및 발성자의 성별 정보가 제공됨. 세부내용: 폴더 2개(GSF03031LJH0_영어, GSF03031LJH0_한국어), 각 폴더 내 PCM 파일 10개, SEG 파일 10개, TXT 파일 10개","url":"https://www.data.go.kr/data/15073486/fileData.do","keywords":["정보/통신,정보이론\t,인공지능"],"license":"https://data.go.kr/ugs/selectPortalPolicyView.do","dateCreated":"2020-11-12","dateModified":"2021-05-20","datePublished":"2020-11-12","creator":{"name":"한국전자통신연구원","contactPoint":{"contactType":"지식정보서비스실","telephone":"+82-0428606478","@type":"ContactPoint"},"@type":"Organization"},"distribution":[{"encodingFormat":"PCM","contentUrl":"https://www.data.go.kr/cmm/cmm/fileDownload.do?atchFileId=FILE_000000002333007&fileDetailSn=1&insertDataPrcus=N","@type":"DataDownload"}],"@context":"https://schema.org","@type":"Dataset"}