Deep Voice2 음성합성 및 KALDI 음성인식 환경 구축

# Deep Voice2 음성합성 및 KALDI 음성인식 환경 구축 - 최초 작성일: 2021년 8월 6일(금) ## 목차 [TOC]  ## 구축 내용 개요 ### Deep Voice2 음성합성 1. https://github.com/carpedm20/multi-Speaker-tacotron-tensorflow 구동 가능환경 구축 2. python 3.6 과 cuda 8.0, cudnn 6.0, tensorflow 혹은 tensorflow-gpu 1.3.0 환경등, 동작 환 경(설치 및 사용) 구축 3. 변경해야 하는 파라미터에 대한 정리 및 적용 4. 전처리 및 학습, 딥러닝 음성합성 과정에 대한 설명(사용방법) ### KALDI 음성인식 환경 구축 1. https://github.com/kaldi-asr/kaldi.git 구동 가능환경 구축 - http://nblog.syszone.co.kr/archives/9788 블로그 참조 ## 필요사항 - 구글 STT를 사용할 수 있는 api key - 학습/추론에 필요한 GPU - 외부에서 ssh로 접근가능하도록 방화벽이 열려 있어야함. - Deep Voice 2 음성학습을 위한 학습 데이터 제공 필요 ## 사전 테스트 예시 ### Deep Voice2 음성합성 ![](https://i.imgur.com/jqebKfO.png)