글을 입력하면 텍스트를 사람의 음성으로 합성하는 것을 말한다.
주로 Text → Spectrogram 등의 Intermediate Representation → Speech 형태로 합성
Acoustic Model : Text → Spectrogram 부분
Vocoder : Spectrogram → Speech 부분
글을 입력하면 텍스트를 사람의 음성으로 합성하는 것을 말한다.
주로 Text → Spectrogram 등의 Intermediate Representation → Speech 형태로 합성
Acoustic Model : Text → Spectrogram 부분
Vocoder : Spectrogram → Speech 부분