Publikace
Detail publikace
Citace
p. 107-113, Institute of Photonics and Electronics AS CR, Praha, 2009. : The possibilities of time scale modification of speech . Speech Processing,
Abstrakt
The present paper deals with time-scale modifications of speech. The aim is to utilize high quality speech signal stretching method into the project ELJABR, or more specifically, into the part of project including automatic audio track generation. The audio track is produced from subtitles by TTS (text-to-speech) system, and one of the most frequented problems is that synthetic speech often exceeds the time slot in which subtitles are displayed. Therefore, the length of synthetic speech and time-slot of subtitles must be synchronized, mostly by increasing the speed of synthetic speech, while the quality of speech must be kept. This issue can be solved by WSOLA technique.
Abstrakt v češtině
Článek se zabývá modifikacemi časování řeči, s cílem využití metody pro vysoce kvalitní zkracování/natahování řeči v projektu ELJABR, především pak jeho části zabývající se automatickým vytvářením doprovodné zvukové stopy. Do této stopy je z titulků generována řeč systémem TTS (syntéza řeči z textu), a jeden z nejčastějších problémů je, že syntetická řeč přesahuje časový rámec vymezený dobou zobrazení titulku. Proto je nutné synchronizovat délku (časování) řeči s časováním titulků, zpravidla zrychlením řeči, přičemž je ale nutné zachovat původní kvalitu synttické řeči. To může být řešeno technikou WSOLA.
Detail publikace
Název: | The possibilities of time scale modification of speech |
---|---|
Autor: | Méner Martin ; Tihelka Daniel |
Název - česky: | Možnosti modifikací časování řeči |
Jazyk publikace: | anglicky |
Rok vydání: | 2009 |
Typ publikace: | Stať ve sborníku |
Název časopisu / knihy: | Speech Processing |
Strana: | 107 - 113 |
ISBN: | 978-80-86269-18-4 |
Nakladatel: | Institute of Photonics and Electronics AS CR |
Místo vydání: | Praha |
Datum: | 1.10.2009 |
Klíčová slova
WSOLA, text-to-speech, subtitles, ELJABR
Klíčová slova v češtině
WSOLA, syntéza řeči z textu, titulky, ELJABR
BibTeX
@INPROCEEDINGS{MenerMartin_2009_Thepossibilitiesof, author = {M\'{e}ner Martin and Tihelka Daniel}, title = {The possibilities of time scale modification of speech}, year = {2009}, publisher = {Institute of Photonics and Electronics AS CR}, journal = {Speech Processing}, address = {Praha}, pages = {107-113}, ISBN = {978-80-86269-18-4}, url = {http://www.kky.zcu.cz/en/publications/MenerMartin_2009_Thepossibilitiesof}, }