Resumo-Em síntese concatenativa, a fala é produzida a partir da justaposição de segmentos automaticamente selecionados dentre unidades contidas em um banco previamente gravado e segmentado. A fala sintética obtida através dessa técnica apresenta naturalidade influenciada pela eficácia das ferramentas de segmentação. O desempenho de tais ferramentas é freqüentemente favorecido por uma abordagem híbrida resultante da associação de uma modelagem HMM com um processo de refinamento da segmentação. Esse refinamento tem sido realizado com sucesso através do uso de técnicas baseadas em redes neurais. Neste trabalho, é proposto um conjunto de redes cujo desempenho é superior ao das demais topologias de redes neurais apresentadas na literatura. Nesse caso, as redes são treinadas a partir de uma repartição do conjunto de treinamento baseada em fronteiras de fonemas com similaridades entre si.Palavras-chave-Refinamento da segmentação, Síntese concatenativa, Redes neurais artificiais, HMM.
Resumo-A prosódia alvo de sistemas concatenativos de síntese de fala é obtida utilizando algoritmos de modelagem treinados em um procedimento offline. Esses algoritmos são desenvolvidos tomando como referência as características lingüísticas (por exemplo, separação silábica, tonicidade e divisão em sintagmas fonológicos e entoacionais) das sentenças contidas em um banco de fala gravado. Neste trabalho, é apresentado um procedimento para classificação e divisão automáticas de sentenças em sintagmas fonológicos. A classificação é baseada em regras que resultam em um percentual de acerto de 92,86%. Além do mais, ela pode auxiliar no processo de predição de pausas, conduzindo a um adequado estabelecimento de sintagmas entoacionais e, conseqüentemente, a uma melhor naturalidade da fala sintética.Palavras-chave-Classificação em sintagmas, Sintagmas fonológicos e entoacionais, Síntese concatenativa de fala.
Resumo-Visando melhorar a naturalidade da fala sintética, este trabalho propõe um procedimento para selecionar o corpus de gravação de um sistema de síntese de fala concatenativa desenvolvido para o português brasileiro. O objetivo de tal seleção é atribuir uma maior variabilidade fonética e prosódica à fala sintética. Nesse procedimento, quatro etapas são consideradas: conversão grafema-fonema, anotação prosódica, representação em vetores de características e seleção propriamente dita. O procedimento de anotação prosódica de sentenças exclamativas e questões alternativas é uma contribuição original deste trabalho. Palavras-chave-Seleção de um script de gravação, Português brasileiro, Variabilidade fonética e prosódica, Algoritmos genéticos.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.