2008 8th IEEE International Conference on Automatic Face &Amp; Gesture Recognition 2008
DOI: 10.1109/afgr.2008.4813362
|View full text |Cite
|
Sign up to set email alerts
|

A nonlinear viseme model for triphone-based speech synthesis

Abstract: This paper presents a new learning-based approach to speech synthesis that achieves mouth movements with rich and expressive articulation for novel audio input. From a database of 3D triphone motions, our algorithm picks the optimal sequences based on a triphone similarity measure, and concatenates them to create new utterances that include coarticulation effects. By using a Locally Linear Embedding (LLE) representation of feature points on 3D scans, we propose a model that defines a measure of similarity amon… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1

Citation Types

0
0
0
1

Year Published

2013
2013
2013
2013

Publication Types

Select...
2

Relationship

0
2

Authors

Journals

citations
Cited by 2 publications
(1 citation statement)
references
References 32 publications
0
0
0
1
Order By: Relevance
“…Θ δεφτερθ κατθγορία περιλαμβάνει ςτατιςτικζσ μεκόδουσ που επιχειροφν τθ μοντελοποίθςθ τθσ ςυςχζτιςθσ του ακουςτικοφ ςιματοσ με παραμζτρουσ που κακορίηουν το οπτικό ερζκιςμα. Οι πιο πρόςωατεσ από αυτζσ χρθςιμοποιοφν τεχνικζσ κρυμμζνων μοντζλων Markov [292], τοπικισ γραμμικισ ενςωμάτωςθσ (Local Linear Embedding) [237] και Isomap [249]. Επίςθσ, μια ιδιαίτερθ περίπτωςθ αποτελοφν οι ερευνθτικζσ μζκοδοι οι οποίεσ αποωαίνονται για τθ ςχζςθ μεταξφ των δφο ερεκιςμάτων με τθ χριςθ αναηιτθςθσ ςε παραδείγματα ωυςικισ ομιλίασ βάςει καταγραωϊν [243,293,294], περιγραωϊν χαρακτθριςτικϊν ςθμείων [256,295] ι μοντελοποίθςθσ τθσ κίνθςθσ μυϊν [296].…”
Section: ειαγψγη κευαλαιοτ __________________________________________________________________unclassified
“…Θ δεφτερθ κατθγορία περιλαμβάνει ςτατιςτικζσ μεκόδουσ που επιχειροφν τθ μοντελοποίθςθ τθσ ςυςχζτιςθσ του ακουςτικοφ ςιματοσ με παραμζτρουσ που κακορίηουν το οπτικό ερζκιςμα. Οι πιο πρόςωατεσ από αυτζσ χρθςιμοποιοφν τεχνικζσ κρυμμζνων μοντζλων Markov [292], τοπικισ γραμμικισ ενςωμάτωςθσ (Local Linear Embedding) [237] και Isomap [249]. Επίςθσ, μια ιδιαίτερθ περίπτωςθ αποτελοφν οι ερευνθτικζσ μζκοδοι οι οποίεσ αποωαίνονται για τθ ςχζςθ μεταξφ των δφο ερεκιςμάτων με τθ χριςθ αναηιτθςθσ ςε παραδείγματα ωυςικισ ομιλίασ βάςει καταγραωϊν [243,293,294], περιγραωϊν χαρακτθριςτικϊν ςθμείων [256,295] ι μοντελοποίθςθσ τθσ κίνθςθσ μυϊν [296].…”
Section: ειαγψγη κευαλαιοτ __________________________________________________________________unclassified