6th European Conference on Speech Communication and Technology 1999
DOI: 10.21437/eurospeech.1999-613
|View full text |Cite
|
Sign up to set email alerts
|

Automatically deriving categories for translation

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1
1
1

Citation Types

0
12
0
3

Year Published

2001
2001
2020
2020

Publication Types

Select...
4
2
2

Relationship

0
8

Authors

Journals

citations
Cited by 100 publications
(15 citation statements)
references
References 3 publications
0
12
0
3
Order By: Relevance
“…First, the code-books for average log F0 and log energy were created. All log F0 measurements of the training set were extracted using the TEMPO method of Kawahara et al (1999) using 5 ms frame…”
Section: Generation Of Signal-based Labelsmentioning
confidence: 99%
“…First, the code-books for average log F0 and log energy were created. All log F0 measurements of the training set were extracted using the TEMPO method of Kawahara et al (1999) using 5 ms frame…”
Section: Generation Of Signal-based Labelsmentioning
confidence: 99%
“…The second F0 estimation of the proposed method needs accuracy for noise-reduced speech. F0 estimation using instantaneous frequency is used as the second, because the F0 estimation based on stability of instantaneous frequency, for example, TEMPO2 proposed by Kawahara et al [3], can estimate accurate F0s. In this paper, TEMPO2 is used.…”
Section: F0 Estimation Based On Instantaneous Frequencymentioning
confidence: 99%
“…Various F0 Estimation methods have been proposed, but the most of these methods have the drawbacks for estimating accurate F0s of target speech in noisy environments. Kawahara et al proposed an F0 estimation method based on stability of instantaneous frequencies [3]. This method can estimate F0s for clean speech accurately, but it has difficulties in noisy environments, especially those below 10 dB signal-to-noise ratio (SNR).…”
Section: Introductionmentioning
confidence: 99%
“…1. Для известных алгоритмов RAPT, YIN, SWIPE', SHS, AC-P, AC-S, ANAL, CC, CEP, ESRPD, SHR, TEMPO [4][5][6][7][23][24][25][26][27][28][29] и сингулярного оценивания ЧОТ (SEPT -Singular Estimation Pitch Tracking) рассматривался процент грубых ошибок GPE (gross pitch errors) [9]. Величина GPE показывает отношение количества анализируемых фреймов с отклонением полученной оценки ЧОТ более чем на ±20% от реального значения ЧОТ к общему числу вокализированных фреймов:…”
unclassified
“…Если принять, что реализация всех алгоритмов выполнена в соответствии с их оригинальным описанием [4][5][6][7][23][24][25][26][27][28][29], то при использовании идентичных входных данных (речевых фрагментов из выбранных баз) и единого аппаратного обеспечения (ПК на базе Intel i5 3.1GHz) можно считать, что сравнение алгоритмов проводились в идентичных условиях. На первый взгляд, величина GPE показывает степень робастности оценивания ЧОТ, так как, по сути, показывает процент допущенных ошибок каждым алгоритмов в процессе оценивания, но с другой стороны по данной величине можно судить о степени точности оценки ЧОТ.…”
unclassified