International Conference on Computational Intelligence and Multimedia Applications (ICCIMA 2007) 2007
DOI: 10.1109/iccima.2007.149
|View full text |Cite
|
Sign up to set email alerts
|

A Robust Wavelet-Based Text-Independent Speaker Identification

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1
1
1

Citation Types

0
1
0
2

Year Published

2013
2013
2016
2016

Publication Types

Select...
3

Relationship

0
3

Authors

Journals

citations
Cited by 3 publications
(3 citation statements)
references
References 19 publications
0
1
0
2
Order By: Relevance
“…MFDWC, which were initially defined to improve speech recongintion problems (Tavenei et al [187]), have been subsequently applied to other machine hearing realed applications such as speaker verification/identification (see Tufekci and Gurbuz [188], Nghia et al [189]), and audio-based surveillance systems (Rabaoui et al [24]). …”
Section: Wavelet-based Perceptual Featuresmentioning
confidence: 99%
“…MFDWC, which were initially defined to improve speech recongintion problems (Tavenei et al [187]), have been subsequently applied to other machine hearing realed applications such as speaker verification/identification (see Tufekci and Gurbuz [188], Nghia et al [189]), and audio-based surveillance systems (Rabaoui et al [24]). …”
Section: Wavelet-based Perceptual Featuresmentioning
confidence: 99%
“…Tuy nhiên để các ứng dụng xử lý tiếng nói trong máy tính có thể được áp dụng rộng rãi trong thực tế, tính tự nhiên của tiếng nói được xử lý cũng cần được quan tâm [2]. Để đảm bảo tiếng nói sau xử lý (như tiếng nói được tổng hợp) được tự nhiên, một trong những vấn đề quan trọng cần đảm bảo là thông tin về người nói, bao gồm cả các thông tin chung về người nói như giới tính, độ tuổi,…, đến các thông tin chi tiết như thông tin nhận danh chính xác người nói [3][4][5][6][7]. Các hệ thống tổng hợp tiếng nói nhân tạo thường chỉ có thể tổng hợp ra tiếng nói của một số giọng nói đã được thu sẵn và huấn luyện trước cho máy tính.…”
Section: Giới Thiệuunclassified
“…Nếu bỏ qua vấn đề tổng hợp giọng nguồn bằng HMM, bản chất của phương pháp biến đổi giọng người nói HTT là các khung của tiếng nói giọng nguồn được thay thế bằng các khung vật lý giống nhất của giọng đích trong cùng âm vị. Mặc dù việc lựa chọn và thay thế mẫu tiếng nói giọng nguồn bằng mẫu tiếng nói giọng đích đã được đề xuất trước đó [7], hiệu quả biến đổi giọng người nói trong HTT là vượt trội so với các phương pháp thay thế mẫu khác do việc sử dụng các khung tiếng nói rất ngắn thay thế các mẫu tiếng nói dài như âm vị [7] sẽ tối ưu việc tìm được khung/mẫu tiếng nói đích phù hợp nhất.…”
Section: Phƣơng Pháp Biến đổI Giọng Ngƣời Nói Dựa Vào Thay Thế Khungunclassified