2015
DOI: 10.21307/ijssis-2017-757
|View full text |Cite
|
Sign up to set email alerts
|

Acoustic-Phonetic Feature Based Dialect Identification in Hindi Speech

Abstract: Abstract-Every individual has some unique speaking style and this variation influences their speech characteristics. Speakers' native dialect is one of the major factors influencing their speech characteristics that influence the performance of automatic speech recognition system (ASR). In this paper, we describe a method to identify Hindi dialects and examine the contribution of different acoustic-phonetic features for the purpose. Mel frequency cepstral coefficients (MFCC), Perceptual linear prediction coeff… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
3
1
1

Citation Types

0
10
0
1

Year Published

2016
2016
2023
2023

Publication Types

Select...
5
4

Relationship

0
9

Authors

Journals

citations
Cited by 12 publications
(11 citation statements)
references
References 26 publications
0
10
0
1
Order By: Relevance
“…Mô hình hỗn hợp Gauss đa thể hiện (Gaussian Mixture Model: GMM) đã được sử dụng trong các nghiên cứu về nhận dạng người nói [3], định danh phương ngữ tiếng Anh [4], tiếng Trung [5], tiếng Thái [6], tiếng Hindi [7], tiếng Việt [8], nhận dạng ngôn ngữ [9], [10]. Supervectors cũng được sử dụng trong nghiên cứu nhận dạng phương ngữ và cho kết quả khả quan [11].…”
Section: B Nhận Dạng Phương Ngữ Tiếng Việt Dùng Mô Hình Gmm Với Mfccunclassified
“…Mô hình hỗn hợp Gauss đa thể hiện (Gaussian Mixture Model: GMM) đã được sử dụng trong các nghiên cứu về nhận dạng người nói [3], định danh phương ngữ tiếng Anh [4], tiếng Trung [5], tiếng Thái [6], tiếng Hindi [7], tiếng Việt [8], nhận dạng ngôn ngữ [9], [10]. Supervectors cũng được sử dụng trong nghiên cứu nhận dạng phương ngữ và cho kết quả khả quan [11].…”
Section: B Nhận Dạng Phương Ngữ Tiếng Việt Dùng Mô Hình Gmm Với Mfccunclassified
“…The first two formants are the most important because they decide the speech quality [14]. Formants and their bandwidths have been used for a lot of research on speech processing such as accent identification [15][16][17], speech recognition [18], speaker identification [19], study on genders and ethnical accents [20][21][22], dialect identification [4,[23][24][25].…”
Section: Selection Of the Number Of Coefficients Mfccmentioning
confidence: 99%
“…Examples are Mel-frequency cepstral coefficients (MFCCs; e.g. [3,4,5,10]), signal energy (e.g. [4,10]), Perceptual Linear Prediction coefficients (e.g.…”
Section: Introductionmentioning
confidence: 99%
“…[3,4,5,10]), signal energy (e.g. [4,10]), Perceptual Linear Prediction coefficients (e.g. [4,10,11]), voicing probability (e.g.…”
Section: Introductionmentioning
confidence: 99%