Error Correction in Pitch Detection Using a Deep Learning Based Classification

Khadem-hosseini, M.; Ghaemmaghami, Shahrokh; Abtahi, Azra; Gazor, Saeed; Marvasti, Farokh

doi:10.1109/taslp.2020.2977472

Cited by 13 publications

(22 citation statements)

References 26 publications

Supporting

Mentioning

Contrasting

Unclassified

Order By: Relevance

“…A relacão entre a energia destes dois componentes, torna o algoritmo robusto na presença de subharmônicos. O SHR foi investigado em [18], e portanto é utilizado no presente trabalho como método comparativo.…”

Section: A Métodos De Estimação De F 0 Convencionaisunclassified

“…Resultados expostos em [11] e [12] indicam que o HHT-Amp apresenta resultados interessantes, tanto para cenários ruidosos quanto em ambientes reverberantesruidosos, superando outros métodos de estimação em termos de acurácia. [18] baseia-se na VGGNet [28], sendo composta por seis camadas convolucionais, três camadas Fully-Connected (FC) e uma camada classificadora na saída (Softmax). Apesar da VGGNet ter sido desenvolvida para tarefas de classificação de imagens, esta arquitetura eleva a acurácia da Rede Neural para amostras unidimensionais, como é o caso dos sinais de voz.…”

Section: A Métodos De Estimação De F 0 Convencionaisunclassified

“…Algoritmos de classificação têm sido investigados, os quais utilizam-se de atributos espectrais (energia e harmônicos) do sinal [14] [15] ou diretamente das sequências de amostras [16] [17]. Em [18] é apresentada uma proposta para aprimoramento da acurácia das estimativas da F 0 pela utilização de uma Rede Neural DCNN. Esta solução adota estimativas iniciais de pitch obtidas pelo método SHR.…”

unclassified

“…A partir destes valores, candidatos a F 0 são extraídos de acordo com a classificação em alta ou baixa frequência do quadro do sinal de voz realizada pela DCNN. Por fim, a frequência fundamental aprimorada é selecionada dentre os candidados considerando critérios de seleção que buscam minimizar os valores de custo associados a essas estimativas [18].…”

unclassified

“…O presente artigo propõe a utilização do método investigado em [18] aplicado no aprimoramento das estimativas da pitch obtidas pelo estimador HHT-Amp descrito em [11]. A acurácia da proposta DCNN+HHT-Amp é avaliada em cenários ruidosos, considerando-se as duas principais medidas de erro definidas na literatura: GE (Gross Error) e MAE (Mean Absolute Error).…”

unclassified

See 4 more Smart Citations

Estimação de Frequência Fundamental de Sinais Acústicos Ruidosos com Aprendizado de Máquina

Queiroz¹,

Coelho²

2021

Anais Do XXXIX Simpósio Brasileiro De Telecomunicações E Processamento De Sinais

View full text Add to dashboard Cite

Resumo-Este artigo apresenta uma proposta no domínio do tempo para aprimoramento das estimativas da frequência fundamental (F0) do método HHT-Amp em sinais de voz ruidosos. Os quadros do sinal de voz são classificados em alta/baixa frequência por meio de uma Rede de Aprendizado DCNN (Deep Convolutional Neural Network), e os candidatos são extraídos de acordo com os mais prováveis tipos de erros de estimação. Por fim, uma função custo é definida como critério de seleção do novo valor da F0. Os resultados dos experimentos mostraram uma superioridade da solução proposta DCNN+HHT-Amp nos diferentes cenários quando comparada aos métodos competitivos.

show abstract

Section: A Métodos De Estimação De F 0 Convencionaisunclassified

unclassified

See 3 more Smart Citations

Estimação de Frequência Fundamental de Sinais Acústicos Ruidosos com Aprendizado de Máquina

Queiroz¹,

Coelho²

2021

Anais Do XXXIX Simpósio Brasileiro De Telecomunicações E Processamento De Sinais

View full text Add to dashboard Cite

show abstract

Air‐Conducted and Bone‐Conducted Speeches Combination for Noise‐Robust Pitch Extraction

Zhang

Sugiura

Yasui

et al. 2022

IEEJ Transactions Elec Engng

View full text Add to dashboard Cite

In this paper, we present a noise-robust pitch extraction method in which air-conducted (AC) speech and bone-conducted (BC) speech are utilized simultaneously as the input signals. Due to noise independency in both the input signals and noise suppression effect in BC speech, peak characteristics created in different functions are significantly enhanced so that accurate pitch extraction is achieved even in highly noisy environments. Experimental results show a superior performance of the proposed method relative to the state-of-the art method in several types of noises.

show abstract

Design and Implementation of English Grammar Error Correction System Based on Deep Learning

Chong¹

2023

Application of Big Data, Blockchain, and Internet of Things for Education Informatization

View full text Add to dashboard Cite

Error Correction in Pitch Detection Using a Deep Learning Based Classification

Cited by 13 publications

References 26 publications

Estimação de Frequência Fundamental de Sinais Acústicos Ruidosos com Aprendizado de Máquina

Estimação de Frequência Fundamental de Sinais Acústicos Ruidosos com Aprendizado de Máquina

Air‐Conducted and Bone‐Conducted Speeches Combination for Noise‐Robust Pitch Extraction

Design and Implementation of English Grammar Error Correction System Based on Deep Learning

Contact Info

Product

Resources

About