Resumo-Este artigo apresenta uma proposta no domínio do tempo para aprimoramento das estimativas da frequência fundamental (F0) do método HHT-Amp em sinais de voz ruidosos. Os quadros do sinal de voz são classificados em alta/baixa frequência por meio de uma Rede de Aprendizado DCNN (Deep Convolutional Neural Network), e os candidatos são extraídos de acordo com os mais prováveis tipos de erros de estimação. Por fim, uma função custo é definida como critério de seleção do novo valor da F0. Os resultados dos experimentos mostraram uma superioridade da solução proposta DCNN+HHT-Amp nos diferentes cenários quando comparada aos métodos competitivos.