Abstract:This paper addresses the problem of single microphone speech enhancement in noisy environments. State-ofthe-art short-time noise reduction techniques are most often expressed as a spectral gain depending on the Signal-to-Noise Ratio (SNR). The well-known decision-directed (DD) approach drastically limits the level of musical noise but the estimated a priori SNR is biased since it depends on the speech spectrum estimation in the previous frame. Therefore the gain function matches the previous frame rather than … Show more
“…The typical algorithms including spectral subtraction [1], minimum mean square error (MMSE) estimation [2][3][4], Wiener filtering [5][6][7][8], and subspace methods [9][10][11][12][13]. Spectral Subtraction and Wiener filtering have been widely used for enhancing speech because of their simplicity and ease of implementation in single channel systems but they suffer from the production of musical noise after enhancement and is one of their major drawbacks.…”
Abstract-In this paper, a new subspace speech enhancement method using low-rank and sparse decomposition is presented. In the proposed method, we firstly structure the corrupted data as a Toeplitz matrix and estimate its effective rank for the underlying human speech signal. Then the low-rank and sparse decomposition is performed with the guidance of speech rank value to remove the noise. Extensive experiments have been carried out in white Gaussian noise condition, and experimental results show the proposed method performs better than conventional speech enhancement methods, in terms of yielding less residual noise and lower speech distortion.
“…The typical algorithms including spectral subtraction [1], minimum mean square error (MMSE) estimation [2][3][4], Wiener filtering [5][6][7][8], and subspace methods [9][10][11][12][13]. Spectral Subtraction and Wiener filtering have been widely used for enhancing speech because of their simplicity and ease of implementation in single channel systems but they suffer from the production of musical noise after enhancement and is one of their major drawbacks.…”
Abstract-In this paper, a new subspace speech enhancement method using low-rank and sparse decomposition is presented. In the proposed method, we firstly structure the corrupted data as a Toeplitz matrix and estimate its effective rank for the underlying human speech signal. Then the low-rank and sparse decomposition is performed with the guidance of speech rank value to remove the noise. Extensive experiments have been carried out in white Gaussian noise condition, and experimental results show the proposed method performs better than conventional speech enhancement methods, in terms of yielding less residual noise and lower speech distortion.
“…В 2004-2006 предложены два но-вых алгоритма шумоподавления: алгоритм двухэтапного шумоподавления Wiener-TSNR (Wiener two-step noise reduction) и алгоритм шумоподавления с регенерацией гармоник Wiener-HRNR (Wiener harmonic regeneration noise reduction) [5,6]. Эти алгоритмы обеспе-чивают очень низкий уровень остаточного шума, что позволяет отнести их к классу алго-ритмов радикального шумоподавления.…”
Section: Introductionunclassified
“…Так, в [5] по-казано, что при использовании алгоритма Wiener-TSNR в системе АРР, в условиях уме-ренной согласованности данных в режимах обучения и тестирования, удалось на 9% пони-зить количество ошибок распознавания типа «замена» и на 22% понизить количество оши-бок распознавания типа «вставка». В [6] приве-дены результаты оценивания качества новых алгоритмов с использованием объективных…”
Аннотация. Сопоставлены шесть алгоритмов шумоподавления с использованием объективных показате-лей качества речевого сигнала, а также с использованием сквозного показателя качества системы автома-тического распознавания речи в виде точности распознавания речи. Показано, что алгоритмы радикально-го шумоподавления уступают традиционным алгоритмам шумоподавления как по качеству восстановлен-ной речи, так и по точности распознавания речи, вследствие значительных искажений речевого сигнала.Ключевые слова: шумовая помеха; алгоритм шумоподавления; объективное оценивание; качество рече-вого сигнала; точность распознавания речи; noise; noise suppression algorithm; objective evaluation; speech signal quality; speech recognition accuracy
ВВЕДЕНИЕОдним из способов обеспечения приемле-мого качества речи в системах связи и устрой-ствах компенсации недостатков слуха, а также повышения робастности систем автоматиче-ского распознавания речи (АРР) при наличии шумовых помех, является использование алго-ритмов шумоподавления [1][2][3][4].К традиционно используемым алгоритмам шумоподавления могут быть отнесены алго-ритмы спектрального вычитания SpecSub (Specral Subtraction), винеровской фильтрации (Wiener), фильтрации с минимизацией средне-квадратичной ошибки оценки кратковремен-ного амплитудного спектра MMSE (minimal mean square error) и фильтрации с минимизаци-ей среднеквадратичной ошибки логарифма оценки кратковременного амплитудного спек-тра logMMSE (logarithmic minimal mean square error) [1][2][3][4]. В 2004-2006 предложены два но-вых алгоритма шумоподавления: алгоритм двухэтапного шумоподавления Wiener-TSNR (Wiener two-step noise reduction) и алгоритм шумоподавления с регенерацией гармоник Wiener-HRNR (Wiener harmonic regeneration noise reduction) [5,6]. Эти алгоритмы обеспе-чивают очень низкий уровень остаточного шума, что позволяет отнести их к классу алго-ритмов радикального шумоподавления.Результаты оценивания качества алгорит-мов Wiener-TSNR и Wiener-HRNR, приведен-ные их авторами, положительны. Так, в [5] по-казано, что при использовании алгоритма Wiener-TSNR в системе АРР, в условиях уме-ренной согласованности данных в режимах обучения и тестирования, удалось на 9% пони-зить количество ошибок распознавания типа «замена» и на 22% понизить количество оши-бок распознавания типа «вставка». В [6] приве-дены результаты оценивания качества новых алгоритмов с использованием объективных
“…There have also been some efforts to reduce this musical noise such as [4] but this improvement has the tendency of producing audibledistortion causing listening discomfort even compared to the unprocessed signal [5]. Reducing noise without generating artifacts was proposed in [6] but this method fails to address unvoiced speech.…”
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.