Dr. Manfred Immendörfer studierte Physik an der Universität Stuttgart und promovierte dort 1973. Anschließend trat er als Systemplanungsingenieur in das SEL Forschungszentrum ein, wo er hauptsächlich auf den Gebieten Sprachcodierung und Spracherkennung tätig war. Seit 1985 leitet Dr. Immendörfer die Abteilung Digitale Sprachverarbeitung im SEL Forschungszentrum in Stuttgart. Anhand von verschiedenen Anwendungen aus den Bereichen Büro-und Telekommunikation werden Einsatzmöglichkeiten gegenwärtig verfügbarer Sprachverarbeitungssysteme vorgestellt. Dabei werden die Anforderungen aus Benutzersicht der heutigen Technologie der sprecherabhängigen bzw. sprecherunabhängigen Spracherkennung gegenübergestellt und die Grenzen dieser Verfahren aufgezeigt. Als Anwendungsbeispiele werden für den Endgerätebereich ein sprachgesteuerter Rufnummerngeber und ein Autotelefon, für den zentralen Bereich ein sprachgesteuertes Sprachspeichersystem und eine automatische Telefonzentrale in ihrem Hardwareaufbau und in ihren Leistungsmerkmalen ausführlich erläutert.Applications for speech processing equipment are described for various examples in the field of office and telecommunication. The requirements from a user's point of view are opposed to the present technology for speakerdependent and speakerindependent recognition and the limits of these approaches will be discussed. A voicecontrolled repertory dialer and a car telephone are explained as examples for the enduser area, for central applications a voice-controlled voice mailbox system and an automatic telephone operator are described. The hardware concept and the characteristic system features for all applications are discussed in detail.
The patent describes a noise-tolerant method of spectral analysis processing suitable for use in a speech recognizer system. The method, referred to as minimum mean log spectral distance (MMLSD), proceeds by estimating a frame of clean speech for each noisy speech frame. This is done using mixture model hidden Markov models of the clean speech signal and using the assumptions that different noise frequency channels are mutually uncorrelated; and that different speech frequency channels are uncorrelated within each state of the Markov process.mDLR 43.72.Ne TRAINING MODULE FOR ESTIMATING MIXTURE GAUSSIAN DENSITIES FOR SPEECH-UNIT MODELS IN SPEECH RECOGNITION SYSTEMS Yunxin Zhao, assignor to Matsushita Electric Industrial Company
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.