of the material is concerned, specifically the rights of translation, reprinting, reuse of illustrations, recitation, broadcasting, reproduction on microfilms or in any other physical way, and transmission or information storage and retrieval, electronic adaptation, computer software, or by similar or dissimilar methodology now known or hereafter developed. The use of general descriptive names, registered names, trademarks, service marks, etc. in this publication does not imply, even in the absence of a specific statement, that such names are exempt from the relevant protective laws and regulations and therefore free for general use. The publisher, the authors and the editors are safe to assume that the advice and information in this book are believed to be true and accurate at the date of publication. Neither the publisher nor the authors or the editors give a warranty, express or implied, with respect to the material contained herein or for any errors or omissions that may have been made.Printed on acid-free paper This Springer Spektrum imprint is published by Springer Nature The registered company is Springer Fachmedien Wiesbaden GmbH V Kurzfassung Genomdatenbanken wachsen rasant. Moderne Metagenomikstudien führen zu einer großen Anzahl annähernd vollständiger Genomsequenzen nicht kultivierbarer mikrobieller Spezies. Diese Entwicklungen führen zur Notwendigkeit der Entwicklung automatisierter bioinformatischer Methoden für die Vorhersage mikrobieller Phänotypen, um die biologische und ökologische Interpretation der großen Datenmengen zu ermöglichen. In dieser Arbeit wird untersucht, wie komparative Genomik für diesen Zweck eingesetzt werden kann. Verschiedene bioinformatische Prototypen sowie Techniken des maschinellen Lernens werden verglichen. Im Fokus stehen dabei große Genomdatenbanken und inkomplette Genomsequenzen. Darüberhinaus werden notwendige Verbesserungen an der Software vorgenommen. Ein Programm wurde in der Evaluationsphase ausgewählt. Die Stabilität der Vorhersagen phänotypischer Charakteristika wurde im Lichte schnell wachsender Genomdatenbanken demonstriert. Ein neu entwickeltes Softwarewerkzeug ermöglicht die eingehende Analyse von Phänotypmodellen und assoziierte erwartete sowie unerwartete Proteinfunktionen mit bestimmten Merkmalen. Ein Großteil der Merkmale konnte zuverlässig in lediglich zu 60-70% kompletten Genomen vorhergesagt werden. Hochakkurate Modelle wurden für die Vorhersage zweier ökologisch relevanter metabolischer Merkmale (Methanotrophe und Nitrifikanten) erstellt. Sie fanden bereits bekannte funktionelle Marker und erweiterten das Markerkonzept durch die Assoziation weiterer Gene zu den Phänotypen substantiell. Darüber hinaus wurde ein Phänotypmodell für die Vorhersage intrazellulärer Mikroorganismen etabliert. Damit konnte gezeigt werden, dass auch unabhängig evolvierte Merkmale, die durch Genomreduktion charakterisiert sind, zuverlässig durch komparative Genomik vorhergesagt werden können. Alle Modelle wurden mit den Daten aus drei unterschiedlichen Metagenomen getestet. Si...