Amintransaminasen (ATAs) sind leistungsstarke Biokatalysatoren für die stereoselektive Synthese chiraler Amine. Machine learning ist ein vielversprechender Ansatz für das Protein-Engineering, aber Modelle zur Aktivitätsvorhersage für ATAs sind aufgrund der Schwierigkeit, qualitativ hochwertige Trainingsdaten zu erhalten, schwer zu finden. Aus diesem Grund haben wir zunächst Varianten der ATA aus Ruegeria sp. (3FCR) mit verbesserter katalytischer Aktivität (bis zu 2000-fach) sowie umgekehrter Stereoselektivität durch strukturabhängiges rationales Design entwickelt und dabei einen hochwertigen Datensatz gesammelt. Anschließend entwarfen wir einen modifizierten One-Hot-Code, um sterische und elektronische Effekte von Substraten und Aminosäureresten innerhalb von ATAs zu beschreiben. Schließlich erstellten wir einen Gradient Boosting Regression Tree Prädiktor zur Vorhersage der katalytischen Aktivität und Stereoselektivität und wendeten diesen für das datengesteuerte Design optimierter Varianten an, die dann eine verbesserte Aktivität zeigten (bis zum Dreifachen im Vergleich zu den besten zuvor identifizierten Varianten). Wir haben zudem gezeigt, dass das Modell die katalytische Aktivität für ATA-Varianten eines anderen Enzyms vorhersagen kann, indem es mit einem kleinen Satz zusätzlicher Daten neu trainiert wurde.
EinleitungChirale Amine werden häufig als chirale Schlüsselbausteine für die Synthese bioaktiver Pharmazeutika und Agrochemikalien verwendet und haben daher die besondere Aufmerksamkeit von Synthesechemikern auf sich gezogen. [1] In den letzten Jahrzehnten wurden mehrere umweltfreundliche biokatalytische Strategien für den Zugang zu chiralen Aminen mit hoher Selektivität entwickelt, wobei verschiedene Enzyme wie Hydrolasen, Oxidoreduktasen und Transferasen eingesetzt wurden. [2] Amintransaminasen (ATAs), eine Untergruppe der Pyridoxal-5'-phosphat (PLP)-abhängigen Enzyme, die die asymmetrische Aminierung eines Ketons zum entsprechenden Amin katalysieren, weisen in der Regel eine hohe Enantioselektivität und eine breite Substrattoleranz auf und werden daher häufig für die Herstellung optisch reiner Amine eingesetzt. [3] Das bekannteste Beispiel ist die (R)-ATA-katalysierte asymmetrische Synthese des Antidiabetikums (R)-Sitagliptin mit einer optischen Reinheit von > 99.95 %, die von Forschern von Merck & Co, Inc. und Codexis, Inc. entwickelt wurde und den vorherigen Prozess der asymmetrischen chemischen Hydrierung ersetzte. [4] Auf der Grundlage ihrer Enantiopräferenz werden Transaminasen in zwei Typen eingeteilt, (S)-und (R)-