Project

Back to overview

De novo molecular design by deep learning

English title De novo molecular design by deep learning
Applicant Schneider Gisbert
Number 182176
Funding scheme Project funding (Div. I-III)
Research institution Institut für Pharmazeutische Wissenschaften ETH Zürich
Institution of higher education ETH Zurich - ETHZ
Main discipline Other disciplines of Engineering Sciences
Start/End 01.01.2019 - 31.12.2022
Approved amount 1'022'142.00
Show all

All Disciplines (2)

Discipline
Other disciplines of Engineering Sciences
Pharmacology, Pharmacy

Keywords (4)

Bioinformatics; Computer-assisted drug design; Medicinal chemistry; Artificial intelligence

Lay Summary (German)

Lead
Wirkstoffdesign mithilfe künstlicher Intelligenz
Lay summary

Medizinische Chemiker entwerfen, synthetisieren und analysieren neuartige Wirkstoffmoleküle mit Blick auf ihre gewünschten Eigenschaften und unerwünschten Wirkungen. Dabei sind zahlreiche Aspekte gleichzeitig zu berücksichtigen, zum Beispiel die mögliche Toxizität der neuen Substanzen und ihre synthetische Zugänglichkeit. Konsequenterweise sind die "Drug Designer" mit eine komplexen Aufgabe konfrontiert, die vielfache Entscheidungen und unterschiedliche, zum Teil widersprüchliche Eigenschaften der neuen Molekülstruturen beinhalten. Betrachtet man nun noch die unglaubliche Grösse des sogenannten chemischen Raums, also die theoretische Anzahl an potenziellen Wirkstoffmolekülen, die etwa 1030–1060 chemische Substanzen umfasst (man bedenke dabei, dass 'nur' ca. 1018 Sekunden seit dem Urknall des Universums vergangen sind), so steht ein medizinischer Chemiker vor einer wahrhaft schwierigen Aufgabe. Die entscheidende Frage lautet "Was soll ich als nächstes synthetisieren?"

In dieser scheinbar unentscheidbaren chaotischen Situation werden zwangsläufig viele brauchbare neue Wirkstoffe übersehen. Ganz offenbar trifft die Leistungsfähigkeit des menschlichen Verstands hier an seine Grenzen, um aus den vielen Trillionen möglicher Molekülentwürfe treffsicher brauchbare Kandidaten unter Berücksichtigung mehrerer Parameter herauszusuchen. Die Wirkstofffindung ist ein extrem komplexer Prozess, und in einer solchen Situation könnte die künstliche Intelligenz die natürliche Intelligenz des Chemikers / der Chemikerin unterstützen.

Ebendiese Hypothese bildet den Kern des vom SNF geförderten Forschungsprojekts an der ETH Zürich. Im Rahmen der Studie werden Maschinenlernverfahren entwickelt, die auf ihre Brauchbarkeit für den Entwurf neuer Wirkstoffmoleküle getestet werden. Die Computermodelle werden mit unterschiedlich komplexen praktischen Fragestellungen auf die Probe gestellt. Kann "kunstliche Intelligenz" hier tatsächlich weiterhelfen und die medizinische Chemie somit potenziell zu besseren neuen Wirkstoffen führen? Das Projekt ist wichtigerweise nicht rein theoretisch ausgelegt, sondern hat einen unmittelbaren praktischen Bezug zur Wirkstoffforschung. Die vom Computer entworfenen ("designten") Molekülstrukturen werden im Labor synthetisiert und anschliessend auf ihre biologische Aktivität hin getestet. Auf diese Weise können mehrere Entwurf-Synthese-Test Zyklen durchlaufen werden. Die Ergebnisse dieses auf die Dauer von vier Jahren ausgelegten Forschungsprojekts werden zu unserem besseren Verständnis dieser Methoden der künstlichen Intelligenz beitragen und eine Abschätzung von deren tatsächlichen Leistungsfähigkeit für die Wirkstoffforschung der Zukunft ermöglichen.

Direct link to Lay Summary Last update: 30.09.2018

Responsible applicant and co-applicants

Employees

Abstract

Artificial intelligence methods, and in particular deep learning models, bear potential to support medicinal chemistry and help to improve decision-making in the early phases of drug discovery. This research project aims at critically analyzing the possibilities and limitations of generative deep recurrent networks for de novo hit and lead finding in drug design. The working hypothesis of the proposed study suggests that deep neural network models coupled with multi-objective optimization and active machine learning can be leveraged for the de novo design of bioactive molecules with bespoke properties, such as target panel engagement or selective target modulation. The proposed research project aims to develop a novel concept for rationally addressing the automated generation of focused compound libraries and ligands with desired properties, taking the example of nuclear receptor modulation for proof-of-concept. The main technologies employed are uni- and bidirectional deep recursive neural networks for structure-activity modeling, on-chip microfluidics-based synthesis of focused computer-designed compound libraries, and reporter-gene biological assays. Specifically, the concept of 'active learning' of structure-activity relationships by adaptive deep learning will be implemented. Active learning strategies will be developed for efficient cycling through the design-synthesis-test progressions, pursuing a multi-objective autonomous molecular design strategy. The results of this broad study will not only provide new insights at the forefront of chemoinformatics, but also be of great value for practical medicinal chemistry. Prognoses of the sustainability of the customary pharmaceutical discovery and development practices imply the necessity for adjusted strategies for the future. It has been realized that it will be necessary for the medicinal chemistry community to evaluate the feasibility of fully autonomous molecular design ‘in machina’, and at the same time analyze which aspects of compound generation are best left to a chemically-savvy artificial intelligence or a skilled human mind. The results of this research project will help to identify those approaches and methods that could be implemented robustly by medicinal chemists in the near future, and critically analyze the opportunities and challenges for their more widespread application.
-