Lead
In den letzten Jahren wurden enorme Fortschritte erzielt, um so viele Informationen wie möglich über einen einzelnen Patienten zu sammeln, und zwar sowohl auf molekularer Ebene wie Genaktivität und Mutationen, als auch auf klinischer Ebene, beispielsweise in der Anamnese der Patienten. Ein einzelner Besuch eines Patienten in einem Krankenhaus kann zu zehntausenden von Messungen und strukturierten Informationen führen, einschließlich klinischer Faktoren, diagnostischer Bildgebung, Labortests, genomischer und proteomischer Tests, und Krankenhäuser können jedes Jahr Tausende von Patienten haben. All diese Entwicklungen in der medizinischen Informationstechnologie haben zu einer überwältigenden Datenmenge geführt, die oft über einen langen Zeitraum hinweg gemessen wurde. Das ultimative Ziel ist es, all diese umfangreichen Informationen für eine medizinische Behandlung zu nutzen, die auf die Bedürfnisse eines einzelnen Patienten zugeschnitten ist.

Lay summary

Um die Vision der personalisierten Medizin Wirklichkeit werden zu lassen, müssen noch viele methodische Probleme gelöst werden:   (i) Es ist dringend erforderlich, die derzeit verfügbaren heterogenen Patientendaten zu integrieren, um die Diagnose, Prognose und Prognose der Therapieergebnisse zu verbessern. Anstatt nur anhand eines einzigen Datensatzes zu lernen, wie beispielsweise anhand von Bildern oder der Genetik, ist das Ziel,  die personalisierte Behandlung zu verbessern, indem für jeden Patienten so viele Informationen wie möglich verwendet werden.  (ii) Andererseits ist die Datenanalyse über Zeit, bei der Beobachtungen über mehrere Zeitpunkte erfolgen, ein bewährtes  Studiendesign, das in klinischen Studien aufgrund von Budgetproblemen und mangelnder Analysefähigkeit bisher nicht ausreichend genutzt wurde. Ein Patient besucht in der Regel mehrmals ein Krankenhaus oder wird über einen bestimmten Zeitraum ins Krankenhaus eingeliefert. Dies führt zu zeitabhängigen Daten für jeden einzelnen Patienten. Abhängig von der Erkrankung kann dies zu sehr langen Zeitreihendaten mit unregelmäßigen Zeitintervallen und vielen fehlenden Werten führen. Dies sind schwierige Herausforderungen, die neue maschinelle Lernmethoden für die effiziente Analyse großer Mengen von longitudinalen multimodalen klinischen Daten erfordern, mit dem Ziel, Erkenntnisse zu gewinnen und Vorhersagen über Krankheitsphänotypen, Krankheitsverlauf und Ansprechen auf die Behandlung zu treffen. 

Das Ziel dieses Forschungsprojektes ist es, einen vollständigen Rahmen für die Analyse von hochdimensionalen Zeitreihendaten mit mehreren unterschiedlichen Datentypen bereitzustellen, und die Zugänglichkeit sowohl für Forscher als auch für Ärzte sicherzustellen. Die vorgeschlagenen Entwicklungen reichen von Methoden zur Integration mehrerer, möglicherweise sehr unterschiedlicher Datentypen bis hin zu fortgeschrittenen Methoden des maschinellen Lernens, die zeitvariable Analysen komplexer biomedizinischer multimodaler Zeitreihendaten ermöglichen.