Sie sind hier: Skip Navigation LinksMedizininformatikzentrum Medical Data Science (MDS) Promotion & Abschlussarbeiten

Promotion & Abschlussarbeiten

​​​​​​​​Sie haben Interesse, bei uns eine Promotions- oder Abschlussarbeit anzufertigen?​

​​1) Promotionsarbeit​

​​Sprechen S​ie uns bitte an. E​ine Nachricht an Prof. Toralf Kirsten reicht aus und wird zeitnah beantwortet.​​

Was erwartet Sie?​

Wir analysieren Versorgungsdaten zu spezifischen klinischen Fragestellungen. Die Analyse wird in Kooperation mit den Fachabteilungen und Kliniken des Universitätsklinikums Leipzig durchgeführt. Sie können sich mit eigenen Fragestellungen und Kontakten hierzu gerne einbringen. Die von uns untersuchten Fragestellungen können sich auf strukturierte Daten beziehen, wie sie in der klinischen Dokumentation entstehen oder mit Messgeräten (z.B. im Labor) erzeugt werden. Darüber hinaus beziehen wir Bilddaten (CT, MRT, etc.) sowie Textdokumente, z.B. Befundberichte, ein. Die Daten liegen elektronisch vor (kein Abtippen!) und werden unter Nutzung verschied​​​ener Methoden aufbereitet und weiterverarbeitet. Sollten weitergehende Daten benötigt werden, die im Sinne einer Beobachtungsstudie zusätzlich erfasst werden müssen, bieten wir auch hierzu organisatorisches und technisches Consulting an.

Grundsätzlich interessieren uns Fragestellungen, die zur frühen Diagnostik beitragen und bestenfalls in das AMPEL-System integriert werden können. Darüber hinaus gilt unser Interesse der Bildverarbeitung, z.B. in enger Zusammenarbeit mit der Radiologie u.a. Abteilungen und Kliniken. Die automatische Generierung von Befundbriefen mit neuen Ansätzen (z.B. ChatGPT) ist ebenso ein Thema in unserem Fokus.

Wir unterstützen Sie gerne mit un​serer Expertise.

Was erwarten wir von Ih​​nen?

Ihre Promotionsarbeit lebt von Ihrem Engagement. Sie benötigen daher ein gewisses Maß an Interesse an der Fragestellung und Engagement, das Ziel zu erreichen und damit die aufgeworfene Fragestellung zu beantworten. Wir erwarten keine Kenntnisse und Fertigkeiten, die Inhalt von natur- und ingenieurwissenschaftlichen Studiengängen sind. Sie benötigen keine Kenntnisse in Datenstrukturen und Algorithmen oder fortgeschrittenen Methoden der Statistik und Künstlichen Intelligenz; es schadet aber a​uch nicht. Grundlegende Statistikkenntnisse sind sehr hilfreich und Sie sollten dem Computer nicht abgeneigt gegenüberstehen.

Wir bilden Sie in Hinsicht auf die zu verwendenden Methoden weiter. Wir bieten eine Einarbeitung in gängige Data Science Tools und die Programmiersprachen R und Python und helfen Ihnen bei der Bewältigung der Forschungsfrage.

​​​

​2) Abschlu​​ssarbeit​​

Die Arbeitsgruppe Medical Data Science bietet derzeit die nachfolgend aufgeführten Abschlussarbeitsthemen an. Wenn Sie eigene Ideen oder Fragen haben, können Sie uns gerne eine E-Mail ​schreiben.

Medizinische Datenanalytik

​Datenanalysemethoden für medizinische Daten

Beschreibung: Die medizinische Datenanalytik zielt darauf ab, aus klinischen und gesundheitsbezogenen Daten verwertbare Erkenntnisse zu gewinnen, um die klinische Entscheidungsfindung und die medizinische Forschung zu unterstützen. Medizinische Daten sind jedoch häufig heterogen, unvollständig und unterliegen strengen datenschutzrechtlichen Anforderungen, was ihre Analyse erheblich erschwert. Moderne Analyseverfahren wie statistische Modellierung und maschinelles Lernen bieten Ansätze zur Mustererkennung und zur Entwicklung prädiktiver Modelle auf Basis solcher Daten.

Ziel: Ziel dieses Themenbereichs ist die Untersuchung und Anwendung von Datenanalysemethoden auf medizinische Datensätze sowie die Bewertung, inwieweit unterschiedliche Analyseverfahren Vorhersage, Klassifikation oder Mustererkennung im Gesundheitswesen unterstützen können.

Themen:

  • ​Vorhersage des Ressourcenbedarfs in der klinischen Versorgung anhand von Erstaufnahmedaten der Notaufnahme
  • Anomalieerkennung in Intensivdaten: Wann ist ein Alarm klinisch relevant?
  • Brustkrebsdetektion in der MRT: Umgang mit dichteabhängigen Bildunterschieden

Large Language Models

Anwendungen von Lage language modellen im medizinischen Bereich

Beschreibung: Klinische Informationssysteme erzeugen große Mengen an Textdaten, darunter Arztbriefe, Entlassungsberichte, medizinische Befunde und wissenschaftliche Fachliteratur. Große Sprachmodelle (Large Language Models, LLMs) können die Analyse und Interpretation solcher Daten unterstützen – etwa durch Informationsextraktion, automatische Zusammenfassung, fragenbasierte Informationsabfrage oder klinische Entscheidungsunterstützung. Dennoch bestehen weiterhin Herausforderungen hinsichtlich Modellzuverlässigkeit, domänenspezifischer Anpassung und des Datenschutzes im medizinischen Anwendungskontext.

Ziel: Ziel dieses Themenbereichs ist die Untersuchung des Einsatzes von LLMs für spezifische Aufgaben im medizinischen Bereich sowie die Evaluation ihrer Leistungsfähigkeit im klinischen Anwendungskontext.

Themen:

  • KI-Agenten zur Informationsextraktion aus unstrukturierten Patientenakten
  • Patientenzuordnung zu laufenden Forschungsstudien: Abgleich unstrukturierter Ein- und Ausschlusskriterien mit unstrukturierten Patientendaten
  • Theorie und Praxis in der medizinischen Versorgung: Leitlinienadhärenz – Diskrepanzen zwischen evidenzbasiertem Standard und klinischem Alltag
  • Automatisierte Triageunterstützung auf Basis von Vitalparametern und Symptomen in der Notaufnahme
  • Entwicklung eines Chatbots zur automatisierten Triage-Entscheidungsunterstützung
  • Transkription und Zusammenfassung von Audioströmen zu strukturierten medizinischen Dokumentationen (BA)​

Synthetische Datengenerierung

Generierung synthetischer Daten im medizinischen Bereich mittels generativer Modelle

Beschreibung: Synthetische Daten gewinnen im medizinischen Bereich zunehmend an Bedeutung insbesondere aufgrund eingeschränkter Datenverfügbarkeit und strenger Anforderungen an den Datenschutz. Bei seltenen Erkrankungen stehen häufig nur begrenzte Datensätze für die Entwicklung und Evaluation robuster Analysemodelle zur Verfügung. Die Generierung synthetischer Daten verfolgt das Ziel, künstliche Datensätze zu erzeugen, die die statistischen Eigenschaften realer medizinischer Daten abbilden, ohne einen direkten Bezug zu einzelnen Patientinnen und Patienten herzustellen.

Ziel: Ziel dieses Themenbereichs ist die Untersuchung und Implementierung von Methoden zur Generierung synthetischer medizinischer Daten beispielsweise mittels tiefenlernbasierter generativer Modelle wie Generative Adversarial Networks (GANs) und Variational Autoencoders (VAEs) oder nicht-tiefenlernbasierter Ansätze wie Adversarial Random Forests (ARFs). Dabei soll evaluiert werden, wie gut synthetische Daten die Eigenschaften realer Daten widerspiegeln und wie sie Datenanalyse sowie maschinelles Lernen unter Wahrung des Datenschutzes unterstützen können.

Themen:

  • Ersatz des Standardversorgungsarms in klinischen Studien durch synthetisch generierte Daten​

Infrastruktur

Infrastruktur für die Verarbeitung und Analyse medizinischer Daten

Beschreibung: Datengetriebene medizinische Forschung erfordert eine zuverlässige Infrastruktur für die Speicherung, Verarbeitung und Analyse von Daten. Effiziente Datenpipelines und skalierbare Rechenumgebungen sind notwendig, um große Datenmengen zu verarbeiten, reproduzierbare Forschungsabläufe zu gewährleisten und dabei datenschutzrechtliche Vorgaben einzuhalten.

Ziel: Ziel ist die Konzeption oder Evaluation von Infrastrukturlösungen für die medizinische Datenverarbeitung, etwa Datenpipelines, Rechenumgebungen oder Plattformen für maschinelle Lernworkflows, sowie die Untersuchung, wie solche Systeme eine effiziente und reproduzierbare Datenanalyse im medizinischen Umfeld unterstützen können.

Themen:

  • FHIR-basiertes Patiententriagesystem: Konzeption und Implementierung
  • Transkription und Zusammenfassung von Audioströmen zu strukturierten medizinischen Dokumentationen (BA)​
Liebigstraße 18, Haus B
04103 Leipzig
Telefon:
0341 - 97 10283
Map