Sie sind hier: Skip Navigation LinksMedizininformatikzentrum

Promotion & Abschlussarbeiten

​​​​​​​Sie haben Interesse, bei uns eine Promotions- oder Abschlussarbeit anzufertigen?​

​​1) Promotionsarbeit​

​​Sprechen S​ie uns bitte an. E​ine Nachricht an Prof. Toralf Kirsten reicht aus und wird zeitnah beantwortet.​​

Was erwartet Sie?​

Wir analysieren Versorgungsdaten zu spezifischen klinischen Fragestellungen. Die Analyse wird in Kooperation mit den Fachabteilungen und Kliniken des Universitätsklinikums Leipzig durchgeführt. Sie können sich mit eigenen Fragestellungen und Kontakten hierzu gerne einbringen. Die von uns untersuchten Fragestellungen können sich auf strukturierte Daten beziehen, wie sie in der klinischen Dokumentation entstehen oder mit Messgeräten (z.B. im Labor) erzeugt werden. Darüber hinaus beziehen wir Bilddaten (CT, MRT, etc.) sowie Textdokumente, z.B. Befundberichte, ein. Die Daten liegen elektronisch vor (kein Abtippen!) und werden unter Nutzung verschied​​​ener Methoden aufbereitet und weiterverarbeitet. Sollten weitergehende Daten benötigt werden, die im Sinne einer Beobachtungsstudie zusätzlich erfasst werden müssen, bieten wir auch hierzu organisatorisches und technisches Consulting an.

Grundsätzlich interessieren uns Fragestellungen, die zur frühen Diagnostik beitragen und bestenfalls in das AMPEL-System integriert werden können. Darüber hinaus gilt unser Interesse der Bildverarbeitung, z.B. in enger Zusammenarbeit mit der Radiologie u.a. Abteilungen und Kliniken. Die automatische Generierung von Befundbriefen mit neuen Ansätzen (z.B. ChatGPT) ist ebenso ein Thema in unserem Fokus.

Wir unterstützen Sie gerne mit un​serer Expertise.

Was erwarten wir von Ih​​nen?

Ihre Promotionsarbeit lebt von Ihrem Engagement. Sie benötigen daher ein gewisses Maß an Interesse an der Fragestellung und Engagement, das Ziel zu erreichen und damit die aufgeworfene Fragestellung zu beantworten. Wir erwarten keine Kenntnisse und Fertigkeiten, die Inhalt von natur- und ingenieurwissenschaftlichen Studiengängen sind. Sie benötigen keine Kenntnisse in Datenstrukturen und Algorithmen oder fortgeschrittenen Methoden der Statistik und Künstlichen Intelligenz; es schadet aber a​uch nicht. Grundlegende Statistikkenntnisse sind sehr hilfreich und Sie sollten dem Computer nicht abgeneigt gegenüberstehen.

Wir bilden Sie in Hinsicht auf die zu verwendenden Methoden weiter. Wir bieten eine Einarbeitung in gängige Data Science Tools und die Programmiersprachen R und Python und helfen Ihnen bei der Bewältigung der Forschungsfrage.

​​​

​2) Abschlu​​ssarbeit​​

​​Die Medical Data Science Gruppe bietet aktuell die hier aufgelisteten Themen für Abschlussarbeiten an. Bitte wenden Sie sich bei Fragen an die ausgewiesenen Kollegen.​

Synthetic Data Generation

​Synthetic Data Generation in​​ the Medical Domain using Generative Adversarial Netw​​orks​

Synthetic data generation has become important in the medical field for two reasons. First, medical d​ata are not widely available to researchers due to patient privacy protections. Second, in some cases such as rare diseases, only limited data are available, making diagnosis or treatment difficult even for experts. Synthetic medical data generation can address these issues by providing artificial medical data that resembles real data while not associated with real patients.

The goal of this thesis is to generate synthetic tabular data relevant to the medical field using generative adversarial networks (GANs) and to investigate how synthetic data can improve data analysis (machine learning) performance compared to cases where only real data are considered.

Contact person: Dr. Sina Sadeghi | E-mail: sina.sadeghi@medizin.uni-leipzig.de

Discriminatory Power of Record Attributes for Record Linkage

Methods for estimating discriminatory power of data record attributes in privacy-preserving record linkage

Record linkage is the challenge of identifying duplicate data records across data sources. Not every attribute holds the same power in telling two records apart, e.g. gender vs. birth date for personal records. There exist a few algorithms for computing this “discriminatory power” of attributes given two datasets and a set of known true matches. However, in the context of privacy-preserving record linkage (PPRL), this is not possible. Access to data is tightly regulated and there exists no “gold standard” for true matches. The goal of the thesis is to research methods for computing the discriminatory power of record attributes, given a single dataset in the absence of a standard for true matches, and to evaluate them on an in-house PPRL framework.

Contact person: Prof. Dr. Toralf Kirsten​ | E-mail: toralf.kirsten@medizin.uni-leipzig.de

Blocking for Record Linkage on Distributed Datasets

Evaluation of blocking methods for privacy-preserving record linkage with distributed datasets

Record linkage is the challenge of identifying duplicate data records across data sources. Linking records in a pairwise way is infeasible, since the runtime grows dramatically the more records there are per dataset. Within the field of record linkage, there exist several techniqu​​​es of grouping similar records together at their respective sources, therefore reducing the runtime of the subsequent linkage process. This grouping step is called “blocking”. There also exist some methods that can be applied to privacy-preserving record linkage (PPRL) in particular, but none of them have been applied to an actual test case with datasets that are distributed across several locations. The goal of the thesis is to implement, evaluate and demonstrate blocking methods on an in-house PPRL framework in an environment with distributed datasets.

Contact person: Prof. Dr. Toralf Kirsten​ | E-mail: toralf.kirsten@medizin.uni-leipzig.de​

XNAT Plugin for RedCAP import

XNAT system is for storing and working with image data in the medical domain but can. Also contains ot​​her data. There are plugins the admin can install and also run which can run code within the XNAT system to produce some calculation or other thing. 

The RedCAP system is a broadly used tool for creating and entering structured data within the​ medical field. Both systems have an API and can push and pull data. For clinical image data for a doctor or a data scientist it would be helpful to gain a detailed overview over the XNAT system and look this up in the REDCap system.

Contact person: Prof. Dr. Toralf Kirsten​ | E-mail: toralf.kirsten@medizin.uni-leipzig.de​

NLP for Opinion Mining in Medical Evaluation Blogs

NLP approaches for information extraction about patient care evaluations from public blog system​​​​​

Evaluation​s and review statements from patients about the patient care process in a hospital are eminently important for the hospital for improving internal processes but also to detect hate speech. Publicly, such evaluations and reviews are available in blog systems.

The goal of this thesis is to use modern methods from Natural Language Processing (NLP) to extract ​reasonable information from such patient reviews in a way it can be used for further processing such as opinion mining and hate speech detection.

Contact person: Macedo Maia | E-mail: macedo.sousamaia@medizin.uni-leipzig.de

Python Data Quality Assessment

Data Quality A​​ssessment Library for structured Patient Data

Assessing the data quality is an important step before the analysis can start. The current state of the data quality of a data set can be obtained in different dimensions including integrity, consistency, completeness, and accuracy. Each of these dimensions contains different domains and these include again indicators acting as measurable items for data quality. The goal of this thesis is to design a python library including most of the already defined data quality indicators for structured data.

Contact person: Dr. Sina Sadeghi | E-mail: sina.sadeghi@medizin.uni-leipzig.de

Liebigstraße 18, Haus B
04103 Leipzig
Telefon:
0341 - 97 10283
Map