Please use this identifier to cite or link to this item: doi:10.22028/D291-46378
Title: Entwicklung eines Prognosemodells für die Dekompensation der Leberzirrhose mithilfe Künstlicher Intelligenz/Maschinellem Lernen
Author(s): Müller, Sophie Elisabeth
Language: German
Year of Publication: 2024
Place of publication: Homburg/Saar
DDC notations: 610 Medicine and health
Publikation type: Dissertation
Abstract: Einleitung und Ziel: Bei Patienten mit Zirrhose erhöhen Dekompensationen die Mortalität signifikant, weshalb eine frühe Erkennung von Risikopatienten von entscheidender Bedeutung ist. Diese Arbeit hatte zum Ziel, mithilfe maschineller Lernverfahren Parameter zu bestimmen, die Dekompensationen vorhersagen können. Patienten und Methoden: Basis der Studie bildete die Datenbank der INCA-Studie (Impact of nucleotide-binding oligomerization domain-containing protein 2 [NOD2] genotype-guided antibiotic prevention on survival in patients with liver Cirrhosis and Ascites), welche retrospektive und prospektive Daten von 983 Patienten mit Zirrhose aus den Universitätskliniken Homburg und Halle enthält. Zusätzlich zu klinischen Informationen wurden auch Laborwerte und NOD2-Genotypen betrachtet. Für das maschinelle Lernen wurden Entscheidungsbäume, Random Forests, Support Vector Maschinen und neuronale Netze genutzt. Zur Identifizierung der für die Vorhersage wichtigen Parameter wurde zunächst eine hierarchische Clusteranalyse basierend auf der Spearman-Rangkorrelation und der Ward-Minimumvarianzmethode durchgeführt, anschließend wurde als Modellinspektionstechnik die Permutation Feature Importance eingesetzt. Ergebnisse: Von den 983 Patienten wiesen 313 Patienten zum Indexzeitpunkt eine kompensierte Zirrhose auf, 354 Patienten hatten in der Vergangenheit eine Dekompensation erlitten, waren jedoch zum Inklusionszeitpunkt rekompensiert, und 316 Patienten befanden sich im dekompensierten Zustand. Am Follow-up nahmen 825 Patienten teil, dieses hatte eine mittlere Dauer von zwölf Monaten und eine maximale Dauer von 55 Monaten. 46,5 % der Patienten dekompensierten. Mit einer Accuracy von 81,6 % auf den Trainings- und 70,5 % auf den Testdaten erzielten Random Forests bei der retrospektiven Vorhersage einer Dekompensation die besten Ergebnisse. Support Vector Maschinen konnten Dekompensationen am besten prospektiv vorhersagen, sie erreichten eine Accuracy von 78,6 % bzw. 73,8 %. Die Analyse der Permutation Feature Importance ergab, dass die Ausgangswerte von Bilirubin und Albumin sowie der maximale Bilirubinwert für die retrospektive Analyse entscheidend waren. Bei der prospektiven Analyse wurden der maximale Bilirubinwert und die Ausgangswerte von Natrium und Albumin am höchsten gewichtet. Neben Parametern etablierter Risikoscores wie dem Child-Pugh- und dem Model for End-stage Liver Disease-Score, waren Entzündungswerte und NOD2-Genotypen von hoher Relevanz. Schlussfolgerungen: Unter den getesteten Modellen erzielten Random Forests und Support Vector Maschinen die höchste Genauigkeit für die Vorhersage einer Dekompensation. Neben Laborwerten wie Bilirubin und Albumin, spielten Infektionen und genetische Faktoren eine entscheidende Rolle für die individuelle Vorhersage.
1.2 Abstract: Machine learning models predicting decompensation in cirrhosis Background and Aims: Decompensation of cirrhosis significantly increases the mortality rate, thus an early detection of patients at risk is of utmost importance. This study aimed to identify parameters which predict a decompensation using machine learning. Methods: Several machine learning techniques including Decision Trees, Random Forests, Support Vector Machines, and Neural Networks were applied to the INCA trial database (Impact of nucleotidebinding oligomerization domain-containing protein 2 [NOD2] genotype-guided antibiotic prevention on survival in patients with liver Cirrhosis and Ascites) containing both prospective and retrospective data from 983 patients with cirrhosis from the university hospitals Homburg and Halle. Besides laboratory values, clinical information and NOD2 genotypes were considered. After performing a hierarchical clustering on the numerical variables based on the Spearman rank-order correlation using Ward’s minimum variance method, Permutation Feature Importance was used as model inspecting technique to determine the impact of the parameters on the prediction of a decompensation. Results: Of the 983 patients, 313 patients had compensated cirrhosis at the index date, 354 patients were decompensated earlier, but currently recompensated, and 316 were in a decompensated state. Overall, 825 patients were included in the follow-up (median duration: 12 months, maximum: 55 months), of whom 46.5 % decompensated. In the retrospective assessment, Random Forests performed best with an accuracy of 81.6 % on training and 70.5 % on test data. Support Vector Machines were best at predicting a decompensation prospectively, achieving an accuracy of 78.6 % and 73.8 %, respectively. Permutation Feature Importance demonstrated that the baseline values of albumin and bilirubin and the maximum bilirubin value were the highest ranked parameters to be associated with a former decompensation. For the prospective analysis, the maximum bilirubin value and the baseline values of albumin and sodium were the highest ranked. Alongside parameters of established risk scores like the Child-Pugh and the Model for End-stage Liver Disease score, parameters related to infections (e.g., inflammatory markers and intake of antibiotics) and NOD2 genotypes were highly ranked. Conclusion: Among tested machine learning models, Random Forests and Support Vector Machines seem to have the highest accuracy in predicting decompensation. In addition to laboratory parameters, NOD2 genotypes and infections were crucial parameters for the individual prediction.
Link to this record: urn:nbn:de:bsz:291--ds-463781
hdl:20.500.11880/40719
http://dx.doi.org/10.22028/D291-46378
Advisor: Lammert, Frank
Date of oral examination: 2-Oct-2025
Date of registration: 22-Oct-2025
Faculty: M - Medizinische Fakultät
Department: M - Innere Medizin
Professorship: M - Prof. Dr. Frank Lammert
Collections:SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Files for this record:
File Description SizeFormat 
Dissertation_online_Sophie_Mueller.pdf1,32 MBAdobe PDFView/Open


Items in SciDok are protected by copyright, with all rights reserved, unless otherwise indicated.