Matthäus Stöhr (Leipzig), Mika Katalinic (Leipzig), Alexander Katalinic (Lübeck), Andreas Dietz (Leipzig), Jan Gaebel (Leipzig)
INTRODUCTION: The development of digital patient models to support decision-making processes is necessary due to increasingly complex diagnostics and diverse treatment options. Extensive patient data is essential for the development and validation of the models, but this is only available to a limited extent. A solution for this dilemma may be the generation of synthetic data sets that are as realistic as possible. In this project we intended to generate realistic case data for the use case of laryngeal cancer (LC).
METHODS: Using the open source software Synthea, a model (https://git.iccas.de/synthea/laryngeal-cancer.git) of the entire treatment path of LC including diagnostics, therapy and follow-up care was created based on relevant literature and guidelines as well as cancer registry data. LC cases from the simulated population and deceased LC cases were stratified according to the real age and sex distribution of the LC, creating an incidence-based cohort view.
RESULTS: The Synthea system was able to generate realistic age- and stage-specific LC cases and was therefore successfully implemented. The synthesized population consisted of 2 million people with 1,394 LC cases and reflects the real prevalence very well. This index cohort was successfully expanded to over 50,000 LC cases. The modeled LC cases correlate well, for example, with stage-specific and 5-year overall survival from the cancer registry data.
CONCLUSION: Synthea can be used to synthesize large cohorts that are proven to produce realistic results. Such synthetic cases simplify the creation and optimization of digital patient models, which need to be validated on real data afterwards.
EINLEITUNG Die Entwicklung digitaler Patientenmodelle zur Unterstützung von Entscheidungsprozessen ist aufgrund der immer komplexeren Diagnostik und diverser Therapieoptionen notwendig. Für Entwicklung und Validierung der Modelle sind umfangreiche Patientendaten essentiell, die jedoch nur begrenzt verfügbar sind. Ein Ausweg aus diesem Dilemma soll durch die Generierung von synthetischen und möglichst realistischen Daten sein. Das Projekt soll realistische Falldaten für den Anwendungsfall Larynxkarzinom (LC) generieren.
METHODEN Mittels Open-Source-Software Synthea wurde ein Modell (https://git.iccas.de/synthea/laryngeal-cancer.git) des gesamten Behandlungspfades von LC inklusive Diagnostik, Behandlung und Nachsorge auf der Grundlage von einschlägiger Literatur, Leitlinien und Krebsregisterdaten erstellt. LC-Fälle aus der simulierten Bevölkerung und verstorbenen LC-Fälle werden nach der realen Alters- und Geschlechtsverteilung des LC stratifiziert und so eine inzidenzbasierte Kohortenansicht erstellt.
ERGEBNISSE Das Synthea-System konnte realistische alters- und stadienspezifische LC-Fälle generieren und somit erfolgreich implementiert werden. Die synthetisierte Population bestand aus 2 Millionen Personen mit 1 394 LC-Fällen und spiegelt die reale Prävalenz sehr gut wider. Diese Index-Kohorte konnte erfolgreich auf über 50 000 LC-Fälle erweitert werden. Die modellierten LC-Fälle korrelieren gut z.B. mit stadienspezifischem und 5-Jahres-Gesamtüberleben der Krebsregisterdaten.
SCHLUSSFOLGERUNGEN Mithilfe von Synthea können große Kohorten synthetisiert werden, die nachgewiesenermaßen realistische Ergebnisse bringen. Durch derartige synthetische Fälle lassen sich digitale Patientenmodelle deutlich leichter erstellen und optimieren um sie dann an Echtdaten zu validieren.
Die Autoren geben an, dass kein Interessenkonflikt besteht.
Auf unserem Internetauftritt verwenden wir Cookies. Bei Cookies handelt es sich um kleine (Text-)Dateien, die auf Ihrem Endgerät (z.B. Smartphone, Notebook, Tablet, PC) angelegt und gespeichert werden. Einige dieser Cookies sind technisch notwendig um die Webseite zu betreiben, andere Cookies dienen dazu die Funktionalität der Webseite zu erweitern oder zu Marketingzwecken. Abgesehen von den technisch notwendigen Cookies, steht es Ihnen frei Cookies beim Besuch unserer Webseite zuzulassen oder nicht.