Daten-Export

Auswertung
GTDS
Export
SQL
Flowchart
Author

Martin Burk

Published

August 16, 2022

Beispielhafter Datenexport in GTDS

Angenommen, Du hast Deine Daten mühevoll in dem Tumordokumentationssystem GTDS zusammen gestellt. Inzwischen sind mehrere Tausend Datensätze vorhanden (Ersterkrankungsfälle, Therapieeinträge und Nachsorgebefunde). Die Daten reichen teils schon weit über 5 Jahre zurück - die Daten verlangen geradezu nach Auswertung!

Stark vereinfacht, sind folgende Schritte nötig, um die vorhandenen Daten in dem externen R-System verarbeitbar zu machen:

flowchart LR
  A[GTDS] --> B(Tabelle)
  B --> C{Import nach R}

Der erste Schritt ist, einen speziellen Ausschnitt aus der Datenbank zu exportieren. Hiervon handeln dieser und die nächsten Blogeinträge.

GTDS entspricht einem relationalen Datenbanksystem. Die Informationen sind auf zahlreiche Tabellen verteilt, die komplex miteinander verbunden sind. Bis auf die Indizes/Schlüssel sind alle Daten nur jeweils in einer Tabelle. enthalten. Sollen Daten aus dieser Struktur z.B. zwecks Analyse herausgelöst werden, muss die Struktur der Datenbank gut bekannt sein - wo liegen welche daten. Wenn dies der Fall ist, wird mittels einer SQL-Abfrage auf die Datenbank zugegriffen, und die interessierenden Informationen geholt.

Diese schwierige Prozedur setzen sowohl Kenntnisse der SQL voraus, als auch tiefere Kenntnisse des mehrdimensionalen GTDS-Datenbank-Modells.

Für die statistische Auswertung der eigenen Daten haben die Schöpfer von GTDS eine erhebliche Erleichterung geschaffen. Unter Anwendung komplexer Algorithmen kann GTDS selbst (zweidimensionale-) Datentabellen erzeugen. Den Inhalt der Tabellen kann der Benutzer sogar selbst zusammen stellen - aus einer großen Zahl von Parametern.

Dieses Auswertungsmodul ist ausführlich beschrieben.

Der zweidimensionale Tabellenauszug weist Einschränkungen auf, derer man sich bewusst sein sollte:

  • Die Tabelle ist ein statischer Auszug (Momentaufnahme) aus der sich ständig durch die Benutzer ändernden Datenbank.

  • Nur solche Datensätze werden erzeugt, auf die der aktuelle Benutzer Zugriffsrechte hat.

  • Jeder exportierte Datensatz enthält die Daten eines Tumors. Ein Patient kann somit in mehr als einem Datensatz vorkommen.

  • Die Tabelle kann nicht den gesamten Verlauf einer Tumorerkrankung abbilden - die dritte Dimension des zeitlichen Verlaufs einzelner Therapiemodalitäten oder der Nachsorge ist im wesentlichen nicht enthalten.
    Später wird deswegen auf die Möglichkeit eingegangen, in GTDS-Auswertung Zusatztabellen zu generieren, die weitere Details (vor allem OP-Details, Details zu den Chemo- und Strahlentherapien) aufschlüsseln.

  • Die exportierte Auswertungs-Tabelle enthält alle eventuell in den GTDS-Daten noch enthaltenen Fehler - eine Datenbereinigung findet bei dem Export-Vorgang nicht statt.

Wichtig: die Auswertungstabelle enthält immer nur die Datensätze von Abteilungen, für die der exportierende Benutzer eingetragen ist. Dies gilt auch für den Leitstellenbenutzer. Um alle Daten des gesamten Zentrums exportieren zu können, muss der auswertende Leitstellenbenutzer auf alle gewünschten Abteilungen Zugriffsrechte erhalten.

— | This page brought to you by https://onkostats.de . . . . . — Made with R, RStudio, Quarto, Pandoc, Mermaid, Tidyverse and GTDS … Thank you! — The R logo is copyright © R foundation, licence CC-BY-SA 4.0