Was ist ein Data-Dictionary?

+1 Punkt
1,175 Aufrufe
Was ist ein Data-Dictionary? Wofür kann es im zentralen Datenmanagement eingesetzt werden? Welche Vorteile bietet es?
Gefragt 4, Mär 2014 in Standardisierte Speicherung von peatle

Eine Antwort

+2 Punkte
 
Beste Antwort

Was ist ein Data-Dictionary?

Ein Data-Dictionary ist ein Meta-Datenverzeichnis. Das bedeutet, dass hier Daten über Daten (in den meisten Fällen Studienvariablen) abgelegt werden. Das klingt erstmal abstrakt, ist aber konkret nützlich, wenn es um die Auswertung der Daten oder die Vergleichbarkeit von Daten unterschiedlicher Studien geht.

Betrachten wir dazu folgende Beispielerhebung:

Patient Wert_1 Wert_2 Wert_3 Wert_4
1 60 90 130 1
2 57 70 120 2
3 53 110 160 1
4 59 60 90 1
5 63 130 160 2
6 75 80 120 1
7 67 60 100 2

Diese Daten sehen erstmal interessant aus, sind aber ohne weitere Informationen ziemlich nutzlos. Betrachten wir die Variable Wert_1, so kann sie vieles widerspiegeln: das Patientenalter, die Anzahl absolvierter Kniebeugen, die Wegstrecke bis zum nächsten Arzt und vieles mehr.

Um diese Daten also mit einem Kontext zu versehen kommen Meta-Daten ins Spiel. Diese beschreiben die Studienvariablen. Hierbei ist zu beachten, dass eine detaillierte Beschreibung der Studienvariablen unter Umständen sehr komplex werden kann.

Auch hierzu ein Beispiel für die Meta-Daten bzw. das Data-Dictionary für die Beispielerhebung:

Variable Beschreibung Wertebereich Einschränkung
Patient fortlaufende Nummerierung 1-10000  
Wert_1 Alter in Jahren bei Untersuchung 50-80  
Wert_2 diastolischer Blutdruck nach RR 0-200  
Wert_3 systolischer Blutdruck nach RR 30-300  muss größer sein als Wert_2
Wert_4 Geschlecht

1=männlich
2=weiblich

 

Am Beispiel des Blutdrucks kann man die Steigerung der Detaillierung am einfachsten veranschaulichen. Aus dem oben dargestellten Data-Dictionary können sie z.B. nicht erkennen, ob der Blutdruck im stehen, sitzen oder liegen gemessen wurde; ob der Patient vorher eine Ruhephase hatte, oder die Messung unter Belastung erfolgte; welches Meßgerät verwendet wurde; in welcher Maßeinheit die Ergebnisse dargestellt werden.

Wofür kann ein Data-Dictionary im zentralen Datenmanagement im zentralen Datenmanagement eingesetzt werden?

Durch den Einsatz eines Data-Dictionaries werden für die Studienvariablen zusätzliche Informationen bereitgestellt. Diese Informationen sind sowohl für die Datenerhebung als auch für die Datenauswertung wichtig.

In der Datenerhebung können die Informationen aus dem Data-Dictionary genutzt werden um die Instrumente für die Datenerhebung zu entwickeln. Einige Werkzeuge bieten die Möglichkeit in automatisierten Verfahren elektronische Formulare aus einem Data-Dictionary zu erzeugen. Dabei werden dann zum Beispiel auch Einschränkungen wie beim systolischen Blutdruck berücksichtigt, was Fehleingaben reduzieren und die Datenqualität erhöhen kann.

Zur Datenauswertung ist es notwendig welche Variablen die Werte abbilden, welche ausgewertet werden sollen. Für die Auswahl dieser Variablen kann das Data-Dictionary verwendet werden. Insbesondere bei Reviews bzw. Meta-Analysen mit Daten aus unterschiedlichen Studien ist eine genaue Beschreibung der erhobenen Variablen sinnvoll. Hierdurch wird es möglich die Vergleichbarkeit der Variablen zu beurteilen und Gründe für unterschiedliche Studienergebnisse zu erkennen.

Beantwortet 6, Mär 2014 von Christian Schäfer
Bearbeitet 30, Jun 2014 von Christian Schäfer

Institut für Community Medicine · Universitätsmedizin Greifswald

...