Datenkompetenzen

Was ist Data Literacy?

Informationen rund um die Themen Daten und Datenkompetenz
Datenkompetenzen
Abbildung: Volker Schwartze

Was sind eigentlich Daten?

Je nach Perspektive kann der Begriff „Daten“ verschieden definiert werden. Für allgemeine Definitionen werden häufig zwei Ansätze gewählt 1, 2:

  1. Daten stellen Werte/Angaben/Befunde dar, die auf Grundlage von Beobachtungen, Messungen, statistischen Erhebungen oder ähnlichen Methoden [z.B. Simulationen] erfasst wurden.
  2. Daten sind elektronisch gespeicherte Zeichen (digitale Daten).

Diesen beiden Ansätzen entsprechend gehören zu den Daten u.a.: Antworten in Fragebögen, die Inhalte von Schriftstücken und deren Gestaltung, Bild- und Tonaufnahmen, Modelle, Mess- und Laborwerte, Ergebnisse von Experimenten und Simulationen, Umweltmessungen oder auch der Code von Software und mathematische Gleichungen.

Der große Wert von Daten in unserer Gesellschaft spiegelt sich auch in Aussagen wie: „Daten sind der Rohstoff [oder auch „das Öl“] des 21. Jahrhundert“ wider. Daten verändern unsere Gesellschaft und spielen bereits eine entscheidende Rolle in unserem Alltag, auch wenn wir uns dessen nicht immer bewusst sind. Beim Einkaufen, beim Besuch von Webseiten oder bei der Nutzung von digitalen Kommunikationsplattformen werden Daten über uns gesammelt und von verschiedenen Akteuren genutzt. Gleichzeitig werden wir auch mit großen Mengen an Daten konfrontiert, die uns unter anderem bei der Einschätzung von Entwicklungen in der Welt oder aber auch beim Treffen von persönlichen oder beruflichen Entscheidungen helfen sollen.

Grundlegende Kompetenzen zum Umgang mit und dem Verständnis von Daten (Data Literacy) sind essentiell, um Wissen aus verfügbaren Daten zu generieren und begründete Entscheidungen treffen zu können. Diese Fähigkeiten spielen sowohl in der Wissenschaft als auch generell für die gesellschaftliche Teilhabe eine wichtige Rolle.

Was ist Data Literacy?

Data Literacy [Datenkompetenz] ist die Fähigkeit, planvoll mit Daten umzugehen und sie im jeweiligen Kontext bewusst einsetzen und hinterfragen zu können. Dazu gehören die Kompetenzen, Daten zu erfassen, erkunden, managen, kuratieren, analysieren, visualisieren, interpretieren, kontextualisieren, beurteilen und anzuwenden.

(Hochschulforum Digitalisierung, 2017)

Mengendiagramm zu Data Literacy und verwandten Kompetenzen

Abbildung: Volker Schwartze

Durch die fortschreitende Digitalisierung und Datafizierung aller Wissenschaftsfelder werden Kompetenzen im Umgang mit Forschungsdaten immer wichtiger. Daher stellt Data Literacy nicht nur eine spezielle Kompetenz für einzelne Expertengruppen wie Data Scientists oder Data Stewards dar, sondern eine grundlegende Kernkompetenz, die für alle Fachdisziplinen relevant ist. Aber auch außerhalb der Wissenschaft spielen diese Kompetenzen eine wichtige Rolle und werden zu den sogenannten "Future Skills" gezählt, also den Fähigkeiten, die in den kommenden Jahren im Berufsleben und für die gesellschaftlichen Teilhabe immer mehr an Bedeutung gewinnen.

Data Literacy umfasst dabei viele Kompetenzen aus angrenzenden Themenbereichen wie Statistik, Umgang mit digitaler Technologie und Visualisierung. Weiterhin sind aber auch ethische und rechtliche Aspekte sowie disziplinspezifische Expertisen Bestandteil von Data Literacy. Aufgrund der weit gefassten Definition und der damit verbundenen Vielfalt an Kompetenzen geht Data Literacy deutlich über die klassischen Inhalte der einzelnen Fachbereiche hinaus. Dadurch können entsprechende Datenkompetenzen bisher nicht oder nur in Teilaspekten in den Studiengänge vermittelt werden.

Was gehört alles zum kompetenten Umgang mit Daten?

Data Literacy bezieht sich nicht nur auf Kompetenzen bei der Erzeugung von Daten, sondern auch bei ihrer Rezeption.3 So wird bei der Kodierung der Daten ein Bewusstsein für entfernte beziehungsweise hinzugefügte Kontexinformationen benötigt. Dies geschieht zum Beispiel im Rahmen der Zusammenfassung von Daten in Form von Mittelwerten oder bei der Wahl von bestimmten Visualisierungsformen. Bei der Dekodierung dagegen ist ein Bewusstsein für den tatsächlichen Informationsgehalt von Statistiken beziehungsweise Grafiken erforderlich.3

Prozessmodell der Datenwertschöpfung und Data-Literacy-Kometenzen (modifiziert nach Schüller et al., 2019)

Foto: Volker Schwartze (CC-BY-4.0, modifiziert nach Schüller et al. 2019)

Data Literacy sollte dabei nicht als Synonym von Data Science verstanden werden. Während Data Science ein eigenständiges Wissenschaftsfeld darstellt und vor allem auch technische Kompetenzen aus dem Bereich der Informatik und Statistik beinhaltet, handelt es sich bei Data Literacy um grundlegende Kompetenzen, die nicht nur für Forschende spezifischer Fachbereiche Relevanz besitzen, sondern auf einem entsprechenden Expertiselevel für alle Menschen essentiell sind.

Die folgende Übersicht basiert auf der Kompetenzmatrix von Ridsdale et al. (2015)4, die einen der am weitesten verbreiteten Kompetenzrahmen darstellt. Die 21 Einzelkompetenzen aus 5 Kompetenzfeldern werden in konzeptionelle, grundlegende und fortgeschrittene Kompetenzen unterschieden. In der folgenden Zusammenstellung sind außerdem nähere Erläuterungen zu den einzelnen Kompetenzen und Beispiele angegeben.

  • Konzeptioneller Rahmen

    Grundlagen zu Daten (konzeptionell)

    • Grundlagenwissen zu und Verständnis für Daten
    • Bewusstsein für Relevanz und Einsatzmöglichkeiten von Daten
    • Wissen zu verschiedenen Datentypen und -formaten
  • Sammeln von Daten

    Daten finden und sammeln (grundlegend)

    • Identifizieren von Daten, die für die Beantwortung der Fragestellung erforderlich sind
    • Erhebung oder Beschaffung erforderlicher Daten unter Anwendung geeigneter Techniken (z.B. Beobachtung, Messung, Simulation)
    • Fähigkeit, bestehende Datensätze zu finden und zu sammeln
    • Beispiel: Nutzung von Suchmaschinen und Datenbanken

    Datenqualität bewerten und sichern (grundlegend)

    • Kritische Einschätzung der Vertrauenswürdigkeit von Datenquellen
    • Evaluierung der Qualität von Datensätzen bezüglich verschiedener Faktoren (z.B. Korrektheit, Relevanz, Repräsentativität, Vollständigkeit)
  • Management von Daten

    Organisieren von Daten (grundlegend)

    • Einschätzung der Anforderungen an die Organisation von Daten
    • Wissen zu grundlegenden Methoden und Werkzeugen
    • Beispiel: sinnvolle Benennung von Dateien und die Entwicklung klarer Ordnerstrukturen

    Bereinigung von Daten (grundlegend)

    • Auswahl von Methoden zur Bereinigung von Datensätzen
    • Identifizierung von Ausreißern und Anomalien
    • Bearbeitung von Daten (z.B. filtern, sortieren, zusammenführen)

    Konvertierung von Daten (fortgeschritten)

    • Wissen zu Datentypen und Methoden zur Konvertierung
    • Fähigkeit, Daten von einem Format bzw. Datentyp in ein anderes zu überführen

    Erstellung und Anwendung von Metadaten (fortgeschritten)

    • Bewusstsein für die Wichtigkeit der Dokumentation von Datensätzen
    • Erstellen von Metadaten für Daten(-sätze)
    • Anwendung von angemessenen Methoden und Standards für Metadaten

    Pflege, Sicherheit und (Nach-)Nutzung von Daten (fortgeschritten)

    • Bewerten der Anforderungen für die Datenkuration (z.B. Vorhaltezeiten, Speicher, Zugänglichkeit, Regelungen zum Teilen)
    • Bewerten der Sicherheitsanforderungen (z.B. Zugriffsbeschränkungen, geschützte Datenspeicher)

    Datenerhaltung / Langzeitspeicherung (fortgeschritten)

    • Bewerten der Anforderungen für die langfristige Datenerhaltung (Langzeitspeicherung, Archivierung)
    • Auswahl angemessener Werkzeuge und Methoden
  • Evaluation von Daten

    Methoden und Werkzeuge zur Datenanalyse (konzeptionell)

    • Wissen bezüglich Analysetechniken und -werkzeugen
    • Auswahl angemessener Werkzeuge und Techniken zur Datenanalyse
    • Anwendung von Werkzeugen und Techniken zur Datenanalyse

    Grundlagen der Datenanalyse (grundlegend)

    • Planung der Datenanalyse
    • Anwendung von Analysemethoden und -werkzeugen
    • Durchführung von explorativen Analysen
    • Beurteilung von Ergebnissen aus Datenanalysen
    • Vergleichen von Analyseergebnissen mit anderen Ergebnissen

    Auswertung und Interpretation von Daten (grundlegend)

    • Lesen und Verstehen von Tabellen und Diagrammen
    • Identifizieren von Kernaussagen und Zusammenführen mit anderen wichtigen Informationen
    • Identifizieren von Unstimmigkeiten in Daten

    Identifizieren von Problemen mithilfe von Daten (grundlegend)

    • Nutzung von Daten zur Identifizierung von Problemen in praktischen Situationen (z.B. Effizienz am Arbeitsplatz)
    • Nutzung von Daten zur Identifizierung von Problemen auf höherer Ebene (z.B. Politik, Umwelt, Wirtschaft, Marketing)

    Datenvisualisierung (grundlegend)

    • Erstellen von aussagekräftigen Tabellen und grafischen Darstellungen
    • Beurteilen der Effektivität von grafischen Darstellungen
    • kritische Beurteilung von grafischen Darstellungen in Bezug auf Richtigkeit und eventuelle Fehldarstellungen

    Präsentation von Daten (grundlegend)

    • Einschätzen der gewünschten Ergebnisse der Datenpräsentation
    • Anpassen der Darstellung an die Bedürfnisse und den Hintergrund des Publikums
    • Einbeziehen von angemessenen grafischen Darstellungen
    • klare und zusammenhängende Präsentation der Argumente und / oder Ergebnisse

    Datengetriebene Entscheidungsfindung (grundlegend)

    • Priorisieren von datenbasierten Informationen
    • Verarbeitung von Daten in anwendbare Informationen
    • Abschätzen des Werts und der Auswirkungen der Lösungen / Entscheidungen
    • Umsetzung der Lösungen / Entscheidungen
  • Anwendung von Daten

    Kritisches Denken (konzeptionell)

    • Bewusstsein für komplexe Fragestellungen und Herausforderungen in Bezug auf Daten
    • kritisches Denken in Bezug auf Daten

    Datenkultur (konzeptionell)

    • Erkennen der Wichtigkeit von Daten
    • Unterstützung einer Umgebung, die den kritischen Umgang mit Daten im Rahmen von Lehre, Forschung und Entscheidungsfindung fördert

    Datenethik (konzeptionell)

    • Bewusstsein für rechtliche und ethische Aspekte im Zusammenhang mit Daten
    • Arbeit mit Daten in ethischer Art und Weise

    Zitieren von (Forschungs-)Daten (grundlegend)

    • Wissen zu allgemein akzeptierten Methoden zur Datenzitation
    • korrektes Zitieren von Sekundärdaten

    Teilen von (Forschungs-)Daten (grundlegend)

    • Einschätzen von Methoden und Plattformen zum Teilen von Daten
    • Beachten von rechtlichen und ethischen Aspekten beim Teilen von Daten

    Bewerten von Entscheidungen auf Grundlage von Daten (fortgeschritten)

    • Sammeln und Analysieren von Folgedaten, um die Effektivität von Lösungen und Entscheidungen zu beurteilen
    • Vergleich von Ergebnissen der Analyse mit anderen Ergebnissen
    • Evaluation von getroffenen Entscheidungen / Lösungen und gegebenenfalls Durchführung von Anpassungen