Data Hub Governance
Damit der Data Hub fair, sicher und nachvollziehbar genutzt werden kann, braucht es einen klaren Rahmen für Zusammenarbeit und Verantwortung. Daher wird parallel zum Prototypen ein Vorschlag für eine Governance erarbeitet, die Rollen, Prozesse und Prinzipien für den verantwortungsvollen Umgang mit Daten in der Berliner Verwaltung definiert.
Was ist eine Data Governance?
Unter dem Begriff Data Governance wird die Steuerung und Verwaltung von Daten mit dem Ziel der bestmöglichen Nutzbarmachung verstanden. Hierunter fallen unterschiedliche Richtlinien, Prozesse, Rollen und Standards. In öffentlichen Verwaltungen wird hierunter das Zusammenspiel zwischen strategischer Ebene (gesamtstädtische Zielsetzung zu Datennutzung) und operativem Datenmanagement (Datenerfassung, -pflege, -nutzung) verstanden.
Das Versprechen von zentralen Datenschnittstellen wie dem Data Hub ist es, den Wert dieser Daten für Steuerung, Smart City-Initiativen und bessere Entscheidungsgrundlagen für politische Akteure zu heben.
Die rein technische Infrastruktur des Data Hub reicht dafür allerdings nicht aus. Es bedarf der Zuarbeit der Nutzenden, ähnlich wie beim Thema Open Data, zu den Fragen:
- Wer ist für welche Daten verantwortlich?
- Wie werden Daten erfasst, gespeichert, gepflegt und gelöscht (Datenlebenszyklus)?
- In welcher Qualität, welchem Format und Datenmodell sollen sie vorliegen?
- Wie werden Metadaten einheitlich dokumentiert?
- Wie können Datenschutz und Compliance-Vorgaben sichergestellt werden?
Diese Fragen werden aktuell in den unterschiedlichen Fachverwaltungen und Bezirken jeweils meist in Eigenverantwortung verhandelt. Die Vision besteht darin, datenbasiertes Handeln in Berlin zu verankern und zu standardisieren. Dafür sind über Ebenen und Ressorts hinweg klare Verwantwortlichkeiten und Rollen zu etablieren.
Was bedeutet das konkret mit Blick auf den Data Hub?
Das Team des Data Hub kümmert sich in diesem Jahr bei der prototypischen Umsetzung um den fachlichen Betrieb der Datenplattform und die Umsetzung von ersten Use Cases. Ein Team zu stellen, welches sich um die Konfiguration und Vergabe von Rechten (Rechte-/Rollenmanagement) auf der Plattform kümmert, wird in anderen Kommunen bereits erfolgreich umgesetzt. Wir dokumentieren hier unsere Learnings und Erkenntnisse zum Thema Governance.
Der Data Hub verfügt über die Möglichkeit, Datenzugriffe auf genau die Datensätze und Module (beispielsweise Superset oder Grafana) des Data Hub zu beschränken, die für die Umsetzung des jeweiligen Use Cases nötig sind. Das Data Hub-Team setzt die Konfiguration der Plattform in Absprache mit der Verwaltung um. Wir folgen hierbei den Prinzipien minimaler Rechtevergabe zum Schutz gegegbenfalls sensibler Daten und Reduzierung potenzieller Risiken, auch wenn sich die bisherigen Use Cases auf offene Daten beschränken.
Die dadurch entstehenden, getrennten „Bereiche” innerhalb der Plattform werden als Dataspaces bezeichnet.
Zu jedem Use Case müssen Rollen definiert und deren benötigte Privilegien festgelegt werden, um eine erfolgreiche Umsetzung zu gewährleisten (Daten pflegen, Anpassungen am Dashboard vornehmen, Daten zu erfassen und dergleichen). Dabei gilt es zukünftig Standardrollen zu definieren, um den Prozess bei jedem Use Case zu beschleunigen, wie:

Dabei sind Zugriffe nur möglich, wenn sich die Nutzenden vorher authentifiziert haben.
Beispielhafter Ablauf einer Use Case-Umsetzung
-
Kontaktaufnahme der Verwaltungsorganisation (Use-Case-Geber) über Data Hub-Team der Technologiestiftung Berlin oder die Arbeitsgruppe Smart City & Datenmanagement (6 B III) der Senatskanzlei
-
Rücksprache mit dem Data Hub-Team zu Umsetzbarkeit (Passung zu den technischen Möglichkeiten des Data Hub) und Kapazitäten
-
Rückmeldung an Use-Case-Geber: Kick-Off-Termin zur Klärung von Rahmenbedingungen, konkreter Zieldefinition, der Festlegung von Rollen:
- Product Owner im Data Hub-Team
- Data Engineer (technische Umsetzung) im Data Hub-Team
- Verfügbarer Ansprechpartner bei Use Case-Geber
-
Konfiguration des Data Hub:
- Einrichtung eines Dataspaces
- Vergabe von Zugriffsrechten im Data Hub
-
Umsetzung des Use Cases / Erstellung des Datenprodukts
-
Übergabe und Festlegung der Pflege- und Aktualisierungsprozesse
Perspektivisch wäre es empfehlenswert, in den Fach- und Bezirksverwaltungen datenbezogene Prozesse so weit institutionell zu standardisieren, dass jede Behörde über klare, verantwortliche Rollen (beispielsweise Daten-Stewards) verfügt, die das Zusammenarbeiten mit der Datenplattform Data Hub regeln, Standards gemeinsam aushandeln und weitere Use Cases entwickeln.
Bisher existiert noch keine offizielle, abgestimmte Governance. Die hier dargestellten Prozesse sind als erste Vorschläge und als ein Arbeitsstand für die jetzige Phase des prototypischen Betriebs zu verstehen.