Zum Hauptinhalt springen

Einführung zum
Data Hub Berlin

Daten sind die Grundlage für gutes Verwaltungshandeln, Planung und Innovation. Hier erfährst du, wie der Data Hub Berlin im Rahmen der bestehenden Strategien angesiedelt ist, wie er eine gemeinsame, offene Infrastruktur aufbaut und wie durch einen prototypischen Ansatz erste Anwendungsfälle erprobt werden.

Wissensspeicher Logo

Was ist der Data Hub Berlin?

Von der Visualisierung über Statistiken und interne digitale Monitoringberichte bis hin zu Kartenanwendungen: In der Berliner Verwaltung gibt es eine Vielzahl an datenbasierten Aufgaben. Mit dem Data Hub Berlin entsteht eine ressortübergreifende, zentrale Infrastruktur für die Berliner Verwaltung, um effizient mit Daten arbeiten zu können. Erstmalig kann die Verwaltung somit auf passgenaue Software-Komponenten zurückgreifen, mit denen sich Daten verarbeiten und visualisieren lassen, zum Beispiel in Form von Dashboards. Der Data Hub Berlin ebnet damit den Weg zu einer datengetriebenen Verwaltung. Er soll langfristig den zentralen Knotenpunkt für die bestehenden dezentralen Systeme der Stadt bilden und die bestehende IT-Landschaft Berlins ergänzen.

Derzeit erarbeitet ein Kompetenzteam der Technologiestiftung Berlin und der Senatskanzlei Berlin eine prototypische Variante des Data Hub und verschiedene Anwendungsfälle, um die vielfältigen Möglichkeiten dieser Infrastruktur besser zu verstehen, zu erproben und einen Echtbetrieb bestmöglich vorzubereiten.

Eine urbane Datenplattform für Berlin

Beim Data Hub Berlin handelt es sich um eine sogenannte urbane Datenplattform. Viele Kommunen und Städte betreiben oder entwickeln derzeit urbane Datenplattformen, z.B. Potsdam, Bonn, Frankfurt und Hamburg. Dafür setzen sie teils auf bereits etablierte Lösungen oder Eigenentwicklungen.

Urbane Datenplattfomen bilden eine zentrale Infrastruktur, die Daten aus verschiedenen Quellen einer Stadt oder Region bündeln, verknüpfen und zugänglich machen. Sie ermöglichen eine intelligente und datengestützte Stadtentwicklung, indem sie Kommunen helfen, Daten aus unterschiedlichen Fachbereichen und für unterschiedliche Zielgruppen (Verwaltung, Wirtschaft, Zivilgesellschaft) bereitzustellen und daraus nützliche Dienste und Analysen zu entwickeln.

Mit dem Berliner Data Hub bestreitet nun auch das Land Berlin den Weg zur Etablierung einer urbanen Datenplattform. Der Data Hub-Prototyp fußt auf dem Open Source-Code und Architekturmodell des CIVITAS/CORE.

info

Was eine urbane Datenplattform leistet, ist über die DIN SPEC 91357:2017-12 festgehalten, allerdings sehr breit definiert. Das Bundesinstitut für Bau-, Stadt- und Raumforschung (BBSR) hat in einer Veröffentlichung von 2025 die Funktionsweisen beschrieben und verschiedene bestehende Lösungen verglichen.

Mehr zu urbanen Datenplattformen in der Veröffentlichung des BBSR

Grundprinzipien des Data Hub

Wichtig zu wissen ist, dass es sich beim Data Hub nicht um eine einzelne Software-Lösung handelt, sondern um eine modulare Architektur. Das bedeutet, der Data Hub besteht aus einer Zusammenstellung von verschiedenen Open Source-Software-Tools, die in einer gemeinsamen Infrastruktur aufgesetzt und über Schnittstellen miteinander verbunden sind. Ein Rechte- und Rollenmanagement regelt den Zugriff auf die Tools und bestimmt, wer welche Aspekte des Hub mit welchen Daten verwenden kann. Alle Tools sind im Browser verfügbar und ohne den Download von Software nutzbar. Kurzgefasst fußt der Data Hub auf vier Prinzipien:

  • Cloud-Native-Technologien
  • hoher Kompatibilität und Skalierbarkeit
  • Open Source und Anbieterunabhängigkeit
  • einem modularen Aufbau im Baukasten-Prinzip

Die Vorteile eines Data Hub für Berlin

Der Data Hub Berlin ist mehr als nur eine technische Plattform – er ist ein strategisches Instrument für eine moderne, vernetzte und datengetriebene Verwaltung. Folgende Vorteile beziehungsweise Effekte soll er für die Berliner Verwaltung bewirken:

  1. Effizienz und Kostentransparenz

    Der Data Hub soll nicht nur die Datenbereitstellung verbessern, sondern auch messbare Einsparungen ermöglichen. Durch die Nutzung von Open Source-Software, standardisierten Schnittstellen und zentralisierten Datenservices können redundante Entwicklungen und teure Lizenzkosten reduziert werden. Gleichzeitig ermöglicht die transparente Infrastruktur der Verwaltung, Arbeitsabläufe effizienter zu gestalten und Ressourcen gezielter einzusetzen – so trägt der Data Hub direkt zur Kostenoptimierung in Berliner Behörden bei.

  2. Digitale Souveränität und Kompetenzaufbau

    Der Data Hub trägt langfristig dazu bei, die digitale Souveränität der Berliner Verwaltung zu stärken. Durch den konsequenten Einsatz von Open Source-Software, offenen Standards und modularen Architekturen reduziert er die Abhängigkeit von proprietären Lösungen. Gleichzeitig werden bei der Nutzung und Weiterentwicklung der Plattform neue Kompetenzen in Datenmanagement, Analyse und Softwareentwicklung innerhalb der Verwaltung aufgebaut. So entsteht nicht nur eine unabhängige Infrastruktur, sondern auch ein Wissens- und Kompetenzpool, der zukünftige Projekte effizienter und selbstbestimmter ermöglicht.

  3. Verwaltungsdigitalisierung und Interoberabilität

    Der Data Hub fördert nicht nur datengetriebenes Entscheiden und ermöglicht es, analoge Produkte wie PDF‑Berichte in digitale, maschinenlesbare Formen zu überführen, sondern treibt insgesamt die Verwaltungsdigitalisierung voran. Langfristig unterstützt er auch die bessere Zusammenarbeit zwischen den Fachabteilungen in Ämtern, indem er Standards etabliert, die geteilt werden können, um Interoperabilität und Datenqualität zu erhöhen. Durch diese gemeinsame Grundlage entstehen Schnittstellen, die neue Datenprodukte, Analysemöglichkeiten und Prozessoptimierungen ermöglichen – der Data Hub wirkt somit als Booster für effizientere und vernetzte Verwaltung.

  4. Grundlage für Innovationen wie KI-Tools, das Internet of Things (IoT) und den digitalen Zwilling

    Der Data Hub dient als zentrale Dateninfrastruktur, die dringend notwendig ist, um zukunftgerichtete Innovationen aufzubauen. Zuküntig könnte er beispielsweise KI-Anwendungen mit hochwertigen, standardisierten Verwaltungsdaten unterstützen und die Nutzung von IoT-Daten aus städtischen Sensoren erleichtern. Außerdem soll er die Basis für einen digitalen Zwilling Berlins legen, indem Daten konsistent gesammelt, vernetzt und visualisierbar gemacht werden. So entstehen die Voraussetzungen für smarte, datengetriebene Lösungen – von vorausschauender Planung über optimierte Services bis hin zu neuen Anwendungen für Bürgerinnen und Bürger sowie Unternehmen.

Strategischer Rahmen

Der Aufbau des Data Hub Berlin ist ein seit einigen Jahren angestrebtes Vorhaben, als zentrale Maßnahme der Strategie „Gemeinsam Digital: Berlin“ entsprechend der Richtlinien der Berliner Regierungspolitik.

Gemeinsam Digital: Berlin

Gemeinsam Digital: Berlin (GD: B) ist die Dachstrategie des Landes Berlin, die Strategien zur Smart City, Digitalisierung und Verwaltungsmodernisierung (einschließlich digitaler Bürgerdienste) zusammenführt. Die in der Strategie festgelegte Maßnahme

„Aufbau einer übergreifenden internen und öffentlichen Dateninfrastruktur (Data Hub und Open Data Portal)“

wird mit dem Data Hub Realität. Für eine gelungene digitale Transformation der Berliner Verwaltung braucht es eine zukunftssichere technische Infrastruktur, zentral definierte, interoperable Standards sowie Schnittstellen und entsprechend angebundene Datenquellen. Vor diesem Hintergrund wird der Data Hub Berlin als zentrale Dateninfrastruktur aufgebaut.

Zur GD: B-Strategie des Landes Berlin

Pilotphase und Prototyp

Die Entwicklung eines so umfassenden IT-Infrastrukturprojekts erfordert agile Prozesse und enge Zusammenarbeit in der Praxis. In einer Pilotphase wird der Data Hub prototypisch aufgebaut. Diese frühe Version dient dazu den Data Hub gezielt zu erproben und stetig weiter zu entwickeln, um alle Anforderungen für eine Verstetigung und den Produktivbetrieb zu identifizieren. Dabei werden sowohl technische als auch organisatorische Rahmenbedingungen betrachtet, um nachhaltige Mehrwerte für ein breites Spektrum an Nutzenden zu schaffen.

Zusammenarbeit von Technologiestiftung Berlin und Berliner Senatskanzlei

Aktuell wird die Plattform in einer Pilotphase durch die Abteilung CityLAB Berlin der Technologiestiftung Berlin im Rahmen einer Zuwendung der Senatskanzlei Berlin getestet. Seit April 2025 steht sie als prototypische Instanz zur Verfügung. Die Technologiestiftung begleitet die Pilotprojekte fachlich und organisatorisch, setzt diese gemeinsam mit den Pilotnutzenden um und betreibt den Prototypen in Zusammenarbeit mit einem technischen Dienstleister. Als gesamtstädtische Plattform lebt der Data Hub aber auch von der Mitwirkung vieler: In der AG Data Hub bringen sich Senatsverwaltungen und Bezirksämter ein, auch die Pilotnutzenden kommen aus verschiedenen Bereichen der Berliner Verwaltung. Parallel zur Pilotphase bereitet die Senatskanzlei die Verstetigung des Data Hub als dauerhafte Dateninfrastruktur für das Land Berlin vor.

Der Prototyp als Lern- und Diskussionsraum

Seit April 2025 steht eine erste Version des Data Hub als prototypische Instanz zur Verfügung. Ein Prototyp ist mehr als eine technische Vorstufe – er ist ein Werkzeug zum Denken, Testen und Lernen. Beim Data Hub Berlin dient der Prototyp dazu, zentrale Annahmen über Architektur, Prozesse und Zusammenarbeit unter realen Bedingungen zu überprüfen, bevor eine umfassende Umsetzung erfolgt. Statt monatelang abstrakte Konzepte zu planen, ermöglicht der Prototyp, frühzeitig konkrete Erfahrungen zu sammeln: Welche Datenflüsse funktionieren? Wo entstehen Reibungen zwischen Fachverfahren, Technik und Organisation? Und welche Anforderungen stellen künftige Nutzende? Durch dieses iterative Vorgehen wird nicht nur Technik entwickelt, sondern auch ein gemeinsames Verständnis dafür, wie datengetriebene Verwaltung funktionieren kann. Der Prototyp schafft also die Grundlage für informierte Entscheidungen und reduziert langfristig Risiken, Kosten und Fehlentwicklungen.

Umsetzung erster Use Cases

Die Pilotphase für die ersten Anwendungsfälle begann im Sommer 2025 mit der ersten Version des Prototypen. Zusammen mit der Senatsverwaltung für Stadtentwicklung, Bauen und Wohnen (SenSBW), der Senatsverwaltung für Arbeit, Soziales, Gleichstellung, Integration, Vielfalt und Antidiskriminierung (SenASGIVA) sowie den Bezirken Neukölln und Pankow werden vier konkrete Anwendungsfälle erprobt. Weitere Pilotprojekte sollen in 2026 folgen. Die Erkenntnisse aus den Use Cases fließen in die Weiterentwicklung des Berliner Data Hub. So stellen wir sicher, dass die Plattform die Bedarfe der Berliner Verwaltung in der Arbeit mit Daten bestmöglich erfüllt. Außerdem können mit der Zeit weitere Komponenten aus der CIVITAS/CORE-Weiterentwicklung in den Berliner Data Hub integriert werden.

Hinweis

Um die erfolgreiche Umsetzung von Use Cases in der Pilotphase zu gewährleisten, erfolgt diese in enger Begleitung durch das Kompetenzteam der Technologiestiftung Berlin. Gemeinsam werden die Projektziele an die technischen Möglichkeiten des Data Hub angepasst und eine Timeline festgelegt. Erst dann erfolgt der Zugang zu den individuellen Komponenten des Data Hub.

Die Architektur des CIVITAS/CORE als Grundlage

Der CIVITAS/CORE-Stack bildet das technische Rückgrat des Data Hub Berlin: Als offene, modulare Plattform ermöglicht CIVITAS/CORE eine urbane Dateninfrastruktur, die Städte und Kommunen frei betreiben und adaptieren können. Der gemeinschaftliche Architektur-Stack bietet sich an, weil er hohe Wiederverwendbarkeit, geringere Kosten und mehr technologische Unabhängigkeit bietet. Statt vieler Einzelentwicklungen entsteht ein standardisierter Kern, der jeweils an lokale Anforderungen angepasst wird.

Open Source als zentraler Aspekt

Open Source ist dabei kein Nebenaspekt, sondern zentral: Durch Transparenz und Mitwirkung in der Entwickler-Community gewinnen alle Beteiligten an Souveränität und Lock-in-Effekte werden vermieden. Die Entwicklergemeinschaft hinter CIVITAS/CORE – die Civitas Connect e. V. mit ihren Mitgliedsstädten und kommunalen Unternehmen – bündelt Anforderungen, entwickelt gemeinsam und steuert die Roadmap im kollektiven Konsens.

Der CIVITAS/CORE ist cloud-nativ aufgebaut und basiert vollständig auf Kubernetes, wodurch er flexibel skalierbar ist. Diese Architektur ermöglicht es Städten und Kommunen, die Plattform entweder eigenständig zu betreiben oder durch verschiedene technische Dienstleister betreiben zu lassen, ohne Abhängigkeit von einzelnen Herstellern oder proprietären Infrastrukturen.

Im folgenden Video von Civitas Connect wird der CIVITAS/CORE anschaulich vorgestellt. Es erklärt, welche Ziele die Initiative verfolgt und welche Vorteile die gemeinsame Open Source-Basis Städten und Kommunen bietet.

Anpassung von CIVITAS/CORE für Berlin

Für Berlin bedeutet das: Wir können diese offen verfügbare Plattform nutzen, um an einem modernen, breit aufgestellten Software-Projekt und deren kommenden Weiterentwicklung teilzuhaben. Gleichzeitig müssen wir explorieren, wie wir den CORE für uns einsetzen, wie wir ihn an unsere Verwaltungs- und Organisationsstruktur anpassen und wie eine Governance-Instanz entsteht, die den Berliner Rahmenbedingungen gerecht wird. So wird aus einer generischen Plattformlösung eine passgenaue, kommunalspezifische Infrastruktur: der Berliner Data Hub.

info

Weitere Informationen zum CIVITAS/CORE-Framework und den beteiligten Städten findest du auf der Website von Civitas Connect. Einen tieferen Einblick in die Entstehungsgeschichte, Ziele und den Open Source-Ansatz des Projekts bietet außerdem der CityLAB-Podcast „Vom Datenchaos in die digitale Souveränität mit Ralf Leufkes und Lisa Stubert".

Offizielle Website zu CIVITAS/CORE

Zum Podcast des CityLAB Berlin zum CIVITAS/CORE