Zum Hauptinhalt springen

Einführung zum
Data Hub Berlin

Daten sind die Grundlage für gutes Verwaltungshandeln, Planung und Innovation. Hier erfährst du, wie der Data Hub Berlin im Rahmen der bestehenden Strategien angesiedelt ist, eine gemeinsame, offene Infrastruktur aufbaut und wie durch einen prototypischen Ansatz erste Anwendungsfälle erprobt werden.

Wissensspeicher Logo

Was ist der Data Hub Berlin?

Von der Visualisierung über Statistiken und interne digitale Monitoringberichte bis hin zu Kartenanwendungen: In der Berliner Verwaltung gibt es eine Vielzahl an datenbasierten Aufgaben. Mit dem Data Hub Berlin entsteht eine ressortübergreifende, zentrale Infrastruktur für die Berliner Verwaltung, um effizient mit Daten arbeiten zu können. Erstmalig kann die Verwaltung somit auf passgenaue Software-Komponenten zurückgreifen, mit denen sich Daten verarbeiten und visualisieren lassen, zum Beispiel in Form von Dashboards. Der Data Hub Berlin ebnet damit den Weg zu einer datengetriebenen Verwaltung. Er soll langfristig den zentralen Knotenpunkt für die bestehenden dezentralen Systeme der Stadt bilden und die bestehende IT-Landschaft Berlins ergänzen.

Derzeit erarbeitet das Kompetenzteam der Technologiestiftung Berlin und der Senatskanzlei Berlin eine prototypische Variante des Data Hubs, sowie verschiedene Anwendungsfälle, um die vielfältigen Möglichkeiten dieser Infrastruktur besser zu verstehen, zu erproben und einen Echtbetrieb bestmöglich vorzubereiten.

Eine urbane Datenplattform für Berlin

Beim Data Hub Berlin handelt es sich um eine sogenannte urbane Datenplattform. Viele Kommunen und Städte betreiben oder entwickeln derzeit urbane Datenplattformen, z.B. Potsdam, Bonn, Frankfurt und Hamburg. Dafür setzen sie teils auf bereits etablierte Lösungen oder Eigenentwicklungen.

Urbane Datenplattfomen sollen eine zentrale digitale Infrastruktur bilden, die Daten aus verschiedenen Quellen einer Stadt oder Region bündeln, verknüpfen und zugänglich machen. Urbane Datenplattformen ermöglichen eine intelligentere und datengestützte Stadtentwicklung, indem sie Kommunen helfen, Daten aus unterschiedlichen Fachbereichen und für unterschiedliche Zielgruppen (Verwaltung, Wirtschaft, Zivilgesellschaft) bereitzustellen und daraus nützliche Dienste und Analysen zu entwickeln.

Mit dem Berliner Data Hub bestreitet nun auch das Land Berlin den Weg zur Etablierung einer urbanen Datenplattform. Der Data Hub Prototyp fußt auf dem Open Source Code und Architekturmodell des CIVITAS/CORE.

info

Was eine urbane Datenplattform leistet, ist über die DIN SPEC 91357:2017-12 festgehalten, allerdings sehr breit definiert. Das Bundesinstitut für Bau-, Stadt- und Raumforschung (BBSR) hat in einer Veröffentlichung von 2025 die Funktionsweisen beschrieben und verschiedene bestehende Lösungen verglichen.

Mehr zu urbanen Datenplattformen in der Veröffentlichung des BBSR

Grundprinzipien des Data Hubs

Wichtig zu wissen ist, dass es sich beim Data Hub nicht um eine einzelne Software-Lösung handet, sondern um eine modulare Architektur. Das bedeutet der Data hub besteht aus einer Zusammenstellung von verschiedenen Open Source Software-Tools, die in einer gemeinsamen Infrastruktur aufgesetzt und über Schnittstellen miteinander verbunden sind. Ein Rechte- und Rollenmanagement regelt den Zugriff auf die Tools, und bestimmt wer welche Aspekte des Hubs mit welchen Daten verwenden kann. Alle Tools sind im Browser verfügbar ohne Download von Software nutzbar. Kurzgefasst fußt der Data Hub auf vier Prinzipien:

  • Cloud-Native-Technologien
  • hohe Kompatibilität und Skalierbarkeit
  • komplett Open Source und Anbieterunabhängig
  • modularer Aufbau im Baukasten-Prinzip

Die Vorteile eines Data Hubs für Berlin

Der Data Hub Berlin ist mehr als nur eine technische Plattform – er ist ein strategisches Instrument für eine moderne, vernetzte und datengetriebene Verwaltung. Folgende Vorteile bzw. Effekte soll er für die Berliner Verwaltung bewirken:

  1. Effizienz und Kostentransparenz

    Der Data Hub soll nicht nur die Datenbereitstellung verbessern, sondern auch messbare Einsparungen ermöglichen. Durch die Nutzung von Open Source Software, standardisierten Schnittstellen und zentralisierten Datenservices können redundante Entwicklungen und teure Lizenzkosten reduziert werden. Gleichzeitig ermöglicht die transparente Infrastruktur der Verwaltung, Arbeitsabläufe effizienter zu gestalten und Ressourcen gezielter einzusetzen – so trägt der Data Hub direkt zur Kostenoptimierung in Berliner Behörden bei.

  2. Digitale Souveränität und Kompetenzaufbau

    Der Data Hub trägt langfristig dazu bei, die digitale Souveränität der Berliner Verwaltung zu stärken. Durch den konsequenten Einsatz von Open Source Software, offenen Standards und modularen Architekturen reduziert er die Abhängigkeit von proprietären Lösungen. Gleichzeitig werden bei der Nutzung und Weiterentwicklung des Hubs neue Kompetenzen in Datenmanagement, Analyse und Softwareentwicklung innerhalb der Verwaltung aufgebaut. So entsteht nicht nur eine unabhängige Infrastruktur, sondern auch ein Wissens- und Kompetenzpool, der zukünftige Projekte effizienter und selbstbestimmter ermöglicht.

  3. Verwaltungsdigitalisierung und Interoberabilität

    Der Data Hub fördert nicht nur datengetriebenes Entscheiden und ermöglicht es analoge Produkte wie PDF‑Berichte in digitale, maschinenlesbare Formen zu überführen, sondern treibt insgesamt die Verwaltungsdigitalisierung voran. Langfristig unterstützt er auch die bessere Zusammenarbeit zwischen den Fachabteilungen Ämtern, indem er Standards etabliert, die geteilt werden können, um Interoperabilität und Datenqualität zu erhöhen. Durch diese gemeinsame Grundlage entstehen Schnittstellen, die neue Datenprodukte, Analysemöglichkeiten und Prozessoptimierungen ermöglichen – der Data Hub wirkt somit als Booster für effizientere und vernetzte Verwaltung.

  4. Grundlage für Innovationen wie KI-Tools, IoT und den digitalen Zwilling

    Der Data Hub dient als zentrale Dateninfrastruktur, die dringend notwendig ist um zukunftgerichtete Innovationen aufzubauen. Zuküntig könnte er beispielsweise KI-Anwendungen mit hochwertigen, standardisierten Verwaltungsdaten unterstützen und die Nutzung von IoT-Daten aus städtischen Sensoren erleichtern. Außerdem soll er die Basis für einen digitalen Zwilling Berlins legen, indem Daten konsistent gesammelt, vernetzt und visualisierbar gemacht werden. So entstehen die Voraussetzungen für smarte, datengetriebene Lösungen – von vorausschauender Planung über optimierte Services bis hin zu neuen Anwendungen für Bürger:innen und Unternehmen.

Strategischer Rahmen

Der Aufbau des Data Hub Berlin ist keine neue Einzelinitiative, sondern eine seit einigen Jahren angestrebtes Vorhaben.

Die KPMG hat bereits 2019 eine Studie mit dem Titel „Konzept eines Data Hubs zur Vernetzung städtischer Datenquellen“ veröffentlicht, die als Grundlage für die Berliner Open Data-Strategie diente. Diese Studie wurde im Auftrag der Senatsverwaltungen für Wirtschaft, Energie und Betriebe (SenWiEnBe) sowie für Inneres und Sport (SenInnDS) erstellt. Sie lieferte konzeptionelle Vorschläge für die Entwicklung eines zentralen Data Hubs, der verschiedene städtische Datenquellen miteinander verknüpfen soll. Im Rahmen dieser Studie wurden unter anderem auch Empfehlungen zur Daten-Governance, zur Schaffung einer gemeinsamen Infrastruktur sowie zur Festlegung eindeutiger Verantwortlichkeiten und erforderlicher Kompetenzen im Umgang mit dem Data Hub ausgesprochen.

In den nachfolgenden Jahren wurde der Data Hub als eine zentrale Maßnahme in die Strategie „Gemeinsam Digital: Berlin“ aufgenommen. Er ist außerdem Teil der Richtlinie der Berliner Regierung zur Verwaltungsmodernisierung und gliedert sich in den strategischen Rahmen der Open Data und Open Source Strategien des Landes ein.

Gemeinsam Digital:Berlin

Gemeinsam Digital:Berlin (GD:B) ist die Dachstrategie des Landes Berlin, die Strategien zur Smart City, Digitalisierung und Verwaltungsmodernisierung (einschließlich digitaler Bürgerdienste) zusammenführt. Die in der Strategie festgelegte Maßnahme

„Aufbau einer übergreifenden internen und öffentlichen Dateninfrastruktur (Data Hub und Open Data Portal)“

wird mit dem Data Hub Realität. Ziel ist, dass Datenbestände der Berliner Verwaltung nicht mehr lokal in einzelnen Ämtern oder Fachverfahren verbleiben, sondern über eine zentrale Infrastruktur verwaltet und geteilt werden.

Zur GD:B-Strategie des Landes Berlin

Pilotphase und Prototyp

Die Entwicklung eines so umfassenden IT-Infrastrukturprojektes erfordert agile Prozesse und enge Zusammenarbeit in der Praxis. In einer Pilotphase wird der Data Hub prototypisch aufgebaut – also in einer frühen Version, die gezielt getestet, erprobt und stetig weiterentwickelt wird –, um alle Anforderungen für eine Verstetigung und den Produktivbetrieb zu identifizieren. Dabei werden sowohl technische als auch organisatorische Rahmenbedingungen betrachtet, um nachhaltige Mehrwerte für ein breites Spektrum an Nutzenden zu schaffen.

Zusammenarbeit von Technologiestiftung Berlin und Berliner Senatskanzlei

Die Pilotphase des Data Hubs wird von der Technologiestiftung Berlin und der Berliner Senatskanzlei partnerschaftlich im Rahmen einer Zuwendung koordiniert. Die Technologiestiftung begleitet die Pilotprojekte fachlich und organisatorisch, setzt diese gemeinsam mit den Pilotnutzenden um und betreibt den Prototypen in Zusammenarbeit mit einem technischen Dienstleister. In den Jahren 2025 und 2026 soll somit der Grundstein gelegt werden. Als gesamtstädtische Plattform lebt der Data Hub aber auch von der Mitwirkung Vieler: In der AG Data Hub bringen sich Senatsverwaltungen und Bezirksämter ein und auch die Pilotnutzenden kommen aus verschiedenen Bereichen der Berliner Verwaltung. Parallel zur Pilotphase bereitet die Senatskanzlei die Verstetigung des Data Hubs als dauerhafte Dateninfrastruktur für das Land Berlin vor.

Der Prototyp als Lern- und Diskussionsraum

Seit April 2025 steht eine erste Version des Data Hubs als prototypische Instanz zur Verfügung. Ein Prototyp ist mehr als eine technische Vorstufe – er ist ein Werkzeug zum Denken, Testen und Lernen. Beim Data Hub Berlin dient der Prototyp dazu, zentrale Annahmen über Architektur, Prozesse und Zusammenarbeit unter realen Bedingungen zu überprüfen, bevor eine umfassende Umsetzung erfolgt. Statt monatelang abstrakte Konzepte zu planen, ermöglicht der Prototyp, frühzeitig konkrete Erfahrungen zu sammeln: Welche Datenflüsse funktionieren? Wo entstehen Reibungen zwischen Fachverfahren, Technik und Organisation? Und welche Anforderungen stellen künftige Nutzende? Durch dieses iterative Vorgehen wird nicht nur Technik entwickelt, sondern auch ein gemeinsames Verständnis dafür, wie datengetriebene Verwaltung funktionieren kann. Der Prototyp schafft also die Grundlage für informierte Entscheidungen und reduziert langfristig Risiken, Kosten und Fehlentwicklungen.

Umsetzung erster Use Cases

Die Pilotphase für die ersten Anwendungsfälle begann im Sommer 2025 mit der ersten Version des Prototypen. Zusammen mit der Senatsverwaltung für Stadtentwicklung, Bauen und Wohnen (SenSBW), der Senatsverwaltung für Arbeit, Soziales, Gleichstellung, Integration, Vielfalt und Antidiskriminierung (SenASGIVA), den Bezirken Neukölln und Pankow – werden vier konkrete Anwendungsfälle erprobt. Weitere Pilotprojekte sollen in 2026 folgen. Die Erkenntnisse aus den Use Cases fließen in die Weiterentwicklung des Berliner Data Hub. So stellen wir sicher, dass die Plattform die Bedarfe der Berliner Verwaltung in der Arbeit mit Daten bestmöglich erfüllt. Außerdem können mit der Zeit weitere Komponenten aus der CIVITAS/CORE-Weiterentwicklung in den Berliner Data Hub integriert werden.

Die Architektur des CIVITAS/CORE als Grundlage

Der CIVITAS/CORE-Stack bildet das technische Rückgrat des Data Hub Berlin: Als offene, modulare Plattform ermöglicht CIVITAS/CORE eine urbane Dateninfrastruktur, die Städte und Kommunen frei betreiben und adaptieren können. Der gemeinschaftliche Architektur-Stack bietet sich an, weil er hohe Wiederverwendbarkeit, geringere Kosten und mehr technologische Unabhängigkeit bietet, statt viele Einzelentwicklungen entsteht ein standardisierter Kern, der jeweils an lokale Anforderungen angepasst wird.

Open Source als zentraler Aspekt

Open Source ist dabei kein Nebenaspekt, sondern zentral: Durch Transparenz und Mitwirkung in der Entwickler-Community gewinnen alle Beteiligten an Souveränität, und Lock-in-Effekte werden vermieden. Die Entwicklergemeinschaft hinter CIVITAS/CORE – die Civitas Connect e. V. mit ihren Mitgliedsstädten und kommunalen Unternehmen, bündelt Anforderungen, entwickelt gemeinsam und steuert die Roadmap im kollektiven Konsens.

Der CIVITAS/CORE ist cloud-nativ aufgebaut und basiert vollständig auf Kubernetes, wodurch er flexibel, skalierbar ist. Diese Architektur ermöglicht es Städten und Kommunen, die Plattform entweder eigenständig zu betreiben oder durch verschiedene technische Dienstleister betreiben zu lassen, ohne Abhängigkeit von einzelnen Herstellern oder proprietären Infrastrukturen.

Im folgenden Video von Civitas Connect wird der CIVITAS/CORE anschaulich vorgestellt. Es erklärt, welche Ziele die Initiative verfolgt und welche Vorteile die gemeinsame Open-Source-Basis Städten und Kommunen bietet.

Anpassung von CIVITAS/CORE für Berlin

Für Berlin bedeutet das: Wir können diese offen verfügbare Plattform nutzen, um von einem modernen, breit aufgestellten Software-Projekt und den kommenden Weiterentwicklungen teilzuhaben. Gleichzeitig müssen wir explorieren, wie wir den CORE für uns einsetzen, wie wir ihn an unsere Verwaltungs- und Organisationsstruktur anpassen und wie eine Governance-Instanz entsteht, die den Berliner Rahmenbedingungen gerecht wird. So wird aus einer generischen Plattformlösung eine passgenaue, kommunalspezifische Infrastruktur: der Berliner Data Hub.

info

Weitere Informationen zum CIVITAS/CORE-Framework und den beteiligten Städten findest du auf der Website von Civitas Connect. Einen tieferen Einblick in die Entstehungsgeschichte, Ziele und den Open-Source-Ansatz des Projekts bietet außerdem der CityLAB-Podcast „Vom Datenchaos in die digitale Souveränität mit Ralf Leufkes und Lisa Stubert".

Offizielle Website zu CIVITAS/CORE

Zum Podcast des CityLAB Berlin zum CIVITAS/CORE