Zum Hauptinhalt springen

MinIO

MinIO ist ein Cloud-Speicher zur Ablage von Dateien und Objektdaten. Er kann genutzt werden, um Daten für den Data Hub zur Verfügung zu stellen.

Was ist MinIO?

Objektbasierter Speicher für große und kleine Dateien

MinIO ist ein leichtgewichtiges, hochperformantes Open Source-Objektspeicher-System, welches das S3-Protokoll implementiert. MinIO übernimmt die Aufgabe, Dateien in verschiedensten Formaten sicher und versioniert abzulegen und zu teilen. Durch S3-Kompatibilität lassen sich bestehende Werkzeuge und Bibliotheken direkt anbinden.

MinIO Logo

MinIO im Data Hub

MinIO bildet zusammen mit den Datenbanken das Dateispeicher-Rückgrat des Data Hub. Es ist der zentrale Ablageort für Rohdaten, Export-Dateien aus Fachverfahren, Container-Images, Modelle oder große Geodatenpakete. Die Vorteile liegen in einfacher Integration (S3 API), feingranularer Zugriffssteuerung und der Möglichkeit, Daten sowohl intern als auch für externe Projekte sicher freizugeben. Eine unkomplizierte Ablage für beliebige Dateitypen (Data Lake-Charakter) ist durch eine webbasierte Benutzeroberfläche für Upload, Download und Management der Dateien sichergestellt.

Projektübersicht in MinIO
Projektübersicht in MinIO

Funktionen & Einsatzgebiete

MinIO bietet im Data Hub insbesondere folgende Mehrwerte:

  • Cloud-Speicherort für bestehende Daten, die im Data Hub verfügbar gemacht werden sollen und für die keine andere Möglichkeit zur Speicherung besteht (z.B. weil schlichtweg keine entsprechende IT-Infrastruktur vorhanden ist).
  • Zugriff über S3-API für automatisierte Workflows von ELT-Prozessen
  • Cloud-Speicherort für neue Daten, die durch ETL-Prozesse im Data Hub generiert oder veredelt wurden und als Dateien zur Verfügung gestellt werden sollen.
Fiktives Praxisbeispiel

„Monitoring von Kita-Plätzen“ 📂
Ein Fachamt legt jeden Monat einen Datensatz mit Auslastungszahlen für Kitas in MinIO ab. Die Daten stehen so für einen konfigurierten ETL-Prozess zur Verfügung. Dieser berechnet automatisch Kennzahlen wie freie Plätze pro Bezirk, Belegungsquoten und wartet den Datensatz mit Geokoordinaten der Einrichtungen auf. Der aufbereitete Datensatz wird zurück in MinIO gespeichert und steht dort nun anderen Abteilungen mit berechtigtem Zugriff für eigene Planungen und Berichte zur Verfügung.

Wie nutzt man MinIO?

Skill-Level & Anforderungen

MinIO ist bewusst benutzerfreundlich gehalten: Für einfaches Ablegen, Löschen oder Herunterladen von Dateien reicht die Web-Oberfläche. Für das Aufsetzen von Automatisierung sind Basiskenntnisse in HTTP/S und S3-Konzepten hilfreich.

Technisches Know-How notwendig: ●●○○○
Komplexität bzw. Einarbeitungszeit: ●●○○○

👉 Für Verwaltungsmitarbeitende heißt das: Dateiuploads und das Teilen von Links funktionieren wie bei bekannten Cloud-Services. Für das Anlegen von automatisierten Prozessen, ETL-Anbindungen oder Rechtekonfiguration sollten das IT- oder das Data Hub-Kompetenzteam eingebunden werden.

Input & Output

Input

Typische Inputs in MinIO sind:

  • Excel-, CSV-, XML- und JSON-Dateien mit Fachdaten
  • GeoJSON, Rasterdaten und Kartenkacheln
  • Datei-Exporte aus Fachverfahren
  • Backups von Datenbanken, Konfigurations- oder Container-Artefakten
  • Trainingsdaten und Artefakte aus Data Science-Workflows

Beispiele

MinIO kommt unter anderem in drei unserer Pilotprojekte zum Einsatz, um Rohdaten in Form von CSV-Dateien initial im Data Hub abzulegen, und diese somit für die anschließenden Datenverarbeitungsprozesse und dann für Visualisierungen zur Verfügung zu stellen: