Das Projekt Hafnia verfolgt einen klaren Anspruch: Die Lücke zwischen Datensammlung, Modelltraining und tatsächlicher Umsetzung zu schließen. Besonders spannend: Hafnia sorgt dafür, dass visuelle KI-Modelle nicht nur aus typischen, oft überrepräsentierten Szenarien lernen, sondern auch auf Ausnahmen reagieren können, die so im echten Leben auftreten. Möglich wird das durch synthetische Daten, die zusammen mit sorgfältig kuratierten Realaufnahmen einen ungewöhnlich vielfältigen Trainingsfundus ergeben – und damit blinde Flecken im KI-Training gezielt beseitigen. Die technische Grundlage ist ein Mix aus NVIDIA-Tools wie CosmosTM, Physical AI Data Factory und OSMOTM, die dafür sorgen, dass das System enorme Datenmengen sowohl aufnimmt als auch intelligent verarbeitet und mit realistischer Präzision für das Modelltraining aufbereitet.
Edward Mauser, als Kopf hinter Hafnia, betont den Sprung: Synthetikdaten sind kein Notbehelf, sondern gezielte Ergänzung – für die Herausforderung, Unvorhergesehenem zu begegnen. Denn nicht jede Stadt, nicht jedes Verkehrsereignis ist planbar oder in historischen Videodaten enthalten. Hafnias System bringt seltene Vorkommnisse, spezielle Regionen oder beispielsweise ungewöhnliche Fahrzeuge gezielt ins Training ein, sodass gerade auch ethische Verzerrungen durch lückenhafte Daten reduziert werden.
Frischer Wind weht auch durch das kommende ‚Training-as-a-Service‘, das Entwickler vor die Wahl stellt, sich aus den Hafnia-Daten zu bedienen und darauf eigene, passgenaue KI-Modelle mittels leistungsstarker Cloud-Infrastruktur zu trainieren. Die Sicherheit, dass alles regulatorisch sauber abläuft, bleibt dabei erhalten, weil Hafnia die Datenherkunft offenlegt und dokumentiert. Nebeneffekt: Die Zeiten aufwändiger, fragmentierter Datenbeschaffung fallen weg, die Entwicklung kann laut Anbieter um bis zu 30-mal beschleunigt werden.
Zusätzlich ist mit dem Visual-Language-Model-as-a-Service (VLMaaS) ein weiterer Baustein im Angebot: KI-Modelle speziell zugeschnitten auf europäische Städte, etwa für Verkehrsanalysen – bereits aktiv im Praxiseinsatz. Abgesehen von cleverem Training bietet Hafnia eine Multi-Cloud-Strategie mit Anbindung an Big Player wie AWS und Nebius, sodass auch das sensible Thema Datensouveränität nicht zu kurz kommt.
Wer sich einen eigenen Eindruck machen will: Am NVIDIA-GTC-Stand von Milestone gibt es Live-Demos und Einblicke in die neuen Möglichkeiten, wie KI uns in Smart Cities unterstützen könnte. Der Ansatz von Milestone: KI-Entwicklung als offener, schneller und gerechter Prozess – mit Fokus auf die Herausforderungen von morgen, nicht nur auf die Lösungen von gestern.
Milestone Systems will mit Hafnia bestehende Grenzen des KI-Trainings überwinden: Synthetische Daten ergänzen reale Aufnahmen, um auch ungewöhnliche oder bislang nicht beobachtete Situationen modellieren zu können. Mit der neuen Training-as-a-Service-Lösung (TaaS) erhalten Entwickler direkten Zugang zu hochwertigen, konformen Datensätzen und leistungsstarker Trainingsinfrastruktur, wodurch sie eigene KI-Modelle effizient und rechtskonform entwickeln können. Die Multi-Cloud-Anbindung sichert Datensouveränität; gehostete Visual Language Models (VLM) für smarte Verkehrsanalysen sind bereits als Praxisbeispiele verfügbar und sollen künftig auf weitere Bereiche ausgeweitet werden.
Weitere Recherche zeigt, dass derzeit insbesondere synthetische Daten im KI-Bereich als Ausweg gegen Bias und mangelnde Diversität der Trainingsdaten diskutiert werden. Laut einem Bericht auf t3n.de verfolgen auch andere Unternehmen wie Google und Meta das Ziel, KI-Modelle mit künstlich erzeugten, aber hochrealistischen Bild- und Videodaten zu verbessern, etwa, um seltene medizinische Fälle besser zu erfassen. Die EU nimmt parallel die regulatorische Herausforderung ins Visier: Wie sueddeutsche.de berichtet, arbeitet die EU an verbindlichen Regeln für den Umgang mit KI-Trainingsdaten, wobei Datenschutz und Nachvollziehbarkeit künftig eine noch größere Rolle spielen werden (Quelle findet sich in den Erweiterungen). Nicht zuletzt warnen Stimmen auf krautreporter.de und perspective-daily.de davor, dass synthetische Daten zwar Potenziale bergen, aber auch den Aufwand für transparente Dokumentation und Absicherung gegen neue Verzerrungen erhöhen.