Protokollierungsanforderungen für KI-Systeme im Produktionsbetrieb
KI-Systeme, die in hochrelevanten Kontexten eingesetzt werden, unterliegen wachsenden Protokollierungsanforderungen aus Regulierung, Normung und Best Practices der Governance. Das Verständnis dieser Anforderungen ist für Engineering- und Compliance-Teams gleichermaßen essenziell.
Überblick über die anwendbaren Protokollierungsanforderungen
KI-Systeme unterliegen Protokollierungsanforderungen aus mehreren regulatorischen und normativen Quellen. Der EU AI Act (Verordnung 2024/1689) schreibt gemäß Artikel 12 die automatische Protokollierung für Hochrisiko-Systeme vor. Die ISO/IEC 42001 über KI-Managementsysteme empfiehlt Protokollierungsverfahren im Rahmen der Entscheidungsnachverfolgbarkeit. Die DSGVO schreibt die Protokollierung automatisierter Verarbeitungen vor, wenn personenbezogene Daten betroffen sind. Für Finanzsysteme, die KI einsetzen, fügen sektorale Regulierungen (EBA, EZB, AMLA) weitere Anforderungen an Prüfpfade hinzu.
Protokollierung von Trainingsdaten vs. operative Protokollierung
Für KI-Systeme sind zwei Protokollierungsebenen zu unterscheiden. Die operative Protokollierung erfasst Entscheidungen und Ereignisse im Produktionsbetrieb: Eingaben, Ausgaben, Zeitstempel, Sitzungs-IDs. Die Protokollierung von Trainingsdaten dokumentiert Herkunft und Merkmale der Daten, die zum Aufbau des Modells verwendet wurden. CertifiedData ist auf diese zweite Ebene spezialisiert: Jeder synthetische Datensatz erzeugt ein Zertifikat, das seinen Generierungsalgorithmus, seine Struktur und seinen kryptografischen Fingerabdruck dokumentiert und damit einen dauerhaften, verifizierbaren Datenherkunftsnachweis schafft.
Resiliente und verifizierbare Protokollierungsarchitekturen
Eine konforme Protokollierungsarchitektur für KI-Systeme muss auf Resilienz und Verifizierbarkeit ausgelegt sein. Resilienz bedeutet, dass Protokolle gegen Systemausfälle, Datenbeschädigungen und Manipulationsversuche geschützt sind. Verifizierbarkeit bedeutet, dass die Integrität jedes Protokolleintrags durch eine externe Partei ohne Zugang zu internen Systemen bestätigt werden kann. CertifiedData implementiert beide Eigenschaften durch Ed25519-Signaturen auf jedem Zertifizierungsartefakt und durch Veröffentlichung in einem öffentlichen Register ohne Authentifizierungserfordernis.
Automatisierung und Integration in MLOps-Pipelines
Operative Effizienz erfordert, dass Protokollierung automatisiert und in bestehende MLOps-Pipelines integriert ist. CertifiedData stellt eine REST-API bereit, die die Zertifizierung von Datenartefakten direkt in Datengenerierungs-Workflows integriert. Nach der Generierung eines synthetischen Datensatzes löst ein einzelner API-Aufruf den Zertifizierungsprozess aus und gibt eine dauerhafte Zertifikats-ID zurück. Diese ID kann in Modellmetadaten, Modellregistern oder Experiment-Tracking-Tools gespeichert werden, um eine nachvollziehbare Verbindung zwischen dem Modell und seinen zertifizierten Trainingsdaten herzustellen.