"Wir haben Daten" — die größte Lüge in KI-Projekten

„Wir haben Daten." Diesen Satz höre ich im ersten Meeting in fast jedem KI-Projekt. Üblicherweise sagt ihn jemand aus dem Vorstand oder der IT-Direktor. Er sagt ihn mit Überzeugung. Und fast jedes Mal stellt sich heraus, dass es nicht stimmt.

Nicht weil er lügt. Sondern weil „wir haben Daten" im Verständnis der Organisation etwas völlig anderes bedeutet als „wir haben Daten, die für den KI-Einsatz bereit sind".

Vier Systeme, null Konsistenz

Das typische Szenario, das ich in mittelgroßen und großen Unternehmen sehe, sieht so aus: Kundendaten liegen im CRM, operative Daten im ERP, Finanzdaten in einem separaten System, und Berichte werden in Excel erstellt — auf Basis von Exporten aus diesen drei Quellen. Niemand hat sich jemals hingesetzt, um diese Daten miteinander in Einklang zu bringen. Jedes System hat seine eigene Logik, seine eigenen Formate, seine eigenen Felddefinitionen.

Wenn Sie darum bitten, diese Daten an einem Ort zusammenzuführen, stellt sich heraus:

Derselbe Kunde hat drei verschiedene Identifikatoren in drei Systemen.
Adressdaten liegen in unterschiedlichen Formaten und unterschiedlichem Aktualitätsgrad vor.
Manche Felder sind ausgefüllt, manche nicht — und niemand weiß, warum.
Eine Dokumentation der Datenstruktur gibt es nicht, oder sie stammt von 2019 und entspricht nicht dem aktuellen Stand.

Das ist keine Ausnahme. Das ist die Norm.

Die Wahrheit kommt ans Licht, wenn ein Mensch sich an die Daten setzt

Der Moment, in dem die Illusion „wir haben Daten" platzt, ist immer derselbe: wenn jemand — ein Mensch, keine Maschine — sich hinsetzt und versucht, mit diesen Daten eine konkrete Aufgabe zu erfüllen. Keinen Bericht. Kein Dashboard. Eine konkrete Geschäftsaufgabe, die durch KI automatisiert werden sollte.

Und dann beginnt eine Serie von Fragen: „Woher kommt dieser Wert?", „Warum ist dieses Feld leer?", „Ist das aktuell oder historisch?", „Wer ist der Eigentümer dieser Daten?" Auf die meisten dieser Fragen kennt niemand die Antwort — denn niemand hat sie je gestellt. Die Daten waren da, die Systeme liefen, die Leute kamen irgendwie zurecht, mit einem Workaround nach dem anderen.

KI macht keine Workarounds. KI braucht konsistente, vollständige Daten mit klarer Struktur. Und hier beginnt das Problem.

„Wir haben Daten" versus „die Daten sind bereit"

Das sind zwei fundamental verschiedene Aussagen. „Wir haben Daten" bedeutet: Irgendwo in der Organisation existieren digitale Aufzeichnungen über unsere Geschäftstätigkeit. „Die Daten sind bereit" bedeutet: Diese Aufzeichnungen sind konsistent, vollständig, dokumentiert, an einem Ort zugänglich und für einen konkreten Zweck nutzbar.

Zwischen dem einen und dem anderen liegt ein Abgrund. Und dieser Abgrund kostet. Ich habe Projekte gesehen, in denen 70 % des Budgets für die „KI-Einführung" für die Bereinigung der Daten ausgegeben wurden. Nicht für das Modell, nicht für die Integration, nicht für UX — dafür, überhaupt etwas Nutzbares zu haben.

Das ist kein schlechtes Szenario. Das ist ein ehrliches Szenario. Ein schlechtes Szenario ist eines, in dem niemand die Daten prüft, einen Proof of Concept auf Demo-Daten aufbaut und sich dann wundert, dass in der Produktion nichts funktioniert.

Warum sich Unternehmen selbst belügen

Weil die Wahrheit unbequem ist. Dem Vorstand zu sagen „unsere Daten sind nicht bereit für KI" heißt zu sagen, dass Jahre von Investitionen in IT-Systeme nicht das Fundament geliefert haben, das wir brauchen. Das ist ein schwieriges Gespräch. Viel einfacher ist es, „wir haben Daten" zu sagen und zur nächsten Folie mit dem Implementierungsplan überzugehen.

Aber diese Leichtigkeit endet beim ersten Versuch, diese Daten in der Praxis zu nutzen. Und dann stoppt das Projekt entweder (was kostspielig, aber ehrlich ist) oder — schlimmer noch — es läuft mit Gewalt weiter und produziert Ergebnisse, die gut aussehen, aber keinen Bezug zur Realität haben.

Was Sie stattdessen tun sollten

Bevor Sie ein KI-Projekt starten, führen Sie einen Audit der Datenbereitschaft durch. Keinen IT-Audit. Keine Systemüberprüfung. Einen Audit, der einfache Fragen beantwortet:

Wo befinden sich die Daten, die für diese konkrete Aufgabe benötigt werden? Nicht „welche Daten haben wir" — denn diese Frage führt nirgendwohin. Die Frage lautet: Welche Daten brauchen wir für diesen einen, konkreten Anwendungsfall und wo befinden sie sich.
Sind diese Daten systemübergreifend konsistent? Ist Kunde X im CRM derselbe Kunde X im ERP? Stimmen die Werte überein? Sind die Formate kompatibel?
Gibt es Dokumentation? Nicht „allgemeine Systemdokumentation", sondern eine Beschreibung: Was bedeutet jedes Feld, wer füllt es aus, wie oft wird es aktualisiert, welche Werte sind zulässig.
Wer ist der Eigentümer der Daten? Wer ist für ihre Qualität verantwortlich? Wer entscheidet über Änderungen? Wenn die Antwort „niemand" lautet — dann ist das das Erste, was behoben werden muss.
Kann ein Mensch mit diesen Daten die Aufgabe ausführen? Das ist der Test, über den ich im vorherigen Artikel geschrieben habe. Wenn der Experte es nicht kann, wird KI kein Wunder vollbringen.

Ehrlichkeit ist günstiger

Ich weiß, dass das nicht das ist, was der Vorstand beim Kickoff eines KI-Projekts hören möchte. Aber eine ehrliche Bewertung des Datenstands am Anfang ist um ein Vielfaches günstiger als die Entdeckung der Wahrheit mitten im Projekt. Projekte, in denen ich mit dem Kunden den ersten Monat für eine gründliche Datendiagnose aufwende, enden deutlich häufiger erfolgreich als solche, in denen wir sofort ein Modell bauen, „weil wir ja Daten haben".

Die KI-Branche liebt Erfolgsgeschichten. Niemand erzählt von Projekten, die gestorben sind, weil die Daten unbrauchbar waren. Und solche Projekte sind die deutliche Mehrheit.

Wenn beim nächsten Meeting jemand sagt „wir haben Daten" — fragen Sie: „Zeigen Sie mir. Womit genau soll KI arbeiten? Woher nehmen wir diese Daten? Wer ist dafür verantwortlich?" Wenn die Antworten nicht schnell und konkret kommen — ist das ein Signal, dass man bei den Grundlagen beginnen muss, nicht beim Modell.

Wenn Sie ehrlich beurteilen möchten, ob die Daten in Ihrer Organisation für ein KI-Projekt bereit sind, lade ich Sie zum Gespräch ein — Leszek Giza.

"Wir haben Daten" — die größte Lüge in KI-Projekten

Vier Systeme, null Konsistenz

Die Wahrheit kommt ans Licht, wenn ein Mensch sich an die Daten setzt

„Wir haben Daten" versus „die Daten sind bereit"

Warum sich Unternehmen selbst belügen

Was Sie stattdessen tun sollten

Ehrlichkeit ist günstiger

An KI-Beratung interessiert?

Verwandte Artikel

Vier Systeme, null Konsistenz

Die Wahrheit kommt ans Licht, wenn ein Mensch sich an die Daten setzt

„Wir haben Daten" versus „die Daten sind bereit"

Warum sich Unternehmen selbst belügen

Was Sie stattdessen tun sollten

Ehrlichkeit ist günstiger

An KI-Beratung interessiert?

Verwandte Artikel

Wenn ein Mensch es mit Ihren Daten nicht kann, kann es KI auch nicht

Sie brauchen nicht mehr KI-Tools — Sie brauchen jemanden, der "Nein" sagt

Ihr KI-Pilot war "erfolgreich" — deshalb ist nichts daraus geworden