Wenn TenderB sich etwas ausdenkt — was Halluzinationen sind, warum sie passieren und wie Sie mit KI arbeiten, ohne sich zu verbrennen

Das nennt man eine Halluzination, und es passiert bei jedem großen Sprachmodell: bei unserem, bei ChatGPT, Claude, bei Gemini, bei allen. Es ist kein TenderB-spezifischer Bug, und es lässt sich nicht vollständig wegtechnisieren. Was Sie tun können: verstehen, wie es entsteht, und KI so einsetzen, dass solche Fehler abgefangen werden, bevor sie in Ihrer Ausschreibung landen.

Die ehrliche Erklärung in drei Schichten

Drei Eigenschaften jedes LLM — auch unseres — erklären, warum Halluzinationen entstehen:

1. Ein LLM ist ein Textvorhersager, keine Datenbank. Es füllt plausible Wörter ein auf Basis von Mustern in seinen Trainingsdaten. „Aldi + Frankfurt" steckt so stark in den Assoziationen, dass das Modell auf die Frage nach der DC-Adresse eine plausibel klingende Adresse einfüllt — auch wenn diese Adresse nicht in Ihrer Stakeholder-Liste steht. Das Modell weiß nicht, was es nicht weiß.

2. Selbstvertrauen korreliert nicht mit Richtigkeit. Ein Mensch, der zweifelt, klingt anders als ein Mensch, der sicher ist. Bei einem LLM hören Sie diesen Unterschied nicht. Eine Halluzination hat exakt denselben Tonfall wie eine korrekte Antwort. Das ist die gefährlichste Eigenschaft, weil sie Ihr natürliches Gespür für Unzuverlässigkeit ausschaltet.

3. LLMs sind sycophantisch. Sagen Sie mit Nachdruck „nein, Rembrandtstrasse 2", bestätigt das Modell. Sagen Sie „nein, Rembrandtstrasse 5", ebenso. Das ist keine Verifikation, sondern Zustimmung. Wenn das Modell Ihre Korrektur „bestätigt", prüft es nicht — es passt sich an.

Was das für Ihre Arbeitsweise bedeutet

KI ist ein hervorragender Junior-Kollege, der nie sagt „ich weiß es nicht". Das ändert, wie Sie sie einsetzen sollten.

Stark in:

Struktur und Aufbau
Sprache, Tonalität, Umschreiben, Zusammenfassen
Synthese dessen, was in einem von Ihnen bereitgestellten Dokument steht
Ideen generieren und Erstentwürfe erstellen
Compliance-Mapping eines Entwurfs gegen ein vorgegebenes Kriterium

Schwach in:

Faktische Aussagen, die nicht explizit in der Quelle stehen — Adressen, Namen, Beträge, Daten, Kapazitätswerte, Ansprechpartner, Spezifikationen
Alles, was vor Gericht überprüfbar sein muss

Die praktische Regel, die wir jedem Kunden mitgeben: Ist es eine Tatsache, die vor Gericht überprüfbar sein muss, verifizieren Sie sie selbst gegen die Quelle. Die KI darf nachschlagen, zusammenfassen, in Ihren Hausstil bringen — aber die Endkontrolle liegt bei Ihnen.

Was wir als TenderB dem entgegensetzen (und was wir nicht versprechen)

Wir behaupten nicht, Halluzinationen „gelöst" zu haben. Niemand hat das. Was wir tun: die Arbeitsumgebung so gestalten, dass der Mensch zum richtigen Zeitpunkt im Prozess steht:

Retrieval über Ihre eigenen Dokumente. Das Modell schöpft primär aus Ihren Projektdateien und Ihrer Wissensdatenbank statt aus den Trainingsdaten. Das reduziert Halluzinationen bei projektspezifischen Fakten drastisch — eliminiert sie aber nicht, besonders dann nicht, wenn eine Projektdatei zu einer Frage schweigt und das Modell „etwas einfügen muss".
Quellenangabe pro Aussage (in Entwicklung). Pro Satz sollten Sie sehen können, woher er kommt — und damit auch, ob er überhaupt aus irgendwo kommt.
Spezialisierte Modelle für Analyse und Schreiben, damit die Rollenverteilung klarer ist.
Vorfall-Eskalation. Gespräche wie dasjenige, das diesen Artikel ausgelöst hat, gehen zurück an unser Team. Wir prüfen, warum das Modell nicht sagte „Aldi steht nicht in Ihrer Stakeholder-Liste", und nutzen das, um die Sicherungen zu verbessern.

Wir verkleinern den Spalt kontinuierlich. Wir tun nicht so, als wäre der Spalt null.

Die Denkweise: nutzen Sie KI wie einen Praktikanten

Der Satz, den wir in Workshops verwenden: „Sie nutzen KI so, wie Sie einen Praktikanten nutzen — mit Begeisterung für das, was er liefert, und mit Augenmaß für das, was Sie kontrollieren, bevor es das Haus verlässt."

Den Fehler mit der Aldi -Adresse könnte auch ein Praktikant machen. Der Unterschied: ein Praktikant wird nach drei Korrekturen rot und hört auf zu raten. Ein LLM bleibt höflich und rät weiter. Das müssen Sie wissen — dann können Sie produktiv damit arbeiten.

Praktische Checkliste

Bevor ein KI-geschriebener Abschnitt aus Ihren Händen in eine Einreichung geht, machen Sie diese kurze Prüfung:

Markieren Sie jede konkrete Tatsache im Abschnitt: Adressen, Namen, Beträge, Daten, Kapazitäten, Ansprechpartner, Zertifizierungsnummern, regulatorische Verweise.
Fragen Sie pro Tatsache: „Steht das in einem der Quelldokumente, die ich TenderB gegeben habe?" Ja → öffnen Sie die Quelle und prüfen Zeichen für Zeichen. Nein → prüfen Sie gegen eine Primärquelle (die Website des Unternehmens, das KvK-Register, die offizielle Veröffentlichung).
Behandeln Sie Zustimmung der KI als Null-Evidenz. „Ja, Sie haben recht" ist keine Verifikation. Das ist das Modell, das sich Ihrem Tonfall anpasst.
Stapeln Sie keine Korrekturen. Hat TenderB dieselbe Tatsache zweimal in einem Gespräch falsch genannt? Versuchen Sie keine dritte Korrektur. Öffnen Sie selbst die Quelle, fügen Sie die richtige Tatsache ein und weisen Sie TenderB an, ausschließlich diese zu verwenden.
Speichern Sie das Quellenzitat neben der Aussage. Etablieren Sie die Gewohnheit „Aussage + Quelle daneben". Dann haben Halluzinationen keinen Platz mehr, sich zu verstecken.