Wie wir arbeiten.
Unsere Methodik ist keine Marke. Sie ist das, was nach vier Jahren Projekten in produktivem Einsatz übrig geblieben ist - und was wir jedes Quartal überarbeiten, wenn ein Projekt uns zeigt, dass ein Schritt fehlt.
Fünf Phasen, klar abgegrenzt.
Discovery (2-4 Wochen)
Wir beobachten den Prozess vor Ort, sprechen mit den Leuten, die ihn heute bedienen. Wir erstellen eine Baseline: Durchlaufzeiten, Fehlerraten, Kosten - gemessen, nicht geschätzt.
Architektur & Plan (3-5 Wochen)
Technisches Konzept, Datenfluss, Modell-Wahl, Rollback-Strategie. Eval-Design, bevor ein einzelner Prompt geschrieben ist.
Umsetzung (3-6 Monate)
Iteratives Bauen gegen die Eval-Suite. Wöchentliche Reviews mit dem Fachbereich. Wir zeigen, was läuft, nicht nur, was geplant ist.
Shadow & Parallel (2-3 Monate)
6 Wochen Shadow-Mode (Agent sieht, entscheidet nicht), 6 Wochen Parallelbetrieb (Mensch bleibt final). Jede Divergenz wird untersucht.
Go-Live & Übergabe (4 Wochen)
Vollständige Übergabe an Ihr Team. Runbooks, Monitoring-Alarme, Eskalations-Ketten. Optional: Evaluation-as-a-Service danach.
Dinge, die wir nie weglassen.
Evals before prompts.
Wir formulieren die Bewertungsfunktion, bevor wir das erste System bauen. Ein Projekt ohne Eval-Harness ist ein Projekt ohne Wahrheitsbegriff.
Reversibilität vor Geschwindigkeit.
Jede Agent-Aktion hat einen Rollback-Pfad. Wir beschleunigen Prozesse, aber wir verbauen keinen Notausgang.
Ein Modell ist eine Abhängigkeit.
Wir versioneren Modelle wie Code, schreiben Regressions-Tests, planen Ablösung. Kein "das läuft schon irgendwie".
Methodik vertiefen?
45 Minuten, wir gehen Ihre aktuellen Vorhaben gegen das Phasenmodell durch.
