Agenten, die Prozesse übernehmen - nicht nur Chats führen.
Wir bauen maßgeschneiderte KI-Systeme für einen umrissenen Prozessabschnitt. Kein Copilot-für-alles, sondern ein Agent, dessen Autonomiegrenzen so sauber gesetzt sind wie seine Messgrößen.
Was Sie bekommen.
Prozessauswahl & Business-Case
Workshop-Serie mit Ihrem operativen Team. Identifikation der Prozessabschnitte, in denen ein Agent wirtschaftlich ist - mit belastbaren Zahlen, nicht mit Bauchgefühl.
Agent-Blueprint & Infrastruktur
Modell-Auswahl, Tool-Definition, Rollback-Strategie, Rate-Limits, Beobachtbarkeit. Auf Basis Ihrer Datenhaltung und Compliance-Anforderungen.
Implementation & Evaluation
Agent-Code, Evaluations-Harness mit Golden-Dataset, Deployment-Pipeline. Wir schreiben Tests, bevor wir Features schreiben.
Parallelbetrieb & Übergabe
Sechs Wochen Shadow-Mode, sechs Wochen Parallelbetrieb. Anschließend produktive Ablösung mit Ihrem Betriebs-Team - inklusive Runbooks.
Evaluation-as-a-Service (optional)
Kontinuierliche Qualitätsmessung gegen neue Modellversionen. Regressions-Tests, Drift-Erkennung, vierteljährliche Review-Calls.
EU-AI-Act-konforme Unterlagen
Technisches Dossier, Risikoanalyse, Trainingsdaten-Herkunft, Human-Oversight-Konzept. Audit-tauglich bei Abschluss.
Drei Bedingungen, unter denen S1 Sinn ergibt.
Ausführlich in unserem Thesen-Artikel. Kurzform:
Aktionen sind rückholbar.
Entweder nur lesend, menschlich gegengezeichnet oder mit günstigem Rollback. Kein Single-Point-of-Failure in Sakko.
Ab ca. 5.000 Fällen / Monat.
Darunter amortisieren sich Fixkosten selten. Ausnahmen bestätigen die Regel.
Bottleneck ist Bearbeitungszeit.
Nicht Systemintegration, nicht Datenqualität, nicht Freigabeketten. Agenten lösen das erste - nicht die anderen.
Maschinenbau: 14 Tage → 11 Minuten.
Von 14 Arbeitstagen auf 11 Minuten. P95 von 28 Tagen auf 42 Minuten.
Durch höhere Hit-Rate bei kurzfristigen Anfragen. Amortisation in 14 Monaten.
Ein Werkzeugbauer mit 1.100 Varianten in der Stückliste. Die entscheidende Weichenstellung war, nicht mit einem LLM zu starten - sondern mit der Konsolidierung der Preisdaten aus drei ERP-Systemen.
Nach neun Monaten laufen 87 % der Angebote vollautomatisch, 13 % mit menschlichem Review durch die Konstruktion. Wichtiger als der Mittelwert: die P95-Latenz liegt bei 42 Minuten. Keine "Ausreißer" mit 28 Tagen mehr.
Drei, die uns am meisten gestellt werden.
Wie lange dauert so ein Projekt wirklich?
Der kürzeste Agent in Produktion stand nach 4 Monaten, der längste nach 11. Median: 7 Monate. Was die Dauer bestimmt, ist fast ausschließlich die Reife der Datenbasis.
Bauen Sie auf unserer Infrastruktur oder auf Ihrer?
Auf Ihrer. Wir liefern Code und Runbooks, keine Abhängigkeit. Unser Geschäftsmodell ist nicht, Sie an uns zu binden - es ist, das nächste Projekt zu bekommen, weil das erste funktioniert.
Welche Modelle nutzen Sie?
Agnostisch. Claude, GPT, Llama, Mistral, Qwen - je nachdem, was für Ihren Fall Sinn macht. Meist eine Kombination aus einem kleinen lokalen Modell für das Gros und einem Frontier-Modell für Grenzfälle.
Konkreter Use Case?
45 Minuten, wir prüfen die drei Voraussetzungen für Ihren Fall. Gemeinsam.
