Feldnotizen.
Einmal im Monat: Was wir aus laufenden Projekten lernen, welche Modelle wir wirklich in Produktion nutzen, worauf wir gerade verzichten - und gelegentlich eine kurze Methodik-These, die wir gerade testen.
Warum wir den Pilot bei einem OEM gerade abgesagt haben.
Ein konkretes Projekt, bei dem die Erwartungen nicht zur Realität passten. Plus: drei Fragen, die wir vor jedem neuen Pilot auf den Tisch legen.
Claude 4.5 im A/B gegen unser fine-tuned Mistral.
Das Ergebnis war nicht, was wir erwartet hatten. Wir zeigen die Eval-Matrix und die Budgetfrage, die am Ende die Wahl gemacht hat.
BaFin-Audit: 90 Minuten, kein Befund.
Welche acht Artefakte am Ende gereicht haben - und welche Details wir für das nächste Audit schon vorbereiten.
Vier Dinge, die 2025 bei uns nicht funktioniert haben.
Jahresrückblick ohne Erfolgsgeschichten. Die vier Dinge, die wir 2026 anders machen.
Warum wir keine „AI Copilots“ bauen.
Der Unterschied zwischen Copilot und Agent ist architektonisch, nicht kosmetisch. Wir erklären, welchen Teil wir machen - und welchen nicht.
Tool-Use in Produktion: Zwei Muster, ein Anti-Muster.
Welche beiden Interaktions-Muster bei uns im Feld laufen - und warum „Agent ruft OpenAPI direkt“ in der Praxis bricht.
