Zum Inhalt springen

Rollout planen (Vorschau)

Das Rollout-Cockpit (Sidebar Rollout, Pfad /rollout) zeigt, wie sich ein stufenweiser Wechsel zwischen zwei Varianten auf Qualität, Latenz und Kosten auswirkt. Statt eine neue Version sofort auf den gesamten Verkehr zu schalten, wird der Anteil schrittweise erhöht und der Effekt nebeneinander verglichen. Sichtbar ist der Bereich nur für die Rollen platform_engineer und admin.

Die Ansicht trägt die Überschrift Provider-Wechsel · A/B-Rollout-Cockpit und ist mit einem Demo-Abzeichen markiert. Sie stellt eine Produktions-Baseline (die laufende Variante) einem Challenger (der neuen Variante) gegenüber. Im Beispiel ist die Baseline ein Provider (Anbieter eines Sprachmodells), der Challenger ein zweiter.

Schieberegler für den Anteil. Die Karte Rollout-Anteil Challenger enthält einen Schieberegler mit vier Standard-Stufen: 10, 25, 50 und 100 Prozent. Über den Regler oder die Stufen-Knöpfe wird festgelegt, welcher Anteil des Verkehrs auf den Challenger geht; der Rest bleibt bei der Baseline. Jede Stufe rechnet die Zahlen rechts neu.

Wirkung auf einen Blick. Unter dem Regler stehen drei Kennzahlen für die gewählte Stufe, jeweils als Veränderung gegenüber der Baseline:

KennzahlBedeutung
Quality (Eval-Score)Veränderung der Qualität in Prozentpunkten gegenüber dem Baseline-Eval-Median (Eval = automatisierte Qualitätsprüfung).
p95-LatencyErwartete Verschiebung der Antwortzeit im 95.-Perzentil in Millisekunden.
Kosten / MonatHochrechnung der Mischkosten bei der hinterlegten Beispiel-Last.

Vergleich der Varianten. Darunter stehen zwei Karten nebeneinander, Baseline · Production und Challenger. Jede zeigt Eval-Score, p95-Latency, Kosten / 1k (Kosten je 1000 Aufrufe) und Tokens / 1k sowie den aktuellen Verkehrsanteil. Wer den Regler bewegt, sieht direkt, wie sich das Verhältnis verschiebt.

Die heutige Ansicht zeigt das Muster; die Ausführung folgt später. Vorgesehen ist, eine neu veröffentlichte Version oder einen neuen Provider schrittweise auf wachsenden Verkehr zu schalten, statt auf einen Schlag. Dazu gehört eine automatische Pause, sobald die Qualität gegenüber der Baseline messbar zurückfällt (eine Regression), sodass ein problematischer Wechsel nicht den gesamten Verkehr erreicht. Der Knopf Plan vorschlagen ist der Platz für diesen späteren Ablauf; heute löst er nur den Demo-Hinweis aus.

Ein Rollout setzt eine fertige, aktive Version voraus. Zuerst wird eine Contract-Version über den Tab Versions (Versionen) veröffentlicht — sie durchläuft dabei Linter und Reife-Kriterien und wird damit aktiv. Erst danach ergibt ein stufenweiser Rollout Sinn: die bereits aktive Version oder ein alternativer Provider wird gegen die bisherige Baseline gefahren. Den Weg vom Entwurf zur aktiven Version beschreibt Version veröffentlichen und zurücksetzen.