Prompt und Glossar bearbeiten

Der Prompt ist die Anweisung an das Modell: der Text, der beschreibt, was das Feature tun soll. Er ist ein fester Bestandteil des Agent Contract (der zentralen, versionierten Definition eines Features) und wird im Feature-Detail im Tab Prompt bearbeitet. Diese Seite beschreibt, wie der Prompt geschrieben und gegen die hinterlegten Quellen getestet wird und wo das Domänen-Glossar (feste Begriffsdefinitionen für das Feature) gepflegt wird.

Den Tab erreicht man über Features in der Sidebar, dann die gewünschte Feature-Karte anklicken und in der Tab-Leiste Prompt wählen. Eine Übersicht aller Tabs steht unter Oberfläche im Überblick.

Den Prompt schreiben

Der Prompt-Tab zeigt ein einzelnes Eingabefeld mit der Beschriftung System-Prompt. Hier wird in Klartext formuliert, was das Modell tun soll. Das Feld nimmt bis zu 50.000 Zeichen auf; ein Zähler unter dem Feld zeigt den aktuellen Stand (… / 50000 Zeichen).

So wird der Prompt gespeichert:

Öffne den Tab Prompt.
Schreibe oder ändere den Text im Feld System-Prompt.
Kurz nach der letzten Eingabe speichert die Plattform automatisch. Wer nicht warten möchte, speichert sofort mit Cmd/Strg + S oder über den Knopf Speichern oben im Tab.

Der Speicherstand wird links oben angezeigt (etwa Gespeichert mit Zeitstempel oder Wird gespeichert…). Solange noch ungesicherte Änderungen offen sind, ist der Speichern-Knopf aktiv. Ein leerer Prompt lässt sich nicht speichern; in diesem Fall erscheint ein Hinweis, dass ein Prompt-Text nötig ist.

Read-only nach dem Veröffentlichen

Eine veröffentlichte Contract-Version ist schreibgeschützt. Sobald die aktuelle Version aktiv oder abgelöst ist, lässt sich der Prompt nicht mehr ändern; das Eingabefeld ist gesperrt und oben erscheint ein Hinweisbanner. Um den Prompt weiterzuentwickeln, im Tab Versions (Versionen) einen neuen Entwurf (Draft) anlegen und im neuen Draft weiterarbeiten. Auch ein Feature im Zustand sunset (stillgelegt) ist vollständig schreibgeschützt; in diesem Fall hilft nur ein Nachfolge-Feature.

Schreibend bearbeiten dürfen den Prompt die Rollen developer, domain_expert, platform_engineer und admin. Ein compliance_officer und ein viewer sehen den Prompt nur lesend. Die vollständige Aufstellung steht unter Rollen und Rechte.

Batch-Test gegen die Quellen

Unter dem Editor liegt der Abschnitt Batch-Test. Damit wird der aktuelle Prompt-Entwurf gegen die im Feature hinterlegten Quellen (die gelabelten Beispiele aus dem Tab Sources) ausgeführt, ohne dass dafür eine Version veröffentlicht werden muss. So lässt sich vor dem Veröffentlichen prüfen, ob der Prompt die erwarteten Ergebnisse liefert.

So wird ein Batch-Test ausgeführt:

Stelle sicher, dass im Tab Sources Quellen mit erwarteten Ergebnissen hinterlegt sind. Siehe dazu Quellen verwalten.
Klicke im Abschnitt Batch-Test auf Batch-Test starten. Lief bereits ein Test, heißt der Knopf Erneut testen.
Warte das Ergebnis ab. Ein laufender Test lässt sich über Abbrechen stoppen.

Das Ergebnis besteht aus zwei Teilen. Eine Übersichtskarte zeigt Kennzahlen wie Accuracy (Trefferquote), Bestanden, Few-Shot und Cost sowie eine Aufschlüsselung der Fehlerarten. Darunter stellt eine Tabelle pro Quelle das tatsächliche Ergebnis (Actual) dem erwarteten (Expected) gegenüber, jeweils mit einem Status (pass, fail, manual-review, error). Lange Texte sind gekürzt und beim Überfahren vollständig sichtbar. Über Run-History lassen sich frühere Läufe ausklappen und erneut laden.

Batch-Tests können nur die schreibenden Rollen (developer, domain_expert, platform_engineer, admin) starten; bei Lese-Rollen und bei sunset-Features ist der Knopf ausgeblendet. Die Schwellwerte und Kriterien für die Bewertung gehören zur Evaluation; siehe Evaluation einrichten.

Das Domänen-Glossar

Das Domänen-Glossar hält feste Begriffsdefinitionen, die Fachbegriffe für das Feature eindeutig machen. Es wird im Tab Settings (Einstellungen) im Abschnitt Domain-Glossar gepflegt, nicht im Prompt-Tab.

So wird ein Term verwaltet:

Öffne im Feature-Detail den Tab Settings.
Klicke im Abschnitt Domain-Glossar auf Term, um einen Eintrag anzulegen.
Trage im Dialog Term hinzufügen den Begriff (Term, bis 120 Zeichen) und die Definition (bis 2.000 Zeichen) ein und bestätige mit Speichern.
Über das Stift-Symbol an einem Eintrag öffnet sich Term bearbeiten; das Papierkorb-Symbol entfernt den Eintrag.

Pro Feature sind bis zu 50 Terme möglich. Anlegen, Ändern und Löschen dürfen dieselben Rollen wie beim Prompt (developer, domain_expert, platform_engineer, admin); Lese-Rollen sehen die Terme nur. Bei einer veröffentlichten Version oder einem sunset-Feature sind die Bearbeiten-Funktionen ausgeblendet.

Klartext und Entwickler-Ansicht

Domänenexperte und Entwickler arbeiten am selben Prompt-Feld. Der Editor zeigt für alle Rollen denselben Klartext-Text; es gibt keine getrennte Code-Ansicht im Prompt-Tab. Die entwicklerorientierten Bestandteile des Contracts liegen im eigenen Tab Developer: dort stehen der TypeScript-Typ des Output-Schemas, die Spezifikation der gepinnten Tools und das SDK-Code-Snippet. Diese Surface ist für alle Rollen schreibgeschützt.

Das Output-Schema ist das stabile Interface des Features und wird an anderer Stelle bearbeitet; siehe Output-Schema definieren. Der Prompt formuliert die Anweisung, das Schema legt die Form der Ausgabe fest — beide zusammen bilden mit Modellen, Tools, Eval-Kriterien und Risikoklasse den Agent Contract.