2 Min. Lesezeit KI-generiert

xAI bringt /goal: ein autonomer Coding-Agent für Grok Build

Artikel als Markdown kopieren

Mit /goal kannst du Grok Build eine größere Aufgabe übergeben — der Agent plant, arbeitet sie ab und verifiziert sein Ergebnis selbst. Drei Modelle teilen sich die Pipeline. Klingt vertraut.

Featured image for "xAI bringt /goal: ein autonomer Coding-Agent für Grok Build"

Während Anthropic mit Claude Code und Claude Tag den agentischen Workflow vorantreibt, zieht xAI nach. Mit /goal hat das Musk-Unternehmen einen neuen Modus für Grok Build vorgestellt — einen, der den Entwickler für die Dauer einer Aufgabe aus der Schleife nimmt.

Plan, Ausführung, Verifikation

Die Idee ist klar: Statt im üblichen Ping-Pong aus Prompt und Antwort zu hängen, übergibst du dem Agenten eine größere Implementierungsaufgabe und lässt ihn laufen. /goal plant einen Ansatz, zerlegt die Arbeit in eine Fortschritts-Checkliste und beginnt abzuarbeiten. Der entscheidende Teil steht am Ende: Der Agent macht weiter, bis die Aufgabe nicht nur erledigt, sondern auch verifiziert ist. Verifikation kann heißen: Code reviewen, Webseiten inspizieren oder Skripte ausführen.

Du bleibst dabei nicht außen vor. Status, Pause, Resume und Clear geben dir Kontrolle, und du kannst dem Agenten während der Arbeit weitere Anweisungen zuschieben. Es ist also kein «Feuer-und-vergiss», sondern ein steuerbarer Langläufer.

Drei Modelle, eine Pipeline

Technisch interessant ist der Unterbau. /goal nutzt laut xAI gleich zwei Modelle nativ — Composer 2.5 und Grok Build 0.1 — und kombiniert sie über die Pipeline hinweg. Die Logik dahinter: Jede Phase bekommt das Modell, das am besten dazu passt. Planen mit dem einen, implementieren mit dem nächsten, verifizieren mit einem dritten. Verfügbar ist /goal ab sofort in Grok Build; die CLI installiert sich mit einem Befehl und braucht ein SuperGrok- oder X-Premium-Plus-Abo.

Meine Einordnung

Wer Claude Code kennt, liest diese Feature-Liste mit einem Déjà-vu: autonome Ausführung, Planung in Teilschritten, eingebaute Verifikation, Steuerung per Status und Pause. Das ist kein Vorwurf — es ist das Muster, auf das die ganze Branche gerade zuläuft. Der Agent, der nicht nur antwortet, sondern eigenständig bis zum geprüften Ergebnis durcharbeitet, wird zum Standard.

Spannend finde ich den Multi-Modell-Ansatz. Verschiedene Modelle für Planung, Umsetzung und Prüfung — das ist eine Wette darauf, dass Spezialisierung schlägt, was ein einzelnes großes Modell leistet. Ob das in der Praxis bessere Ergebnisse bringt oder nur mehr Komplexität, wird sich zeigen. Für mich ist die eigentliche Nachricht aber eine andere: Der Wettbewerb um den besten autonomen Coding-Agenten ist voll entbrannt. Und Konkurrenz war noch nie schlecht für die, die mit den Werkzeugen arbeiten.

Quellen: xAI: Introducing /goal