Google Cloud Next 2026 startet heute im Mandalay Bay Convention Center in Las Vegas — und das Motto ist Programm: ‘The Agentic Cloud’. Vom 22. bis 24. April zeigt Google, wohin die Reise für Enterprise-KI geht. Und die Richtung ist klar: Es geht nicht mehr nur um bessere Modelle, sondern um die Infrastruktur, auf der autonome KI-Agenten laufen.
TPU v7: Googles Antwort auf Nvidia
Das Herzstück der Hardware-Ankündigungen ist TPU v7. Die neue Generation wird auf einem 3-4nm Prozess gefertigt und liefert 4,6 Petaflops FP8-Rechenleistung. Dazu kommen 192 GB HBM3E-Speicher und eine Speicherbandbreite von 7,4 TB/s. Die Chips werden in massiven Pods mit bis zu 9.216 Chips deployed — genug für Modelle mit 10 Billionen Parametern.
Besonders interessant: Anthropic hat langfristige Verträge über bis zu eine Million TPUs unterzeichnet. Auch Meta hat sich Multi-Milliarden-Kapazitäten gesichert. Google verkauft also nicht nur Cloud-Dienste, sondern positioniert seine TPUs als echte Nvidia-Alternative für die größten KI-Labore der Welt.
Gemini 3.2: Größere Kontextfenster, schnellere Inferenz
Gemini 3.2 soll die Kontextfenster über eine Million Tokens hinaus erweitern, die Inferenz-Latenz optimieren und die Cloud-KI-Kosten für Unternehmen senken. Konkrete Benchmarks dürften im Laufe der Konferenz folgen.
Die eigentliche Story: Das Betriebssystem für KI-Agenten
SiliconANGLE bringt es auf den Punkt: ‘Das ist kein Modell-Krieg. Es ist ein Krieg um die Control Plane — darum, wie Arbeit erledigt wird.’ Google will die Plattform bauen, auf der KI-Agenten deployed, gesteuert und monetarisiert werden. Nicht als Features in bestehenden Produkten, sondern als autonome Systeme, die Workflows in Unternehmen übernehmen.
Workspace Studio soll dabei die zentrale Rolle spielen — eine Umgebung, in der Agenten automatisiert Aufgaben in der Google-Workspace-Welt erledigen.
Einordnung
Google steht unter Druck. AWS dominiert die Infrastruktur, Microsoft hat die Distribution über Office und Azure, und Startups wie Anthropic und OpenAI setzen mit eigenen Agenten-Frameworks (Claude Code, Codex) Maßstäbe bei der Entwickler-Experience. Die Frage ist, ob Google mit seiner Cloud-Infrastruktur und Gemini das Bindeglied liefern kann, das Unternehmen für produktive KI-Agenten brauchen.
Die Keynote um 18:00 Uhr deutscher Zeit dürfte Antworten liefern.
Quellen: