2 Min. Lesezeit KI-generiert

Googles Coral Board: Gemma 3 läuft komplett lokal — ohne Cloud

Artikel als Markdown kopieren

Google hat auf der I/O ein winziges Board für On-Device-KI vorgestellt. Auf dem Coral Board läuft Gemma 3 270M vollständig lokal — gedacht für Kopfhörer, AR-Brillen und Smartwatches.

Featured image for "Googles Coral Board: Gemma 3 läuft komplett lokal — ohne Cloud"

Während die großen Modelle immer mehr Rechenzentren verschlingen, geht Google auf der I/O in die andere Richtung: ein winziges Board, auf dem KI komplett ohne Cloud läuft. Das neue Coral Board ist ein kompakter Einplatinencomputer für On-Device-KI.

Was drinsteckt

Im Zentrum sitzt die Coral NPU — eine quelloffene Machine-Learning-Einheit auf RISC-V-Basis, entwickelt von Google Research. Dazu kommt ein Synaptics-Astra-SL2619-Chip mit 2-GHz-Dual-Core-Prozessor, 2 GB RAM und 1 TOPS Rechenleistung.

Das reicht, damit Googles kompaktes Open-Source-Sprachmodell Gemma 3 270M vollständig auf dem Board läuft — kein Cloud-Zugriff nötig. Genau das ist der Punkt: Die Daten verlassen das Gerät nicht.

Wofür das gedacht ist

Das Board zielt auf kleine Geräte: Kopfhörer, AR-Brillen, Smartwatches. Die Coral NPU soll außerdem ein altes Problem angehen — die Fragmentierung unter KI-Beschleunigern, bei der jeder Hersteller sein eigenes Süppchen kocht. Mit einer offenen, einheitlichen Architektur könnten Entwickler einmal bauen und auf mehr Hardware laufen lassen.

Auf der I/O zeigte Google passende Demos: Echtzeit-Übersetzung, sprachgesteuerte Hardware und eine generative Musik-Performance, bei der ein Vision-Modell Quallenbewegungen in Klänge verwandelte. Alle Demos liegen quelloffen auf GitHub. Das Board soll im Sommer ausgeliefert werden, einen Preis hat Google noch nicht genannt.

Meine Einschätzung

Edge-KI ist das unaufgeregte Gegenstück zum Wettrüsten der Frontier-Modelle — und genau deshalb interessant. Nicht jede Aufgabe braucht ein 900-Milliarden-Dollar-Rechenzentrum. Übersetzung im Ohr, Sprachsteuerung an der Brille, kleine Klassifikatoren auf der Uhr: Das alles läuft besser lokal, schneller und ohne dass Daten irgendwo hochgeladen werden. Dass Google die NPU als Open Source und auf RISC-V baut, ist das eigentlich Spannende — denn das könnte den Flickenteppich an Edge-Beschleunigern endlich aufräumen. Für Claude-Fans ist das kein direktes Thema, aber es zeigt, wohin sich die andere Hälfte der KI-Welt bewegt: nicht nach oben in die Cloud, sondern nach unten ins Gerät.

Quellen: The Decoder · Google Developers · Synaptics