Manchmal zeigt ein kleines Wochenend-Experiment besser, wo wir mit KI-Tools stehen, als jede Produktankündigung. Simon Willison hat auf Hacker News Moebius entdeckt — ein kompaktes Inpainting-Modell, bei dem du Bereiche eines Bildes markierst und das Modell sich ausdenkt, was an der Stelle stehen sollte. Das Problem: Das Modell brauchte eigentlich PyTorch und NVIDIA-CUDA.
0,2B klingt nach ‘das geht im Browser’
Willison stutzte beim Namen: 0,2 Milliarden Parameter — klein genug, um es per WebGPU direkt im Browser zu versuchen. Statt es selbst durchzudeklinieren, ließ er Claude Code ran. Und das übernahm die komplette Kette: das PyTorch-Modell nach ONNX konvertieren, das Ergebnis zu Hugging Face veröffentlichen und anschließend eine Web-App samt Oberfläche bauen, die das Modell lädt und ausführt.
Das Bemerkenswerte ist nicht, dass ein Schritt davon funktioniert — sondern dass Opus 4.8 die ganze Strecke am Stück geht. Modellkonvertierung, Hosting, Frontend: Das sind normalerweise drei verschiedene Hüte, und hier setzt ein Agent sie nacheinander auf.
Es läuft. In jedem Browser.
Das Ergebnis ist eine funktionierende Demo, die in Chrome, Firefox und Safari läuft. Eine Erkenntnis nimmt Willison besonders mit: Die CacheStorage-API kommt mit Modelldateien von rund 1,3 GB klar. Heißt im Klartext — Inpainting kann ein Feature einer reinen Client-Web-App sein. Kein Server, keine GPU-Cloud, keine API-Kosten pro Anfrage. Das Modell wird einmal in den Browser-Cache geladen und rechnet danach lokal.
Meine Einordnung
Genau für solche Momente lese ich Willisons Blog. Da startet jemand mit ‘das sieht klein aus, ob das im Browser läuft?’ und landet bei einer Client-only-App, die ein echtes ML-Modell lokal ausführt. Das ist die Sorte ungeplanter Entdeckung, die mit diesen Tools ständig passiert — man fragt sich eins und endet woanders. Spannend finde ich vor allem die Konsequenz: Wenn ein Agent ein Modell konvertieren, hosten und in eine Web-App gießen kann, sinkt die Schwelle, kleine Modelle einfach mal komplett offline-fähig im Browser auszuprobieren, dramatisch. Nicht jedes Modell ist 0,2B klein — aber überraschend viele nützliche schon.