Mistral hat aufgeräumt. Statt drei spezialisierte Modelle zu pflegen - Devstral 2 fürs Coding, Magistral fürs Reasoning, Medium 3.1 für allgemeine Instruktionen - gibt es jetzt eines: Mistral Medium 3.5. Ein dichtes Modell mit 128 Milliarden Parametern und einem Kontextfenster von 256.000 Token.
Warum ein dichtes Modell?
Die Entscheidung gegen Mixture-of-Experts ist bewusst konservativ. Konkurrenten wie DeepSeek und Qwen setzen bei ihren Flaggschiff-Modellen längst auf MoE-Architekturen, die bei ähnlicher Qualität deutlich günstiger in der Inferenz sind. Mistrals eigenes Large 3 nutzt 675 Milliarden Parameter, aktiviert aber nur 41 Milliarden pro Token.
Medium 3.5 aktiviert dagegen alle 128 Milliarden Parameter für jedes einzelne Token. Das macht die Inferenz teurer, aber das Modell einfacher zu deployen und zu warten. Vier GPUs reichen laut Mistral zum Self-Hosting - wobei ‘vier GPUs’ in der Praxis immer noch Rechenzentrum bedeutet.
Reasoning als Schalter
Statt eines separaten Reasoning-Modells gibt es jetzt einen reasoning_effort-Parameter. Einfache Anfragen bekommen schnelle Antworten, komplexe Agenten-Tasks den vollen Reasoning-Modus. Dazu kommt ein komplett neu trainierter Vision-Encoder, der mit variablen Bildgrößen und Seitenverhältnissen umgehen kann.
In Mistrals eigenen Benchmarks erreicht Medium 3.5 77,6 Prozent auf SWE-Bench Verified und 91,4 Prozent auf dem Telekom-Branchenbenchmark. Bei Banking-Szenarien liegt Claude allerdings deutlich vorn.
Modified MIT statt Apache 2.0
Bemerkenswert ist der Lizenzwechsel. Bisherige Mistral-Modelle wie Large 3 und Small 4 liefen unter Apache 2.0. Medium 3.5 kommt mit einer ‘Modified MIT License’, die kommerzielle und nicht-kommerzielle Nutzung erlaubt, aber Ausnahmen für umsatzstarke Unternehmen vorsieht. Mistral bewegt sich damit in Richtung der Lizenzmodelle, die auch Meta mit Llama verwendet.
Vibe bekommt Cloud-Agenten
Die vielleicht interessantere Neuigkeit ist das Update für Mistrals Coding-Tool Vibe. Es bekommt asynchrone Cloud-Agenten, die eigenständig in isolierten Sandboxes arbeiten und Pull Requests erstellen können. Anbindungen an GitHub, Linear, Jira, Sentry, Slack und Teams sind integriert. Das Konzept kennt man von Claude Code und OpenAI Codex - aber Mistral ist das erste europäische Unternehmen, das hier mitzieht.
Le Chat wird zum Arbeitsassistenten
Le Chat, Mistrals Consumer-App, bekommt einen ‘Work Mode’ für mehrstufige Aufgaben. Connectors zu E-Mail, Kalender und Dokumentensystemen sind dabei standardmäßig aktiviert. Sensible Aktionen wie das Versenden von Nachrichten erfordern eine explizite Bestätigung. Das klingt sehr nach Anthropics Cowork-Ansatz, nur eben mit europäischer Infrastruktur.
Über die API kostet Medium 3.5 1,50 Dollar pro Million Input-Token und 7,50 Dollar pro Million Output-Token.
Quellen: Mistral AI: Vibe Remote Agents und Medium 3.5, The Decoder: Mistral Medium 3.5, Hugging Face: Mistral Medium 3.5 Model Card