EN

Tag: Benchmarks

8 Artikel mit Tag "Benchmarks"

Preview image for Kimi K3: 2,8 Billionen Parameter — und plötzlich kostet ein chinesisches Modell so viel wie Sonnet

Kimi K3: 2,8 Billionen Parameter — und plötzlich kostet ein chinesisches Modell so viel wie Sonnet

Open Source Modelle Benchmarks

Preview image for OpenAI prüft SWE-Bench Pro — und findet fast ein Drittel fehlerhafte Aufgaben

OpenAI prüft SWE-Bench Pro — und findet fast ein Drittel fehlerhafte Aufgaben

OpenAI Benchmarks Coding Research

Preview image for GPT-5.6 Launch-Woche: OpenAI steht unter Zugzwang

GPT-5.6 Launch-Woche: OpenAI steht unter Zugzwang

OpenAI GPT-5.6 Model-Release Benchmarks Competition

Preview image for Cursor Composer 2.5: So gut wie Opus 4.7, ein Zehntel der Kosten

Cursor Composer 2.5: So gut wie Opus 4.7, ein Zehntel der Kosten

Cursor Composer AI Coding Benchmarks Developer

Preview image for GPT-5.5 vs Claude Opus 4.7: Das Benchmark-Duell im Detail

GPT-5.5 vs Claude Opus 4.7: Das Benchmark-Duell im Detail

GPT-5.5 Claude Opus 4.7 Benchmarks Vergleich

Preview image for Nature-Studie: KI-Agenten scheitern an komplexen wissenschaftlichen Aufgaben

Nature-Studie: KI-Agenten scheitern an komplexen wissenschaftlichen Aufgaben

KI-Agenten Forschung Stanford Nature Benchmarks

Preview image for GLM-5.1: Das Open-Source-Modell, das 8 Stunden autonom arbeitet

GLM-5.1: Das Open-Source-Modell, das 8 Stunden autonom arbeitet

Open Source GLM Agenten Benchmarks

Preview image for DeepMind will AGI messbar machen — und startet einen Hackathon dafuer

DeepMind will AGI messbar machen — und startet einen Hackathon dafuer

Google DeepMind AGI Benchmarks Forschung Kaggle

Alle News anzeigen →