Das KI-Forschungsinstitut Allen AI hat SERA veröffentlicht, eine Familie von Open-Source-Coding-Agenten, die sich günstig an private Codebasen anpassen lassen sollen. Das beste Modell, SERA-32B, löst bis zu 54,2 Prozent der Probleme im Coding-Benchmark "SWE-Bench-Test Verified" (64K context) und übertrifft damit vergleichbare Open-Source-Modelle.
32K context, Allen AI
SERA nutzt ein vereinfachtes Trainingsverfahren namens "Soft-verified Generation", das keine vollständig korrekten Code-Beispiele benötigt. Das Training benötigt laut Ai2 nur 40 GPU-Tage und kostet zwischen 400 Dollar, um frühere Open-Source-Ergebnisse zu erreichen, und 12.000 Dollar für Leistung auf dem Niveau führender Industriemodelle. Damit sei ein Training auf eigenen Code-Daten auch für kleine Teams möglich. Technische Details stehen im Blog.
Die Modelle sind mit Claude Code kompatibel und können laut Allen AI mit zwei Zeilen Code gestartet werden. Alle Modelle, Code und Anleitungen sind auf Hugging Face unter der Apache 2.0-Lizenz verfügbar.
Mistral AI hat Mistral Vibe 2.0 vorgestellt, ein Upgrade seines Terminal-basierten Programmier-Assistenten, der auf dem Devstral 2 Modell basiert. Das Tool ermöglicht Entwicklern, Code mit natürlicher Sprache zu steuern, mehrere Dateien gleichzeitig zu bearbeiten und den gesamten Code-Kontext zu nutzen.
Neu in Version 2.0 sind benutzerdefinierte Unteragenten für spezielle Aufgaben wie Tests oder Code-Reviews, Rückfragen bei unklaren Anweisungen statt automatischer Entscheidungen, und Slash-Befehle für vorgefertigte Arbeitsabläufe.
Mistral Vibe ist über Le Chat Pro (14,99 Dollar/Monat) und Team-Pläne (24,99 Dollar/Platz) verfügbar. Devstral 2 wechselt zu kostenpflichtigem API-Zugang – kostenlose Nutzung bleibt für Tests im Experiment-Plan möglich. Für Unternehmen bietet Mistral zusätzlich Feinabstimmung, verstärkendes Lernen und Code-Modernisierung an.
Anthropic-CEO warnt: Demokratien müssen sich vor ihrer eigenen KI schützen
Dario Amodei skizziert in einem neuen Essay die Gefahren mächtiger KI-Systeme. Seine zentrale Forderung: Demokratien sollten KI nur so einsetzen, dass sie nicht zu dem werden, was sie bekämpfen.
Die britische Regierung hat Anthropic ausgewählt, einen KI-Assistenten für die Website GOV.UK zu entwickeln. Das Ministerium für Wissenschaft, Innovation und Technologie (DSIT) will damit Bürgern helfen, staatliche Dienste zu nutzen und individuelle Beratung zu erhalten. Zunächst sollen Arbeitssuchende bei ihrer Karriere beraten werden, leichteren Zugang zu Weiterbildungen erhalten und Angebote erklärt bekommen.
Die Partnerschaft baut auf einer Absichtserklärung vom Februar 2025 auf. Anthropic-Ingenieure arbeiten mit britischen Beamten zusammen, damit die Regierung das System künftig eigenständig betreiben kann. Nutzer sollen die volle Kontrolle über ihre Daten behalten und sich jederzeit abmelden können.
Regionschefin Pip White von Anthropic betonte, die Zusammenarbeit zeige, wie KI sicher für das Gemeinwohl eingesetzt werden könne. Neben Anthropic sind auch andere US-Konzerne stark in Großbritannien verwurzelt: Microsoft, OpenAI und Nvidia haben letztes Jahr Investitionen von über 31 Milliarden Pfund für britische KI-Infrastruktur zugesagt. Im Gegensatz zu OpenAI, das einen 200-Millionen-Dollar-Vertrag mit dem US-Verteidigungsministerium abgeschlossen hat, untersagt Anthropic US-Strafverfolgungsbehörden die Nutzung seiner Modelle für Inlandsüberwachung.
KI-Entwickler Andrej Karpathy revidiert Meinung zu KI-Agenten: Von "funktionieren nicht" zu 80 Prozent KI-Coding in nur drei Monaten
Noch im Oktober sagte Andrej Karpathy über KI-Agenten: „Sie funktionieren einfach nicht.“ Jetzt programmiert er nach eigenen Angaben zu 80 Prozent mit Agenten und spricht von einem Phasenwechsel in der Softwareentwicklung. Es ist eine eigentlich nüchterne Stimme, die in den Hype um agentisches Coding einsteigt, aber auch warnt.