Anthropic hat kürzlich Claude 3.7 Sonnet vorgestellt, sein erstes „mischfolgerndes Modell“, das darauf ausgelegt ist, komplexere Probleme zu lösen und die Leistung früherer Modelle in Bereichen wie Mathematik und Codierung zu übertreffen. Gleichzeitig hat Anthropic eine „eingeschränkte Forschungsvorschau“ von Claude Code veröffentlicht, einem „Agenten“-Codierungswerkzeug, das als aktiver Mitarbeiter im Workflow von Entwicklern positioniert ist.

Claude 2, Anthropic, Künstliche Intelligenz, Chatbot Claude

Neue Generation von Inferenzmodellen mit deutlich verbesserter Leistung

Die Einführung von Claude 3.7 Sonnet markiert einen wichtigen Schritt für Anthropic im Bereich der Inferenzmodelle. Dieses neue Modell zeichnet sich besonders in mathematischen Berechnungen und Codierungsaufgaben aus, insbesondere bei Agentencodierung, Finanz- und Rechtsaufgaben, wo es die vorherigen Versionen deutlich übertrifft. Im Vergleich zu seinem Vorgänger, Claude 3.5 Sonnet, wurde die Inferenzfähigkeit der Version 3.7 deutlich verbessert. Obwohl Claude immer noch keine Echtzeit-Websuche unterstützt, wurde sein Wissen bis Oktober 2024 aktualisiert, wodurch seine Antworten aktueller sind.

Das Modell wird nächsten Montag in der Claude-Anwendung verfügbar sein. Entwickler können es auch über die Anthropic-API, Amazon Bedrock und Google Cloud Vertex AI nutzen. Die Betriebskosten sind mit denen der Vorgängerversion identisch: 3 US-Dollar pro Million eingegebener Token und 15 US-Dollar pro Million ausgegebener Token.

Claude Code: Ein neuer Partner für die KI-Codierung

Neben dem neu veröffentlichten Claude 3.7 Sonnet hat Anthropic auch Claude Code vorgestellt, eine Forschungspräview-Version eines „Agenten“-Codierungswerkzeugs. Claude Code wurde als hilfreicher Assistent für Entwickler konzipiert und kann Code suchen und lesen, Dateien bearbeiten, Tests schreiben und ausführen sowie Code an GitHub übermitteln. Im Vergleich zu anderen KI-Codierungswerkzeugen auf dem Markt konzentriert sich Claude Code stärker auf die Zusammenarbeit. Er unterstützt nicht nur beim Schreiben von Code, sondern hilft Entwicklern auch bei der Verwaltung von Code-Repositories und steigert so die Effizienz.

Produkt-Vizepräsident Michael Gerstenhaber weist darauf hin, dass Claude Code es Entwicklern auch ermöglicht, die Denkweise der KI durch Anpassung des Modell-Registers zu steuern und sogar die Antwortzeit genau zu begrenzen, was bei Produktentscheidungen von entscheidender Bedeutung ist.

Vereinfachung des Inferenzerlebnisses und Förderung der KI-Branche

Auf der Veröffentlichung betonte Dianne Penn, Leiterin der Produktforschung bei Anthropic, die Vision des Unternehmens, das Inferenzerlebnis zu vereinfachen. Sie erklärte, dass Inferenz ein integraler Bestandteil der künstlichen Intelligenz sein sollte und kein separates Modul. Die Einführung von Claude spiegelt diesen Ansatz wider: Das Modell kann nicht nur schnell einfache Fragen beantworten, sondern auch komplexe Probleme bewältigen, wie z. B. die Planung einer zweiwöchigen Reise nach Italien.

Derzeit wird die Technologie von Claude 3.7 Sonnet intern bei Anthropic in großem Umfang eingesetzt, darunter Website-Design, die Entwicklung interaktiver Spiele und Experimente mit der Codierung durch Erstellung von Testsätzen. Das Unternehmen hat sogar die Fähigkeit des Modells in klassischen Pokémon-Spielen getestet, indem es die API des Modells auf ein Steuerungsschema abbildete. Die Version 3.7 des Modells übertraf die vorherigen Modelle bei weitem und besiegte erfolgreich mehrere Arenaleiter.

Verschärfter Wettbewerb: Anthropic könnte führend sein

Mit der rasanten Entwicklung der KI-Technologie hat die Veröffentlichung von Claude 3.7 Sonnet Anthropic im Technologiewettbewerb mit Konkurrenten wie OpenAI erneut einen Vorteil verschafft. Die Branche ist sich weitgehend einig, dass die KI-Branche mit der kontinuierlichen Verbesserung der Leistung von Inferenzmodellen auf eine Zukunft mit „Allzweck“-Modellen zusteuert. Dies bedeutet, dass zukünftige KI-Systeme nicht mehr nur ein eigenständiges Inferenzwerkzeug sein werden, sondern eine multifunktionale, umfassende Kooperationsplattform.