Anthropics Verantwortliche Skalierungspolitik

Anthropic-Gründer Dario Amodei stellte auf dem britischen Gipfel für KI-Sicherheit die Politik der Verantwortlichen Skalierung (Responsible Scaling Policy, RSP) vor. Diese Politik zielt darauf ab, die Sicherheit und Kontrollierbarkeit von KI-Systemen zu gewährleisten und potenzielle Risiken und Missbrauch zu verhindern. RSP besteht aus zwei Hauptkomponenten: dem ASL-System und der Skalierungskurve.

Das ASL-System ist dem System der biologischen Sicherheitsstufen (BSL) nachempfunden. Jede Stufe beinhaltet entsprechende Sicherheitsmaßnahmen. ASL-1 steht für Modelle mit nahezu keinem Risiko, z. B. professionelle KI-Schachspieler; ASL-2 repräsentiert den aktuellen Stand, wobei die Modelle ein breites Risikospektrum aufweisen, aber noch keine wirklich gefährlichen Fähigkeiten gezeigt haben; ASL-3 tritt ein, wenn KI-Modelle im CBRN-Bereich (chemisch, biologisch, radiologisch und nuklear) handlungsfähig gefährlich werden; ASL-4 kennzeichnet eine Eskalation des Risikos katastrophalen Missbrauchs, wenn KI-Systeme ein nahezu menschliches Maß an Autonomie erreichen oder zu einer Hauptquelle für mindestens eine schwerwiegende globale Sicherheitsbedrohung (z. B. Biowaffen) werden.

Die Skalierungskurve dient dazu, die Zeitintervalle zwischen dem Erreichen dieser gefährlichen Fähigkeiten zu testen und sicherzustellen, dass nicht blindlings Modelle mit gefährlichen Fähigkeiten geschaffen werden. Mit zunehmender Größe und Fähigkeit von KI-Systemen müssen die Sicherheitsmaßnahmen entsprechend angepasst werden.