Anthropic met à jour sa politique de sécurité, définissant des « seuils de sécurité

Dans le contexte de l'essor fulgurant de l'intelligence artificielle, Anthropic a récemment annoncé la mise à jour de sa « politique d'extension de responsabilité » (RSP), visant à gérer efficacement les risques potentiels liés aux systèmes d'IA hautement performants. Développeur du populaire chatbot Claude, Anthropic cherche manifestement à trouver un équilibre entre les capacités croissantes de l'IA et les normes de sécurité nécessaires.

Anthropic, Claude

Cette nouvelle politique introduit des seuils de capacité, marquant clairement les garanties de sécurité supplémentaires nécessaires à l'amélioration des modèles d'IA. Ces seuils couvrent des domaines à haut risque tels que la fabrication d'armes biologiques et la recherche sur l'IA autonome, démontrant la volonté d'Anthropic d'empêcher toute utilisation malveillante de sa technologie. Il est important de noter la création d'un « responsable de l'extension de responsabilité », chargé de superviser la conformité et de garantir la mise en place des mesures de sécurité appropriées.

Avec l'amélioration accélérée des capacités de l'IA, l'importance de la gestion des risques s'accroît au sein du secteur. Anthropic précise que ses seuils de capacité et les garanties nécessaires visent à empêcher les modèles d'IA de causer des dommages à grande échelle en cas d'utilisation malveillante ou accidentelle. La politique se concentre sur les armes chimiques, biologiques, radiologiques et nucléaires (CBRN) et la recherche et développement en IA autonome, autant de points faibles potentiels pour une utilisation frauduleuse future de l'IA.

En outre, Anthropic souhaite que cette politique serve non seulement de cadre de gouvernance interne, mais aussi de référence pour l'ensemble du secteur de l'IA. Son système de niveaux de sécurité de l'IA (ASL), similaire aux normes de biosécurité du gouvernement américain, aidera les développeurs d'IA à établir une approche systématique de la gestion des risques.

La nouvelle politique précise également les responsabilités du responsable de l'extension de responsabilité, assurant une surveillance plus stricte de l'exécution des protocoles de sécurité de l'IA. Si les capacités d'un modèle atteignent un seuil de risque élevé, le responsable de l'extension de responsabilité a le pouvoir de suspendre son entraînement ou son déploiement. Ce mécanisme d'autorégulation pourrait servir d'exemple à d'autres entreprises travaillant sur des systèmes d'IA de pointe.

Avec le renforcement de la réglementation des technologies de l'IA à l'échelle mondiale, la mise à jour d'Anthropic est particulièrement opportune. Grâce à la publication de rapports sur les capacités et des évaluations de sécurité, Anthropic souhaite promouvoir la transparence au sein du secteur et fournir un cadre clair pour la gestion de la sécurité de l'IA à l'avenir.

Points clés :
🌟 Anthropic met à jour sa « politique d'extension de responsabilité » et introduit des seuils de capacité pour renforcer la gestion des risques liés à l'IA.
🛡️ La nouvelle politique crée le poste de « responsable de l'extension de responsabilité » pour superviser l'exécution et la conformité des protocoles de sécurité de l'IA.
🚀 Cette politique vise à établir des normes de sécurité pour le secteur de l'IA, en promouvant la transparence et l'autorégulation.

Actualités IA

Anthropic met à jour sa politique de sécurité, définissant des « seuils de sécurité » pour éviter les dérives de l'IA

AIbase基地