Anthropic actualiza su política de seguridad, estableciendo un 'umbral de seguridad' para evitar que la IA se descontrole

En el contexto del rápido desarrollo de la inteligencia artificial, Anthropic ha anunciado recientemente una actualización de su "Política de Expansión de Responsabilidad" (RSP, por sus siglas en inglés). Esta política tiene como objetivo gestionar eficazmente los riesgos potenciales asociados con los sistemas de IA de alta capacidad. Como desarrolladora del popular chatbot Claude, la medida de Anthropic busca claramente encontrar un equilibrio entre las crecientes capacidades de la IA y los estándares de seguridad necesarios.

Anthropic, Claude

Esta nueva política introduce los llamados umbrales de capacidad, que sirven como indicadores claros de garantías de seguridad adicionales a medida que aumenta la capacidad de los modelos de IA. Estos umbrales abarcan áreas de alto riesgo, como la fabricación de armas biológicas y la investigación de IA autónoma, lo que demuestra la determinación de Anthropic de prevenir el uso malicioso de su tecnología. Cabe destacar la creación del puesto de "Oficial de Expansión de Responsabilidad", encargado de supervisar el cumplimiento y garantizar la implementación de las medidas de seguridad correspondientes.

Con la aceleración del avance de las capacidades de la IA, la preocupación por la gestión de riesgos en la industria también está aumentando. Anthropic ha declarado explícitamente que sus umbrales de capacidad y las garantías necesarias buscan evitar que los modelos de IA causen daños a gran escala, ya sea por uso malicioso o por accidente. La política se centra en las armas químicas, biológicas, radiológicas y nucleares (CBRN) y en el desarrollo de IA autónoma, puntos clave de riesgo de posible explotación por parte de actores malintencionados.

Además, Anthropic espera que esta política no solo sirva como marco de gobernanza interna, sino que también establezca un estándar para toda la industria de la IA. Su sistema de Nivel de Seguridad de IA (ASL, por sus siglas en inglés), similar a los estándares de bioseguridad del gobierno de Estados Unidos, ayudará a los desarrolladores de IA a establecer un método sistemático para la gestión de riesgos.

La nueva política también define con mayor precisión las responsabilidades del Oficial de Expansión de Responsabilidad, garantizando un mecanismo de supervisión más estricto de la ejecución de los protocolos de seguridad de la IA. Si se determina que la capacidad de un modelo alcanza un umbral de alto riesgo, el Oficial de Expansión de Responsabilidad tiene la autoridad para suspender su entrenamiento o implementación. Este mecanismo de autorregulación podría servir de ejemplo para otras empresas que trabajan con sistemas de IA de vanguardia.

Con la creciente regulación de la tecnología de IA a nivel mundial, la actualización de Anthropic resulta especialmente oportuna. Mediante la divulgación pública de informes de capacidad y evaluaciones de seguridad, Anthropic espera establecer un ejemplo de transparencia en la industria y proporcionar un marco claro para la gestión de la seguridad de la IA en el futuro.

Puntos clave:
🌟 Anthropic actualiza su "Política de Expansión de Responsabilidad", introduciendo umbrales de capacidad para mejorar la gestión de riesgos de la IA.
🛡️ La nueva política crea el puesto de "Oficial de Expansión de Responsabilidad", que supervisa la ejecución y el cumplimiento de los protocolos de seguridad de la IA.
🚀 Esta política tiene como objetivo establecer estándares de seguridad para la industria de la IA, promoviendo la transparencia y la autorregulación.

Noticias de IA

Anthropic actualiza su política de seguridad, estableciendo un 'umbral de seguridad' para evitar que la IA se descontrole

AIbase基地

Noticias de IA relacionadas recomendadas

Claude 3.5 revoluciona el mundo de los LLM: cada aplicación es más alucinante que GPT-4