Actualités IA

Actualités IA

Ne manquez aucun moment de l'innovation mondiale en IA

IA Quotidien

Tendances quotidiennes de l'industrie de l'IA en trois minutes

Chronologie de l'IA

Jalons de l'industrie de l'IA

Al hardware

liste tous les produits de matériel AI.

Guide de monétisation de l'IA

Derniers cas

Partage de cas de monétisation de l'IA

Collection d'images

Cas de monétisation de la création d'images par l'IA

Collection de vidéos

Cas de monétisation de la création de vidéos par l'IA

Collection audio

Cas de monétisation de la création audio par l'IA

Collection de contenu

Cas de monétisation de la rédaction de contenu par l'IA

Tutoriels IA

Derniers tutoriels

Partage gratuit des derniers tutoriels IA

Classements des produits IA

Classement des produits IA

Affiche le classement du nombre total de visites des sites web d'IA

Classement de la croissance du trafic IA

Suit les sites web d'IA à la croissance la plus rapide en termes de trafic

Classement de la baisse du trafic IA

Se concentre sur les sites web d'IA avec des baisses de trafic importantes

Classement hebdomadaire de l'IA

Affiche le classement hebdomadaire des visites des sites web d'IA

Classements des pays populaires

États-Unis

Sites web d'IA les plus populaires auprès des utilisateurs américains

Chine

Sites web d'IA les plus populaires auprès des utilisateurs chinois

Inde

Sites web d'IA les plus populaires auprès des utilisateurs indiens

Brésil

Sites web d'IA les plus populaires auprès des utilisateurs brésiliens

Classements des catégories populaires

Génération d'images

Classement du nombre total de visites des sites web de génération d'images par l'IA

Assistant personnel

Classement du nombre total de visites des sites web d'assistants personnels d'IA

Génération de personnages

Classement du nombre total de visites des sites web de génération de personnages par l'IA

Génération de vidéos

Classement du nombre total de visites des sites web de génération de vidéos par l'IA

Classements des données Open Source populaires

Classement des projets IA

Projets IA populaires sur GitHub par nombre total d'étoiles

Classement de la croissance des projets IA

Projets IA populaires sur GitHub par taux de croissance

Classement des développeurs IA

Classement des développeurs IA populaires sur GitHub

Classement des organisations IA

Classement des organisations IA populaires sur GitHub

Catégories Open Source populaires

Deepseek

Projets Open Source Deepseek populaires sur GitHub

TTS

Projets Open Source TTS populaires sur GitHub

LLM

Projets Open Source LLM populaires sur GitHub

ChatGPT

Projets Open Source ChatGPT populaires sur GitHub

Bibliothèque de projets Open Source IA

Aperçu

Aperçu des projets Open Source IA populaires sur GitHub

Bibliothèque de produits Navigation de l'outil

Recherchez la dynamique mondiale des produits IA

Recherchez des informations sur l'IA mondiale et découvrez de nouvelles opportunités d'IA

✓Actualités
Applications de produits

Type :

✓Actualités
Applications de produits

2025-02-12 11:14:46.AIbase

Les protections de sécurité d'Anthropic sont mises à l'épreuve : un test universel de jailbreak des modèles d'IA révèle des failles

En seulement six jours, des participants ont réussi à contourner toutes les mesures de sécurité du modèle d'intelligence artificielle (IA) Claude3.5 d'Anthropic, une percée qui ouvre un nouveau débat dans le domaine de la sécurité de l'IA. Jan Leike, ancien membre de l'équipe d'alignement d'OpenAI et actuellement employé chez Anthropic, a annoncé sur la plateforme X qu'un participant avait réussi à franchir tous les huit niveaux de sécurité. Cet effort collectif a nécessité environ 3 700 heures de tests et 300 000 messages de la part des participants. Malgré les défis...

Les protections de sécurité d'Anthropic sont mises à l'épreuve : un test universel de jailbreak des modèles d'IA révèle des failles

2025-02-05 14:13:18.AIbase

Anthropic lance un "classificateur de robustesse" : succès dans le blocage de 95 % des tentatives de jailbreak des modèles

La société d'intelligence artificielle Anthropic a récemment annoncé le développement d'une nouvelle méthode de sécurité appelée "classificateur de robustesse", conçue pour protéger les modèles linguistiques contre les manipulations malveillantes. Cette technologie cible spécifiquement les "jailbreaks universels" – une méthode d'entrée visant à contourner systématiquement toutes les mesures de sécurité afin d'empêcher les modèles d'IA de générer du contenu préjudiciable. Pour vérifier l'efficacité de cette technologie, Anthropic a mené un test à grande échelle. La société a recruté 183 participants qui ont tenté de contourner son système de défense pendant deux mois. Les participants ont été invités à entrer…

Anthropic lance un "classificateur de robustesse" : succès dans le blocage de 95 % des tentatives de jailbreak des modèles

2024-10-24 10:03:24.AIbase

Les chercheurs développent une nouvelle méthode de jailbreak pour les LLM, avec un taux de réussite de 65 %

Récemment, l'équipe de recherche Unit42 de Palo Alto Networks, une société de cybersécurité, a publié une étude remarquable révélant une nouvelle méthode de jailbreak appelée « Deceptive Delight ». Cette méthode permet d'inciter les grands modèles linguistiques (LLM) à générer du contenu malveillant en seulement deux ou trois interactions, avec un taux de réussite de 65 %. Cette découverte sonne l'alarme quant à la sécurité des LLM. Note sur l'image : Image générée par IA, service d'autorisation d'image.

Les chercheurs développent une nouvelle méthode de jailbreak pour les LLM, avec un taux de réussite de 65 %

2024-08-10 18:00:39.AIbase

Anthropic étend son programme de récompense pour les vulnérabilités afin de tester son système de sécurité IA nouvelle génération

Anthropic annonce l'élargissement de son programme de récompense pour les vulnérabilités afin de tester un « système d'atténuation de la sécurité IA nouvelle génération », axé sur l'identification et la défense contre les « attaques de jailbreak universelles ». Une attention particulière est portée aux domaines à haut risque, notamment la défense CBRN et la cybersécurité. Les participants auront un accès anticipé au nouveau système de sécurité pour découvrir des vulnérabilités ou contourner les mesures de sécurité, avec des récompenses pouvant atteindre 15 000 $. Cette initiative vise à améliorer la sécurité des systèmes d'IA en attirant des chercheurs en sécurité pour identifier et corriger les menaces potentielles, établissant ainsi une référence pour la sécurité dans l'industrie de l'IA.

Anthropic étend son programme de récompense pour les vulnérabilités afin de tester son système de sécurité IA nouvelle génération

2024-07-19 14:12:29.AIbase

Nouvelle faille pour « jailbreaker » l'IA ! Des invites au passé contournent instantanément GPT-4o et cinq autres modèles

L'article souligne l'excellence des grands modèles de langage (LLM) dans les tâches de traitement du langage naturel. Cependant, les mécanismes de refus des requêtes dangereuses, basés sur l'apprentissage par renforcement avec rétroaction humaine, l'apprentissage supervisé et l'entraînement contradictoire, se sont révélés fragiles. Les chercheurs ont découvert qu'en reformulant les requêtes dangereuses au passé, des modèles clés pouvaient « contourner » la formation de refus, augmentant considérablement leur taux de réussite. Par exemple, pour GPT-4o, le taux est passé de 1 % à 88 %. Cela montre que, malgré les limites des stratégies de réponse, des variations existent selon les langues et les encodages d'entrée spécifiques.

Nouvelle faille pour « jailbreaker » l'IA ! Des invites au passé contournent instantanément GPT-4o et cinq autres modèles

2023-10-23 11:59:38.AIbase

Faille de sécurité de l'IA ! DALL-E 3 d'OpenAI vulnérable aux attaques de jailbreak, générant des images d'enfants fumant

DALL-E 3 d'OpenAI, une IA de génération d'images, s'est avérée vulnérable aux invites de jailbreak, conduisant à la génération d'images d'enfants fumant. La technique de jailbreak a été découverte par Peter Gostev, un utilisateur de LinkedIn, qui a partagé comment contourner les restrictions de l'IA pour générer des images d'enfants fumant. Bien que les invites de jailbreak soient assez complexes, cet incident rappelle que même les entreprises les plus riches de la Silicon Valley ont du mal à mettre en place des protections complètes pour leurs systèmes d'IA.