Récemment, la société d'intelligence artificielle Anthropic a annoncé l'ajout d'une fonctionnalité de traitement de fichiers PDF à son modèle Claude 3.5 Sonnet. Cette fonctionnalité est actuellement en phase de test public. Les utilisateurs peuvent désormais utiliser ce modèle pour analyser le texte et les éléments visuels des documents PDF, notamment les images, les graphiques et les tableaux. Cela s'applique à divers scénarios, tels que les rapports financiers, les documents juridiques et la traduction de documents.

Le traitement des PDF par Claude 3.5 Sonnet se déroule en trois étapes. Tout d'abord, le système extrait le contenu textuel du document. Ensuite, chaque page du document est convertie en image pour une analyse plus approfondie. Ainsi, les utilisateurs peuvent non seulement obtenir des informations textuelles, mais aussi comprendre les informations visuelles du fichier PDF.

Il est important de noter que la fonctionnalité PDF de Claude peut être combinée avec d'autres fonctionnalités, telles que l'extraction d'informations spécifiques pour les utiliser comme entrée d'outils. Il est à noter que les fichiers téléchargés doivent être inférieurs à 32 Mo et ne pas dépasser 100 pages. Le système ne prend actuellement pas en charge les documents cryptés ou protégés par mot de passe.

Les coûts de traitement des fichiers PDF varient en fonction de la longueur et de la densité du contenu du document. En général, chaque page de document consomme entre 1 500 et 3 000 jetons, sans frais supplémentaires au-delà des frais de jetons standard. Les utilisateurs peuvent accéder à cette nouvelle fonctionnalité via la fonction Claude Chat et l'API, en utilisant l'en-tête de requête spécifique « anthropic-beta: pdfs-2024-09-25 » pour les requêtes API. Anthropic prévoit d'étendre cette fonctionnalité aux plateformes Amazon Bedrock et Google Vertex AI à l'avenir.

Pour améliorer les performances de traitement, Anthropic recommande aux utilisateurs de s'assurer que le document contient un texte clair et lisible et que la mise en page est correcte. De plus, lors de la citation de contenu spécifique, les utilisateurs doivent utiliser les numéros de page affichés dans le lecteur PDF. Lors de l'utilisation de l'API, le fichier PDF doit être placé avant le texte. Si le document est volumineux et dépasse les limites, Anthropic recommande de le diviser en plus petites parties. Enfin, lors de l'analyse répétée du même document, les utilisateurs peuvent également envisager d'utiliser le cache d'invite pour améliorer l'efficacité du traitement.

Points clés :

📄 Anthropic lance Claude 3.5 Sonnet avec une fonctionnalité de traitement de fichiers PDF, prenant en charge l'analyse de texte et d'images.  

🖼️ Le processus de traitement comprend trois étapes : extraction de texte, conversion des pages en images et analyse globale.  

💰 Les frais de traitement varient en fonction de la longueur et de la densité du document. Les utilisateurs doivent respecter les limites de taille et de nombre de pages.