Recentemente, a empresa de inteligência artificial Anthropic anunciou a adição de funcionalidade de processamento de arquivos PDF ao seu modelo Claude 3.5 Sonnet. Este recurso agora está em fase de teste público. Os usuários podem usar o modelo para analisar texto e elementos visuais em documentos PDF, incluindo imagens, gráficos e tabelas. Isso é útil para diversos cenários, como relatórios financeiros, documentos legais e tradução de documentos.
O processamento de PDF do Claude 3.5 Sonnet ocorre em três etapas. Primeiro, o sistema extrai o conteúdo de texto do documento. Em seguida, cada página do documento é convertida em imagem para análise mais aprofundada. Isso permite que os usuários obtenham não apenas informações de texto, mas também insights sobre as informações visuais do PDF.
Vale ressaltar que a funcionalidade de PDF do Claude pode ser combinada com outros recursos, como a extração de informações específicas para uso como entrada de ferramentas. É importante notar que os arquivos enviados devem ter menos de 32 MB e não mais de 100 páginas. O sistema atualmente não suporta documentos criptografados ou protegidos por senha.
O custo do processamento de arquivos PDF varia de acordo com o comprimento e a densidade do conteúdo do documento. Normalmente, cada página consome de 1.500 a 3.000 tokens, sem custos adicionais além da taxa padrão de tokens. Os usuários podem acessar esse novo recurso através do Claude Chat e da API, sendo necessário usar o cabeçalho de solicitação específico "anthropic-beta: pdfs-2024-09-25" nas solicitações da API. A Anthropic planeja expandir este recurso para as plataformas Amazon Bedrock e Google Vertex AI no futuro.
Para melhorar o processamento, a Anthropic recomenda que os usuários garantam que o documento tenha texto legível e um layout de página correto. Além disso, ao citar conteúdo específico, os usuários devem usar os números de página exibidos no leitor de PDF. Durante o uso da API, o arquivo PDF deve ser colocado antes do texto. Se o documento for muito grande, excedendo os limites, a Anthropic recomenda dividi-lo em partes menores. Finalmente, ao analisar o mesmo documento várias vezes, os usuários podem considerar o uso de cache de prompts para melhorar a eficiência do processamento.
Destaques:
📄 A Anthropic lançou o Claude 3.5 Sonnet, adicionando funcionalidade de processamento de arquivos PDF, com suporte para análise de texto e imagens.
🖼️ O processamento consiste em três etapas: extração de texto, conversão de páginas em imagens e análise abrangente.
💰 O custo de processamento varia de acordo com o comprimento e a densidade do conteúdo do documento; os usuários devem respeitar os limites de tamanho e número de páginas.