ChinaZ.com (站长之家) - 22 de junho de 2024: A Tencent Cloud lançou recentemente o motor de conhecimento de modelos grandes, uma ferramenta que permite construir rapidamente assistentes de serviço de conhecimento. Ele é especialmente eficiente no processamento de documentos PDF complexos, incluindo relatórios setoriais, apresentações de PowerPoint, livros didáticos, manuais, contratos e documentos acadêmicos, que geralmente contêm texto, imagens e tabelas, com formatos complexos, representando um desafio para as tecnologias tradicionais de OCR.

微信截图_20240622104006.png

O motor de conhecimento de modelos grandes da Tencent Cloud utiliza o modelo de análise de documentos multimodais desenvolvido pelo Tencent Youtu Lab. Através da análise de layout, ele localiza a posição e o tipo de conteúdo do documento, realiza a identificação precisa e gera uma saída coerente e legível na ordem de leitura humana. Ele consegue entender e processar elementos de layout complexos, como tabelas e fórmulas, podendo até mesmo inferir e reconstruir corretamente os dados e a estrutura das tabelas, aumentando significativamente a precisão da identificação.

Além disso, o motor de conhecimento suporta mais de 20 idiomas, caracteres tradicionais e caracteres raros, podendo converter imagens e documentos PDF em formato Markdown, fornecendo uma fonte de dados estruturada para o treinamento de modelos grandes, melhorando a capacidade de generalização e adaptação do modelo. Atualmente, a precisão da função de análise de documentos atinge mais de 98% e já foi integrada em diversos produtos, além de oferecer serviços de API padronizados.

Endereço de experiência: https://ocrdemo.cloud.tencent.com/