ChinaZ.com, 22 de junio de 2024: Tencent Cloud ha lanzado recientemente un motor de conocimiento de modelos grandes, una herramienta que permite construir rápidamente asistentes de servicio de conocimiento. Es especialmente bueno para procesar documentos PDF complejos, incluyendo informes sectoriales, presentaciones de PowerPoint, libros de texto, manuales, contratos y documentos académicos, documentos que a menudo contienen texto, imágenes y tablas, con formatos complejos que suponen un desafío para las tecnologías OCR tradicionales.
El motor de conocimiento de modelos grandes de Tencent Cloud utiliza el modelo de análisis de documentos multimodales de investigación propia de Tencent Youtu Lab. Analiza el diseño para localizar la posición y el tipo de contenido del documento, luego lo identifica con precisión y genera un contenido coherente y legible en el orden de lectura humano. Puede comprender y procesar elementos de diseño complejos, como tablas y fórmulas, e incluso puede inferir y restaurar correctamente los datos y la estructura de las tablas, lo que aumenta considerablemente la precisión de reconocimiento.
Además, el motor de conocimiento admite más de 20 idiomas, caracteres tradicionales y caracteres poco comunes, y puede convertir imágenes y documentos PDF a formato Markdown, proporcionando una fuente de datos estructurada para el entrenamiento de modelos grandes, mejorando la capacidad de generalización y adaptabilidad del modelo. Actualmente, la precisión de la función de análisis de documentos alcanza el 98% o más, se ha implementado en varios productos y ofrece servicios API estandarizados.
Enlace de prueba: https://ocrdemo.cloud.tencent.com/