Petit mais puissant ! H2O.ai lance de nouveaux modèles de vision par IA surpassant les géants de la technologie dans le domaine de l'analyse de documents

AIbase基地

Publié leActualités IA · 5 minutes de lecture · Oct 18, 2024

234

Récemment, H2O.ai a annoncé le lancement de deux nouveaux modèles de langage visuel conçus pour améliorer l'efficacité de l'analyse de documents et des tâches de reconnaissance optique de caractères (OCR). Ces deux modèles, H2OVL Mississippi-2B et H2OVL-Mississippi-0.8B, affichent des performances remarquables, rivalisant avec les modèles des grandes entreprises technologiques et offrant potentiellement des solutions plus efficaces aux entreprises gérant des flux de travail importants de traitement de documents.

Le modèle H2OVL Mississippi-0.8B, bien qu'il ne compte que 800 millions de paramètres, a surpassé tous les autres modèles, y compris ceux disposant de plusieurs milliards de paramètres, dans la tâche de reconnaissance de texte OCRBench. Quant au modèle H2OVL Mississippi-2B, avec ses 2 milliards de paramètres, il a obtenu d'excellents résultats dans plusieurs tests de référence de langage visuel.

Sri Ambati, fondateur et PDG de H2O.ai, a déclaré lors d'une interview : « Nos modèles H2OVL Mississippi sont conçus pour être des solutions performantes et économiques, offrant une solution d'OCR, de compréhension visuelle et d'IA documentaire basée sur l'IA à tous les secteurs d'activité. »

Il a souligné que ces modèles fonctionnent efficacement dans divers environnements et peuvent être affinés en fonction des besoins spécifiques de chaque secteur, permettant ainsi aux entreprises d'améliorer leur efficacité tout en réduisant leurs coûts.

H2O.ai a publié gratuitement ces deux nouveaux modèles sur la plateforme Hugging Face, permettant aux développeurs et aux entreprises de les modifier et de les adapter à leurs propres besoins. Cette initiative élargit non seulement la base d'utilisateurs de H2O.ai, mais offre également davantage de choix aux entreprises souhaitant adopter des solutions d'IA documentaire.

M. Ambati a également mentionné l'avantage économique des modèles petits et spécialisés. « Nos modèles de transformateurs pré-entraînés génératifs sont basés sur une collaboration approfondie avec nos clients et visent à extraire des informations significatives des documents d'entreprise. » Il a souligné que les modèles H2O.ai offrent une capacité de traitement de documents efficace avec une consommation de ressources réduite, notamment pour les documents numérisés de mauvaise qualité, les écritures manuscrites difficiles à lire ou les documents fortement modifiés.

Accès aux modèles :

H2OVL-Mississippi-0.8B : https://huggingface.co/h2oai/h2ovl-mississippi-800m

H2OVL Mississippi-2B : https://huggingface.co/h2oai/h2ovl-mississippi-2b

Points clés :
🌟 H2O.ai lance les nouveaux modèles de langage visuel H2OVL Mississippi-2B et H2OVL-Mississippi-0.8B, offrant des solutions efficaces d'analyse de documents.
💡 Le modèle H2OVL Mississippi-0.8B surpasse ses concurrents plus volumineux dans les tâches de reconnaissance de texte, démontrant le potentiel des modèles plus petits.
📈 H2O.ai s'engage en faveur de solutions d'IA open source et pratiques, aidant les entreprises à extraire des informations précieuses dans leur transformation numérique.

Un ingénieur d'OpenAI refuse une offre d'emploi de la société d'IA de Musk, affirmant qu'elle menace la démocratie

Récemment, xAI, la société d'IA fondée par Elon Musk, a tenté de recruter un ingénieur d'OpenAI, mais s'est heurtée à un refus catégorique. Javier Soto, ingénieur chez OpenAI, a partagé sur le réseau social X une capture d'écran de sa réponse à xAI, surprenant de nombreux internautes. Dans ce message, Soto a déclaré sans équivoque : « Je ne peux pas travailler pour Elon Musk en toute bonne conscience. » Bien qu'il se dise satisfait de sa Tesla...

Hippocratic AI lève 141 millions de dollars pour développer des agents d'IA conviviaux pour les patients

Hippocratic AI, une startup qui développe des solutions d'IA conviviales pour les patients, a annoncé avoir bouclé un tour de table de série B de 141 millions de dollars, portant sa valorisation à 1,64 milliard de dollars. Ce tour de table a été mené par la société de capital-risque Kleiner Perkins, marquant une croissance rapide d'Hippocratic AI dans le secteur de la santé. En moins de deux ans d'existence, la société a déjà attiré l'attention de nombreux investisseurs et a précédemment obtenu...

Hippocratic AI obtient 141 millions de dollars de financement pour stimuler l'intelligence artificielle dans le secteur médical

Hippocratic AI, une start-up spécialisée dans le développement de solutions d'IA pour le secteur médical, a récemment annoncé avoir bouclé un tour de table de série B de 141 millions de dollars, portant sa valorisation à 1,64 milliard de dollars. Ce tour de table a été mené par la société de capital-risque renommée Kleiner Perkins, quelques mois après avoir levé 53 millions de dollars auprès de General Catalyst et Andreessen Horowitz, et cinq mois après une levée de fonds auprès de N...

Fireworks AI lance un outil révolutionnaire d'analyse de documents ! « Document Inlining » permet à l'IA de comprendre facilement les documents complexes

Fatigué de devoir gérer des documents non structurés de différents formats ? Fireworks AI a récemment lancé une fonctionnalité innovante appelée « Document Inlining », qui convertit les PDF, les captures d'écran, les images et autres documents non structurés en texte structuré compréhensible par les grands modèles linguistiques (LLM). Cela fournit aux robots conversationnels et aux modèles d'IA un contenu textuel directement utilisable, améliorant considérablement l'efficacité et la précision du traitement des documents par l'IA. Le cœur de Document Inlining réside dans ses puissantes capacités de composition...