Récemment, SnorkelAI a lancé une série de nouvelles fonctionnalités sur sa plateforme de développement de données IA, Snorkel Flow, visant à aider les entreprises à accélérer la spécialisation des modèles d'IA et d'apprentissage automatique. Ces nouvelles fonctionnalités permettent de réduire considérablement le temps, les coûts et la complexité de la préparation des données dans le cycle de vie de développement de l'IA prédictive et générative.

Cerveau, grand modèle, IA

Source : Image générée par IA, fournisseur de services d'autorisation d'images : Midjourney

Dans les entreprises d'aujourd'hui, disposer de « données prêtes pour l'IA » est crucial. Selon Gartner, les données prêtes pour l'IA ne signifient pas seulement que vos données doivent représenter des cas d'utilisation spécifiques, mais qu'elles doivent également couvrir tous les modes, erreurs, exceptions et situations inattendues afin d'entraîner ou d'exécuter efficacement les modèles d'IA. De plus, la préparation des données n'est pas un processus ponctuel, mais un processus continu.

La nouvelle version de Snorkel Flow offre aux entreprises une plateforme puissante pour mettre en œuvre et étendre les pratiques de développement de données IA, accélérant ainsi la production et la livraison de modèles IA spécialisés et hautement précis.

Plus précisément, les nouvelles fonctionnalités incluent un outil d'évaluation des LLM, permettant aux utilisateurs de réaliser des évaluations personnalisées pour des cas d'utilisation spécifiques à un secteur, afin de mieux comprendre les types d'erreurs des modèles et d'intervenir rapidement dans le développement des données pour les corriger. De plus, un workflow d'optimisation RAG améliore la précision de la recherche grâce à un traitement avancé des blocs de documents, à l'ajustement fin des modèles d'intégration et à l'extraction des métadonnées des documents. Ces fonctionnalités permettent de réduire considérablement le temps de développement nécessaire pour améliorer la qualité des réponses des assistants IA.

Quant à la nouvelle fonctionnalité de reconnaissance d'entités nommées (NER) pour les fichiers PDF, les utilisateurs peuvent simplement cliquer sur le texte, dessiner des zones, spécifier des modèles et fournir des indications au modèle de base pour extraire des informations plus facilement et plus rapidement. Cette flexibilité simplifie la capture d'informations, améliorant ainsi la précision des modèles NER.

En outre, Snorkel Flow simplifie les processus d'annotation et de retour d'information, permettant aux experts d'annoter les données plus efficacement. De plus, le nouvel outil d'analyse de marquage séquentiel aide les utilisateurs à identifier plus facilement les erreurs de prédiction des modèles, tout en offrant une analyse des performances plus détaillée.

En termes d'expérience utilisateur, Snorkel Flow a subi une série d'améliorations pour faciliter la collaboration entre les data scientists et les experts. Il prend en charge l'intégration transparente avec les principales plateformes de développement d'IA, notamment Databricks et Amazon SageMaker, pour un réglage fin et un déploiement plus rapides des modèles spécialisés.

Alex Ratner, PDG de Snorkel AI, a déclaré : « L'IA est devenue une priorité pour tous les dirigeants d'entreprise, mais le développement continu et cohérent de l'IA reste une tâche fastidieuse, coûteuse et exigeant beaucoup de main-d'œuvre. Par conséquent, ces mises à jour de la plateforme sont essentielles pour aider les entreprises à accélérer et à optimiser la livraison de solutions IA. »

Points clés :

🌟 Nouvelles fonctionnalités : Snorkel Flow lance un outil d'évaluation des LLM et un workflow d'optimisation RAG pour améliorer l'efficacité de la préparation des données.

📄 Extraction simplifiée : La nouvelle fonctionnalité de reconnaissance d'entités nommées simplifie et accélère l'extraction d'informations à partir de PDF.

🤝 Expérience optimisée : L'expérience utilisateur est améliorée pour favoriser une collaboration efficace entre les data scientists et les experts.