Bienvenue à la rubrique 【AI日报】 ! Votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les actualités les plus importantes du domaine de l'IA, en mettant l'accent sur les développeurs, pour vous aider à comprendre les tendances technologiques et les applications innovantes des produits d'IA.

Nouveaux produits IA Cliquez ici pour en savoir plus :https://top.aibase.com/

1、Sonnet ! Le modèle Reflection70B, surpassant GPT-4o et Claude3.5, fait son apparition

Matt Shumer, PDG de HyperWrite, a annoncé le lancement du modèle Reflection70B, basé sur le modèle Meta open source Llama3.1-70B Instruct. Considéré comme le modèle d'IA open source le plus puissant au monde, il intègre une technologie d'autocorrection améliorant la précision de l'inférence et le rendant adapté aux tâches de haute précision. HyperWrite est en train d'intégrer Reflection70B à son assistant d'écriture IA, et une version encore plus puissante, Reflection405B, sera bientôt disponible.

image.png

【AiBase résumé :】

🚀 Le modèle Reflection70B offre des performances exceptionnelles et est considéré comme le modèle d'IA open source le plus puissant au monde.

🔍 Reflection70B possède une technologie d'autocorrection, améliorant ainsi la précision de l'inférence et le rendant adapté aux tâches de haute précision.

💡 HyperWrite lancera une version encore plus puissante, Reflection405B, poursuivant ainsi l'exploration des applications technologiques dans les produits réels.

Lien détaillé :https://huggingface.co/mattshumer/Reflection-Llama-3.1-70B

2、Impressionnant ! OpenAI dépasse le million d'utilisateurs commerciaux payants, plus de 200 millions d'utilisateurs gratuits pour ChatGPT

Les activités payantes d'OpenAI franchissent une étape importante : le nombre d'utilisateurs commerciaux payants de ChatGPT dépasse le million, témoignant d'une forte demande du marché. Les utilisateurs professionnels rapportent une augmentation de leur productivité de 92 % et un gain de temps considérable grâce à l'utilisation des produits ChatGPT. La croissance est rapide sur le marché international, l'Allemagne, le Japon et le Royaume-Uni étant d'importantes sources d'utilisateurs.

【AiBase résumé :】

🚀 Le nombre d'utilisateurs commerciaux payants de ChatGPT d'OpenAI dépasse le million, une croissance significative qui témoigne d'une forte demande du marché.

⏱ Les utilisateurs professionnels rapportent une augmentation de leur productivité de 92 % et un gain de temps considérable grâce à l'utilisation des produits ChatGPT.

🌏 Le marché international connaît une croissance rapide, l'Allemagne, le Japon et le Royaume-Uni étant d'importantes sources d'utilisateurs.

3、Mianbi Intelligence lance le modèle embarqué MiniCPM3.0 : fonctionnement possible avec seulement 2 Go de RAM

Mianbi Intelligence a récemment lancé MiniCPM3.0, un modèle d'IA aux performances exceptionnelles capable de fonctionner sur des appareils disposant de seulement 2 Go de RAM, annonçant une nouvelle ère pour l'expérience IA embarquée. MiniCPM3.0 surpasse GPT-3.5 et offre des services d'IA comparables sur les appareils mobiles, permettant aux utilisateurs de profiter de services d'IA locaux sans dépendre du traitement cloud, garantissant ainsi une interaction intelligente plus fluide et plus privée.

image.png

【AiBase résumé :】

🚀 MiniCPM3.0, avec ses 4 milliards de paramètres, surpasse GPT-3.5 et offre des services d'IA comparables à ceux de GPT-3.5 sur les appareils mobiles.

💡 MiniCPM3.0 se caractérise par sa capacité de traitement de textes infiniment longs, ses performances de Function Calling les plus puissantes sur les appareils embarqués et ses puissantes fonctionnalités RAG, ce qui lui confère des avantages considérables.

🔮 Le lancement de MiniCPM3.0 favorise l'implémentation des grands modèles d'IA dans les applications concrètes, offrant aux utilisateurs une expérience intelligente plus riche et plus pratique.

Lien détaillé :https://github.com/OpenBMB/MiniCPM https://huggingface.co/openbmb/MiniCPM3-4B

4、DeepSeek mis à jour ! DeepSeek V2.5 améliore considérablement les capacités de codage du modèle de conversation

DeepSeek-V2.5 démontre une fois de plus sa position de leader dans le domaine de l'intelligence artificielle, en obtenant une amélioration significative de son taux de réussite lors de confrontations avec GPT-4. Il affiche d'excellentes performances sur plusieurs ensembles de tests, démontrant sa capacité à comprendre des problèmes complexes et à proposer des solutions, tout en affichant une grande adaptabilité et précision en chinois et en anglais. Outre l'amélioration du taux de réussite, des progrès significatifs ont été réalisés en termes d'indicateurs de notation et de capacité de génération de code. L'équipe a également développé le framework Fire-Flyer AI-HPC, optimisant les performances, la rentabilité et l'efficacité énergétique.

1.jpg

【AiBase résumé :】

🚀 DeepSeek-V2.5 a considérablement amélioré son taux de réussite lors de confrontations avec GPT-4, démontrant ainsi sa position de leader technologique.

💡 L'amélioration des résultats reflète sa capacité à comprendre des problèmes complexes et à proposer des solutions.

💻 Ses capacités de génération de code ont été renforcées, et le framework Fire-Flyer AI-HPC a été développé pour optimiser les performances, la rentabilité et l'efficacité énergétique.

Lien détaillé :https://top.aibase.com/tool/deepseek-chat

5、Une restitution plus réaliste que l'original ! Le nouveau projet de ByteDance, Loopy, permet une parfaite correspondance entre la voix et l'image des avatars numériques. La terrible sensation de décalage a enfin disparu.

Récemment, une équipe de recherche conjointe de ByteDance et de l'Université de Zhejiang a développé LOOPY, un modèle de diffusion vidéo basé sur l'audio. Contrairement aux technologies précédentes nécessitant une aide complexe des signaux spatiaux, LOOPY ne nécessite qu'une seule image et une entrée audio pour permettre à l'avatar virtuel de présenter des effets dynamiques étonnants.

【AiBase résumé :】

🎤 LOOPY génère des vidéos dynamiques à partir de photos statiques grâce à l'audio, améliorant ainsi la synchronisation audiovisuelle des avatars virtuels.

💃 Cette technologie ne nécessite qu'une seule image et une entrée audio pour générer des détails hautement réalistes, y compris les micro-expressions faciales, les changements subtils des sourcils et des yeux, ainsi que les mouvements naturels de la tête.

🌟 LOOPY surpasse les technologies existantes en termes de diversité d'expression et de réalisme, et prend également en charge la génération de mouvements non verbaux (tels que les soupirs, les expressions faciales émotionnelles).

Pour plus de détails : https://mp.weixin.qq.com/s/OKGzJ5Jnt6VAHj2eXlInVg

6、Gratuit pour une durée limitée ! La fonction d'appel vidéo de l'application Zhishu Qingyan est ouverte à tous les utilisateurs.

Zhishu Huazhang Technology a récemment lancé "Qingyan", un produit d'intelligence artificielle doté d'une nouvelle fonction d'appel vidéo offrant aux utilisateurs une expérience interactive plus intuitive. Le lancement de cette fonction améliore non seulement l'expérience utilisateur, mais met également en évidence les capacités d'innovation de l'entreprise dans le domaine de l'intelligence artificielle.

image.png

【AiBase résumé :】

📹 La fonction d'appel vidéo est entièrement ouverte, permettant aux utilisateurs d'interagir plus intuitivement avec l'IA.

👁️ L'IA peut « voir » l'environnement de l'utilisateur, comprendre ses expressions et ses émotions, et offrir une expérience d'échange personnalisée.

🚀 Le lancement de cette fonction met en évidence les capacités d'innovation de Zhishu Huazhang Technology dans le domaine de l'intelligence artificielle.

7、RapidLayoutRecover : restauration instantanée des images de documents en texte, préservation précise de la mise en page.

À l'ère du numérique, RapidLayoutRecover est un outil innovant de traitement d'images de documents qui permet de convertir efficacement les documents papier en fichiers texte Word ou TXT modifiables, tout en conservant la mise en page d'origine. Sa fonction de reconnaissance automatique intelligente permet de gagner du temps et des efforts par rapport à la saisie manuelle ou à la reconstruction des documents, offrant ainsi une grande commodité aux utilisateurs.

image.png

【AiBase résumé :】

🔍 RapidLayoutRecover convertit efficacement les images de documents tels que les pages numérisées et les pages PDF en texte modifiable, en conservant la mise en page.

🤖 L'outil dispose d'une fonction de reconnaissance automatique intelligente, reconnaissant précisément les éléments textuels, les tableaux et les formules, évitant ainsi la saisie manuelle fastidieuse.

💡 RapidLayoutRecover intègre plusieurs modules professionnels, notamment la classification de l'orientation des documents, l'analyse de la mise en page, la reconnaissance des tableaux, des formules et du texte, permettant une extraction efficace des informations.

Lien détaillé :https://github.com/RapidAI/RapidLayoutRecover

8、Google Photos lance la fonction de recherche IA « Demander aux photos »

La nouvelle fonction « Demander aux photos » de Google Photos révolutionnera l'interaction des utilisateurs avec leurs albums photos numériques, en permettant de rechercher des photos via des requêtes en langage naturel pour obtenir des résultats plus approfondis. Cette fonction basée sur l'IA simplifie non seulement le processus de recherche de photos, mais offre également aux utilisateurs une expérience interactive plus personnalisée et intelligente.

image.png

【AiBase résumé :】

🔍 Le modèle Gemini AI comprend le contenu et les métadonnées des photos, permettant des requêtes plus complexes.

🔎 Les utilisateurs peuvent rechercher des photos en langage naturel, par exemple en posant des questions sur un événement spécifique ou en obtenant des informations utiles.

🔒 Les réponses de l'IA respectent les principes de confidentialité, garantissant que les photos des utilisateurs ne sont pas utilisées à des fins de ciblage publicitaire et ne sont pas soumises à un examen humain.

9、Intégration de Baidu Wenxin Yiyin à Baidu Netdisk : les fichiers peuvent être importés directement depuis Baidu Netdisk

Baidu AI a récemment lancé une nouvelle fonctionnalité permettant aux utilisateurs d'importer directement les fichiers de Baidu Netdisk sur la plateforme Wenxin Yiyin, simplifiant considérablement le processus de téléchargement et de gestion des fichiers, permettant aux utilisateurs d'accéder et de traiter plus rapidement les différents documents stockés sur Netdisk.

image.png

【AiBase résumé :】

🚀 Les utilisateurs peuvent synchroniser des documents, des livres et des rapports de Baidu Netdisk vers Wenxin Yiyin en trois étapes simples.

📄 Cette fonction prend en charge les formats de fichiers courants tels que Word, PDF, TXT, Excel et PPT.

💼 Baidu AI propose différents quotas de téléchargement pour les utilisateurs de Wenxin Yiyin. Les utilisateurs de la version standard peuvent télécharger jusqu'à 10 fichiers en une seule fois, tandis que les utilisateurs de la version professionnelle peuvent télécharger jusqu'à 100 fichiers.

10、Lutte contre le plagiat par l'IA ! YouTube développe une technologie de reconnaissance de chant synthétique

YouTube a récemment annoncé le lancement de nouveaux outils visant à aider les créateurs à gérer et à protéger leur image sonore, notamment sous l'influence de l'intelligence artificielle générative. Ces nouveaux outils comprennent une technologie de reconnaissance de chant synthétique et une technologie de reconnaissance de vidéos deepfake, visant à protéger les droits des créateurs. YouTube luttera également contre le téléchargement non autorisé de contenu afin d'empêcher l'abus du contenu des créateurs. Ils soulignent que l'IA doit renforcer la créativité humaine et non la remplacer.

【AiBase résumé :】

🎤 Technologie de reconnaissance de chant synthétique : aide les créateurs à identifier le contenu vocal simulé par l'IA.

🛡️ Technologie de reconnaissance de vidéos deepfake : protège l'image des créateurs contre les abus.

🚫 Lutte contre le téléchargement non autorisé : renforcement de la lutte contre les téléchargements non autorisés, protection des droits des créateurs.

Lien détaillé :https://blog.youtube/news-and-events/responsible-ai-tools/

11、Replit lance Replit Agent, un assistant de programmation IA, permettant même aux débutants de développer des applications.

L'assistant de développement d'applications IA Replit Agent utilise la technologie de traitement du langage naturel pour permettre aux utilisateurs de construire des projets logiciels à partir de descriptions simples en langage naturel, réduisant ainsi le seuil d'entrée de la programmation et concrétisant les idées. Le développement rapide de prototypes, le déploiement transparent et la prise en charge des appareils mobiles rendent le développement de projets plus efficace et plus pratique.

image.png

【AiBase résumé :】

🚀 Grâce à la technologie de traitement du langage naturel, la complexité de la programmation est simplifiée, au bénéfice des débutants et des développeurs expérimentés.

🛠️ Le développement rapide de prototypes permet de transformer rapidement les idées en prototypes concrets, offrant de nombreuses opportunités d'apprentissage de la programmation.

🌐 La fonction de déploiement transparent simplifie la configuration des serveurs et des bases de données, permettant de déployer facilement les applications sur le cloud.

Lien détaillé :https://docs.replit.com/replitai/agent