Bienvenue à la rubrique 【AI日报】 ! Votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les actualités les plus importantes du domaine de l'IA, en nous concentrant sur les développeurs et en vous aidant à comprendre les tendances technologiques et les applications innovantes des produits IA.

Nouveaux produits IA Cliquez ici pour en savoir plus :https://top.aibase.com/

1. OpenAI lance gpt-4o-transcribe, un nouveau modèle de transcription vocale, avec une précision accrue

OpenAI a récemment lancé trois nouveaux modèles vocaux : gpt-4o-transcribe, gpt-4o-mini-transcribe et gpt-4o-mini-tts. Parmi eux, gpt-4o-transcribe attire particulièrement l'attention. Ce modèle excelle dans le domaine de la transcription vocale, avec un taux d'erreur considérablement réduit, atteignant 2,46 % pour la transcription anglaise. De plus, gpt-4o-transcribe prend en charge la transcription dans des environnements complexes, grâce à des technologies de suppression du bruit et de détection de l'activité vocale sémantique.

image.png

【Résumé AiBase :】

🔊 Le taux d'erreur de gpt-4o-transcribe est aussi bas que 2,46 % pour la transcription anglaise, surpassant largement le modèle Whisper précédent.

🌍 Prise en charge de plus de 100 langues, avec une grande précision même dans des environnements bruyants et avec différents accents.

💻 Les développeurs peuvent facilement intégrer le nouveau modèle via une API, ce qui favorise le développement des applications d'interaction vocale.

Lien détaillé : https://top.aibase.com/tool/openai-fm

2. Amélioration de la recherche IA sur Kuaishou : intégration complète de DeepSeek R1, une expérience de recherche transformée !

Kuaishou a récemment annoncé l'intégration complète de son grand modèle DeepSeek R1 à sa fonction de recherche. Cette initiative vise à améliorer considérablement les résultats de recherche et l'expérience utilisateur, stimulant ainsi l'activité des utilisateurs. Parallèlement, Kuaishou explore activement le potentiel de monétisation des scénarios de recherche intelligente. Grâce à l'intégration de DeepSeek, la plateforme de création de contenu IA « Keling AI » de Kuaishou est devenue plus efficace dans les domaines de la génération de vidéos et d'images. Les utilisateurs peuvent contrôler le processus de création de manière plus précise, enrichissant ainsi considérablement les possibilités de création.

image.png

【Résumé AiBase :】

🚀 La fonction de recherche de Kuaishou est désormais entièrement intégrée au grand modèle DeepSeek R1, améliorant les résultats de recherche et l'expérience utilisateur.

💡 La plateforme de création de contenu IA « Keling AI » étant intégrée à DeepSeek, les utilisateurs peuvent générer et optimiser les invites plus efficacement.

🎥 La version inspirée de DeepSeek est étroitement liée au « répertoire d'idées » de Kuaishou, permettant aux utilisateurs de contrôler précisément les éléments clés de la création.

3. Claude intègre une fonction de recherche sur le Web, offrant des informations en temps réel et des références de sources

Anthropic est en train d'ajouter une fonction de recherche sur le Web à son assistant IA Claude afin de fournir des informations plus actuelles. Contrairement aux moteurs de recherche traditionnels, Claude transforme les résultats de recherche en réponses conversationnelles et indique précisément les sources d'information. Cette fonction est actuellement uniquement disponible pour les utilisateurs payants aux États-Unis, et son extension à d'autres pays et aux comptes gratuits est prévue.

image.png

【Résumé AiBase :】

🌐 Claude transforme les résultats de recherche en ligne en réponses conversationnelles et indique les sources d'information.

💰 La fonction de recherche sur le Web est actuellement réservée aux utilisateurs payants aux États-Unis, mais son extension à d'autres pays est prévue.

⚖️ La baisse du trafic générée par les robots de recherche représente un défi pour les sites Web qui dépendent du trafic.

4. ByteDance lance InfiniteYou, un framework de génération d'images à partir de texte : conservation des traits du visage, changement de scène à volonté

InfiniteYou (InfU), lancé par ByteDance, est un outil innovant de génération d'images qui permet de générer des images personnalisées de haute qualité à partir de descriptions textuelles. Sa technologie principale, InfuseNet, grâce à une stratégie d'entraînement précise, garantit que les images générées conservent les caractéristiques d'identité de l'utilisateur tout en permettant une modification flexible des scènes et du contenu.

image.png

【Résumé AiBase :】

🧑‍🚀 InfiniteYou est un modèle de génération d'images lancé par ByteDance, capable de générer des images personnalisées à partir de descriptions textuelles.

🔧 La technologie principale, InfuseNet, grâce à un entraînement précis, garantit que les images générées conservent les caractéristiques d'identité de l'utilisateur tout en permettant une modification flexible des scènes.

🌐 Cet outil est compatible avec de nombreux outils existants, convient à la recherche universitaire et doit respecter les licences et réglementations applicables.

Lien détaillé : https://top.aibase.com/tool/infiniteyou

5. Nouvelles fonctionnalités pour Tencent Yuanbao : analyse des feuilles de calcul Excel complexes

Les nouvelles fonctionnalités de Tencent Yuanbao améliorent considérablement la facilité d'utilisation pour le traitement des feuilles de calcul Excel. Les utilisateurs n'ont qu'à poser des questions en langage naturel, et Yuanbao lit rapidement les données, effectue des calculs et met même en évidence les informations importantes, simplifiant ainsi les processus complexes. Même les novices d'Excel peuvent facilement effectuer des analyses de données.

image.png

【Résumé AiBase :】

📝 La nouvelle fonctionnalité permet aux utilisateurs de poser des questions en langage naturel, simplifiant ainsi le processus d'analyse des données Excel.

⚡ Le modèle Hun Yuan Turbo S traite rapidement les tableaux complexes, améliorant l'efficacité de l'analyse.

📱 Prise en charge multiplateforme, les utilisateurs peuvent télécharger et analyser des tableaux où qu'ils soient.

6. Krea AI lance la fonction « Video Training » : entraînement de votre propre style vidéo personnalisé

Krea AI a récemment lancé la nouvelle fonction « Video Training », qui permet aux utilisateurs d'entraîner leur propre modèle de style vidéo IA en téléchargeant des images et des vidéos personnelles. Cette fonction, basée sur le modèle Wan2.1, permet aux utilisateurs d'apprendre des styles artistiques et des mouvements dynamiques spécifiques, améliorant considérablement la personnalisation et la flexibilité de la création de contenu. Les utilisateurs peuvent ajuster plusieurs paramètres selon leurs besoins, et le modèle de style généré peut être directement appliqué à la plateforme Krea Video.

image.png

【Résumé AiBase :】

📹 Les utilisateurs peuvent télécharger des images et des vidéos pour entraîner leur propre modèle de style vidéo IA.

⚙️ Expérience utilisateur flexible, les utilisateurs peuvent ajuster les paramètres d'entraînement pour optimiser les performances du modèle.

🌟 Cette fonction ouvre de nouvelles possibilités aux créateurs de contenu et améliore leur efficacité.

Lien détaillé : https://www.krea.ai/train

7. DomoAI lance une fonction de génération de personnages numériques à partir de la voix et de l'image : une nouvelle percée dans la création de contenu numérique

La nouvelle fonction de DomoAI, qui permet aux utilisateurs de générer des personnages numériques capables de parler en téléchargeant de la voix et des images, a suscité de vives discussions et marque une innovation majeure dans la création de contenu numérique. Cette fonction prend non seulement en charge la synchronisation labiale, mais permet également de générer des courtes vidéos de différentes durées, avec une excellente prise en charge du chinois, améliorant considérablement la flexibilité et l'efficacité de la création.

image.png

【Résumé AiBase :】

🎤 Les utilisateurs peuvent rapidement générer des personnages virtuels capables de parler en téléchargeant de la voix et des images, avec plusieurs options de durée.

🚀 Cette fonction est rapide, avec une excellente prise en charge du chinois, répondant aux besoins de différents scénarios.

🎨 La technologie innovante de DomoAI réduira le seuil de création de contenu et favorisera une intégration approfondie de l'IA et de l'industrie du divertissement.

Lien détaillé : https://www.domoai.app/en/create/talking-avatar

8. Sider AI lance la fonction Deep Research : simulation automatique du comportement de recherche humain et génération de rapports interactifs visualisés

La fonction Deep Research récemment lancée par Sider AI a suscité un large intérêt, car elle est capable de simuler le comportement de recherche humain et de générer automatiquement des rapports visualisés. Cette fonction améliore l'efficacité de la recherche grâce à des notes en temps réel et à des sources d'information transparentes, tout en offrant un meilleur contrôle à l'utilisateur.

image.png

【Résumé AiBase :】

🤖 La fonction Deep Research simule le comportement de recherche humain, accède automatiquement aux informations en ligne et génère des notes en temps réel.

📊 Après la collecte d'informations, cette fonction génère automatiquement une page Web interactive visualisée, comprenant des graphiques et des organigrammes.

🔍 Les utilisateurs peuvent intégrer de manière transparente la recherche automatisée et manuelle via une extension de navigateur, ce qui convient à de nombreux scénarios de recherche.

Lien détaillé : https://sider.ai/wisebase/deep-research

9. Un lycéen crée un site Web d'évaluation de modèles IA grâce à Minecraft : participation citoyenne à l'évaluation des modèles

Avec le développement rapide de la technologie de l'intelligence artificielle, l'évaluation et la comparaison des capacités des modèles d'IA génératifs constituent un défi majeur. Le site Web MC-Bench utilise le jeu Minecraft pour proposer une nouvelle méthode d'évaluation. Les utilisateurs peuvent voter sur les constructions générées par l'IA sans le savoir. Cette idée innovante non seulement augmente la participation du public, mais fournit également une expérience visuelle intuitive pour l'évaluation des modèles IA.

image.png

【Résumé AiBase :】

🎮 MC-Bench utilise Minecraft comme plateforme d'évaluation, permettant aux utilisateurs d'évaluer les performances des modèles IA par le biais de votes.

👨‍🎓 Ce projet a été lancé par un lycéen et a reçu le soutien de plusieurs entreprises d'IA de premier plan, démontrant l'innovation des jeunes.

🛠️ À l'avenir, MC-Bench pourrait être étendu à des tâches IA plus complexes, devenant ainsi un outil efficace pour tester les capacités de raisonnement de l'IA.

Lien détaillé : https://top.aibase.com/tool/mc-bench

10. Créé par un ancien scientifique de Google ! Reka open-source Reka Flash 3, plus performant que Gemma 3 27B

Reka AI a récemment lancé son premier modèle open-source, Reka Flash3, un modèle d'inférence généraliste de 21 milliards de paramètres qui a suscité un vif intérêt dans l'industrie. Bien que son nombre de paramètres soit inférieur à celui de certains concurrents, sa formation à partir de zéro et son optimisation approfondie lui confèrent des performances exceptionnelles. Reka Flash3 possède non seulement de puissantes capacités d'inférence, mais prend également en charge un déploiement à faible latence et convivial pour les appareils, ce qui convient à de nombreux types d'utilisation.

image.png

【Résumé AiBase :】

🚀 Reka Flash3 est un modèle open-source lancé par Reka AI, une entreprise fondée par d'anciens scientifiques de Google DeepMind. Il possède 21 milliards de paramètres et surpasse de nombreuses autres modèles.

💡 Ce modèle possède de puissantes capacités d'inférence, prend en charge la résolution de problèmes complexes et le raisonnement en plusieurs étapes, et convient à divers scénarios d'applications innovants.

📱 Reka Flash3 est à faible latence et convivial pour le déploiement sur les appareils, et pourrait à l'avenir fournir des services pratiques directement sur les appareils mobiles.

Lien détaillé : https://top.aibase.com/tool/reka-flash-3

11. Shengshu Technology Vidu obtient les droits d'adaptation de 7 courts métrages basés sur des IP de romans en ligne de plusieurs millions de vues

La plateforme de génération vidéo IA Vidu de Beijing Shengshu Technology Co., Ltd. a récemment obtenu les droits d'adaptation de 7 courts métrages basés sur des IP de romans en ligne de plusieurs millions de vues, marquant une nouvelle étape dans le développement du marché chinois des courts métrages d'animation. Ces œuvres couvrent divers genres, tels que la fantasy, la science-fiction, le wuxia et les romances urbaines, et possèdent une large base de fans et un fort potentiel d'adaptation cinématographique.

image.png

【Résumé AiBase :】

🎬 Vidu obtient les droits d'adaptation de 7 courts métrages basés sur des IP de romans en ligne de plusieurs millions de vues, couvrant divers genres.