AI Quotidien : Douyin teste l'intégration de Doubao AI ; iDream intègre DeepSeek pour une génération intelligente de prompts ; le mode vocal Grok est entièrement ouvert

Bienvenue à la rubrique 【AI日报】 ! Votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les actualités les plus importantes du domaine de l'IA, en mettant l'accent sur les développeurs, pour vous aider à comprendre les tendances technologiques et les applications innovantes des produits d'IA.

Nouveaux produits IA Cliquez ici pour en savoir plus : https://top.aibase.com/

1、Douyin s'associe à Doubao AI : ByteDance lance une stratégie d'écosystème IA superpuissante

L'application Douyin est en train de tester l'intégration de Doubao AI, marquant ainsi l'accélération du déploiement de l'écosystème IA par ByteDance. En ouvrant des accès dans l'interface vidéo courte et la liste des messages, Douyin vise à briser les barrières entre les produits IA et les plateformes de trafic, améliorant ainsi les capacités de l'IA et attirant davantage de trafic utilisateur. ByteDance développe également plusieurs lignes de produits IA en interne, démontrant ainsi un écosystème de produits IA complet.

【Résumé AiBase :】
📱 Douyin teste l'intégration de Doubao AI, ouvrant deux accès stratégiques pour améliorer les capacités de l'IA et le trafic utilisateur.
💡 ByteDance développe plusieurs lignes de produits IA en interne, couvrant plusieurs domaines, démontrant ainsi un écosystème IA complet.
🏆 Les géants de l'internet accordent une grande importance à l'application de la technologie IA dans l'écosystème de contenu, ouvrant une nouvelle ère pour les écosystèmes de services IA.

2、Une collaboration de poids ! JiMeng intègre DeepSeek : de l'invite à la peinture en une seule étape

La collaboration entre JiMeng et DeepSeek apporte une grande commodité aux amateurs de peinture IA. Grâce à la fonction de génération intelligente d'invites de DeepSeek, les utilisateurs n'ont plus à se soucier de l'inspiration : il suffit de saisir leurs besoins pour obtenir des invites précises et générer des images de haute qualité. Cette innovation collaborative améliore non seulement l'efficacité de la création, mais rend également le processus de peinture plus fluide et agréable.

【Résumé AiBase :】
🖌️ JiMeng intègre DeepSeek, offrant une fonction de génération intelligente d'invites pour résoudre les problèmes de création des utilisateurs.
✨ Les utilisateurs n'ont qu'à saisir des besoins simples, et DeepSeek génère des invites détaillées et précises, améliorant ainsi l'efficacité de la création.
🌟 Les invites générées par DeepSeek sont de haute qualité et guident efficacement l'IA pour générer des images de haute qualité, avec de bons retours utilisateurs.

3、Le mode vocal de Grok est entièrement ouvert : 11 modes disponibles, avec sous-titres intégrés, un atout pour l'apprentissage de l'anglais

L'assistant IA Grok de la société xAI ouvre officiellement son mode vocal très attendu à tous les utilisateurs, offrant 11 modes d'interaction vocale uniques et une fonction de sous-titres vocaux. Cette mise à jour améliore non seulement l'expérience interactive des utilisateurs, mais fournit également aux apprenants d'anglais un nouvel outil d'apprentissage. Les utilisateurs ont réagi avec enthousiasme à cette mise à jour. Bien qu'il ne prenne actuellement en charge que l'anglais, la diversité de l'expression et la fluidité de Grok ont été saluées par les utilisateurs, et l'attente d'une extension de la prise en charge linguistique ne cesse de croître.

【Résumé AiBase :】
🎤 Le mode vocal de Grok est désormais disponible pour tous les utilisateurs, offrant 11 styles d'interaction uniques, dont 2 modes avec restrictions 18+.
📚 La nouvelle fonction de sous-titres vocaux aide les utilisateurs à mieux comprendre le contenu, devenant un outil pratique pour l'apprentissage de l'anglais.
🌍 Les utilisateurs apprécient la fluidité et l'expression émotionnelle de Grok, et attendent avec impatience la prise en charge de plus de langues à l'avenir.

4、Vivo restructure et crée un nouveau département IA, et oriente l'entraînement des grands modèles vers les terminaux

Vivo a récemment procédé à d'importants ajustements à son organisation, créant un nouveau département IA, ce qui témoigne de son investissement continu et de son déploiement stratégique dans le domaine de l'intelligence artificielle. Ce nouveau département se concentrera sur l'entraînement des grands modèles sur les terminaux, et les évaluations de commercialisation sont suspendues, ce qui reflète l'importance accordée par Vivo au développement à long terme de la technologie IA. De plus, Vivo a lancé DeepSeek-R1, améliorant le niveau d'intelligence de l'assistant IA et améliorant ainsi l'expérience utilisateur.

【Résumé AiBase :】
🆕 Vivo crée un nouveau département IA, marquant l'investissement continu et le déploiement stratégique de l'entreprise dans la technologie de l'intelligence artificielle.
📉 En raison d'interventions de gestion, Vivo a décidé de suspendre temporairement l'évaluation de la commercialisation des grands modèles IA et de suspendre les investissements.
🚀 Le dernier DeepSeek-R1 lancé a amélioré le niveau d'intelligence de l'assistant IA, et l'expérience utilisateur s'est considérablement améliorée.

5、Nouvelle technologie Fast3R : reconstruction 3D d'un millier d'images en un clic, une vitesse incroyable !

Fast3R est une technique innovante de reconstruction 3D multi-vues capable de traiter jusqu'à 1500 images en une seule propagation directe, améliorant considérablement la vitesse de reconstruction. Comparé à la méthode traditionnelle DUSt3R, Fast3R utilise une architecture basée sur Transformer pour traiter parallèlement les informations de vue, éliminant le processus d'alignement complexe, améliorant la vitesse d'inférence et réduisant l'accumulation d'erreurs.

【Résumé AiBase :】
🌟 La technologie Fast3R peut traiter jusqu'à 1500 images en une seule propagation directe, augmentant considérablement la vitesse de reconstruction 3D.
⚡ L'architecture Transformer de Fast3R prend en charge le traitement parallèle, éliminant le processus d'alignement complexe des méthodes traditionnelles.
🚀 Comparé à DUSt3R, Fast3R présente des avantages significatifs en termes de temps et d'utilisation de la mémoire, et convient aux applications de reconstruction 3D à grande échelle.
Lien détaillé : https://fast3r-3d.github.io/

6、Une bombe dans le domaine de la création musicale ! DiffRhythm fait sensation : une chanson IA en 10 secondes, voix et accompagnement en un clic !

L'arrivée de DiffRhythm marque une nouvelle ère pour la création musicale. Grâce à un modèle de diffusion, il réalise la génération automatique de musique de bout en bout. Les utilisateurs n'ont qu'à saisir les paroles et le style pour obtenir une chanson complète en seulement 10 secondes. DiffRhythm peut non seulement générer un accompagnement, mais aussi créer automatiquement des paroles qui s'harmonisent parfaitement avec la mélodie, bouleversant ainsi le mode de création musicale traditionnel et ouvrant une nouvelle ère pour la création musicale par IA.

【Résumé AiBase :】
🎤 DiffRhythm utilise un modèle de diffusion pour réaliser la création musicale de bout en bout. Les utilisateurs n'ont qu'à saisir les paroles et le style pour générer une chanson complète.
⚡ La vitesse de génération est extrêmement rapide, il ne faut que 10 secondes pour créer une chanson de 4 minutes 45 secondes, soit 50 fois plus rapide que les méthodes traditionnelles.
🎼 Intègre un puissant grand modèle linguistique capable de créer automatiquement des paroles qui correspondent parfaitement à la mélodie, bouleversant complètement les méthodes de composition traditionnelles.
Lien détaillé : https://huggingface.co/spaces/ASLP-lab/DiffRhythm

7、Microsoft open-source le modèle d'image ART, capable de générer des images transparentes multicouches

Dans le domaine de la génération d'images, la technologie « Anonymous Region Transformer » (ART) développée par les chercheurs de Microsoft révolutionne la façon dont les utilisateurs interagissent avec les modèles génératifs. Grâce à la disposition des régions anonymes, ART peut générer directement des images transparentes multicouches à partir d'invites textuelles globales, et introduit un mécanisme de rognage régional couche par couche, améliorant considérablement l'efficacité de la génération, 12 fois plus rapide que les méthodes traditionnelles.

【Résumé AiBase :】
🌟 ART peut générer directement des images transparentes multicouches à partir d'invites textuelles globales et de la disposition des régions anonymes.
⚡️ L'utilisation d'un mécanisme de rognage régional couche par couche améliore considérablement l'efficacité de la génération d'images, 12 fois plus rapide que les méthodes traditionnelles.
💡 Un nouvel auto-encodeur de haute qualité prend en charge le contrôle et la génération précis d'images transparentes multicouches, favorisant la création de contenu interactif.
Lien détaillé : https://art-msra.github.io/

8、L'outil IA de cartographie mentale MindMapper : générez une carte mentale interactive à partir d'un simple lien

À l'ère de l'explosion de l'information, l'application Mind Mapper est devenue un outil précieux pour l'organisation de la pensée. Elle peut transformer les idées des utilisateurs en cartes mentales vivantes. Il suffit de saisir une URL, un lien vidéo YouTube ou une invite textuelle pour générer rapidement une carte mentale interactive.

【Résumé AiBase :】
🖥️ Mind Mapper peut transformer les idées en cartes mentales vivantes, prenant en charge la saisie d'URL, de liens vidéo et d'invites textuelles.
🎨 Utilisant la technologie Mermaid.js, les cartes mentales sont non seulement esthétiques, mais aussi dynamiques et interactives, permettant aux utilisateurs d'accéder facilement aux informations détaillées.
📤 Permet de télécharger les cartes mentales au format image PNG, facilitant le partage des connaissances et de l'inspiration.
Lien détaillé : https://github.com/misbahsy/MindMapper

9、Lei Jun lors de son premier passage au « couloir des représentants » : Xiaomi appliquera les dernières technologies IA à tous ses terminaux

Lors du premier « couloir des représentants » de la troisième session de la 14e Assemblée populaire nationale, Lei Jun, fondateur de Xiaomi, a répondu aux questions des journalistes, abordant en profondeur le rôle de Xiaomi dans le secteur manufacturier et ses orientations en matière d'innovation technologique. Il a souligné que le secteur manufacturier est la pierre angulaire du pays, et que Xiaomi augmentera ses investissements en R&D, notamment dans le domaine de l'intelligence artificielle, afin d'améliorer l'expérience technologique des consommateurs et de contribuer à la modernisation chinoise.

【Résumé AiBase :】
🏭 Le secteur manufacturier est la base de l'État, Xiaomi suivra résolument la voie de l'innovation technologique et du développement haut de gamme.
💰 Xiaomi prévoit d'investir 105 milliards de yuans en R&D entre 2021 et 2025, dont 30 milliards de yuans en 2025, les activités liées à l'IA représentant un quart de ce montant.
🌍 Xiaomi s'engage à appliquer les dernières technologies IA aux téléphones portables, aux voitures et aux maisons intelligentes, afin d'accroître son influence sur le marché mondial.

10、AiShi Technology boucle un tour de financement de série A5, visant de nouveaux sommets dans le domaine de la génération de vidéos IA

AiShi Technology a récemment annoncé avoir bouclé un tour de financement de série A5, mené par Jingya Capital, pour un montant supérieur à 400 millions de yuans, faisant de l'entreprise une étoile montante dans le domaine de la génération de vidéos IA. Fondée en 2023 par Wang Chang Hu, ancien responsable de la technologie visuelle chez ByteDance, l'entreprise bénéficie d'une solide équipe et a rapidement attiré l'attention de nombreux investisseurs. Ce financement servira à accélérer la R&D et à attirer des talents, afin de créer des grands modèles et des applications de génération de vidéos IA de pointe.

【Résumé AiBase :】
📈 AiShi Technology a bouclé un tour de financement de série A5 pour un montant supérieur à 400 millions de yuans, devenant une entreprise phare dans le domaine de la génération de vidéos IA.
🌍 Son produit PixVerse compte plus de 40 millions d'utilisateurs et 15 millions d'utilisateurs actifs mensuels, témoignant de ses compétences technologiques de pointe.
💼 L'entreprise prévoit d'accélérer le développement de modèles et le recrutement de talents de haut niveau, et de développer activement les services aux entreprises B, tout en relevant les défis de la commercialisation.

AI Quotidien

AI Quotidien : Douyin teste l'intégration de Doubao AI ; iDream intègre DeepSeek pour une génération intelligente de prompts ; le mode vocal Grok est entièrement ouvert

站长之家

Cet article provient d'AIbase Daily