Bienvenue sur la rubrique 【AI日报】 ! Votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les actualités les plus importantes du domaine de l'IA, en nous concentrant sur les développeurs et en vous aidant à comprendre les tendances technologiques et les applications innovantes des produits IA.
Nouveaux produits IA Cliquez ici pour en savoir plus :https://top.aibase.com/
1. Microsoft lance Microsoft Designer, un outil de conception révolutionnaire
Microsoft Designer est une application de conception intégrant l'intelligence artificielle, conçue pour simplifier et accélérer le processus de création. Accessible sur tous les appareils et intégré à Microsoft 365, cet outil puissant offre des fonctionnalités telles que la détection intelligente d'objets, des outils innovants et la transformation du style des images.
【Résumé AiBase :】
🚀 Intégration transparente avec Microsoft 365 pour une création et une édition d'images et de designs simplifiées.
🔍 Fonction de détection intelligente des objets pour supprimer facilement les éléments indésirables ou créer un effet de flou d'arrière-plan.
🎨 Outils innovants, notamment des modèles de suggestions, la création de cartes de vœux et d'invitations personnalisées, ainsi que des fonctions de transformation du style des images et de remplacement d'arrière-plan.
Lien détaillé : https://top.aibase.com/tool/microsoft-designer-sticker-creator
2. ElevenLabs lance le modèle Turbo 2.5 : vitesse multipliée par 3, prise en charge de 32 langues, dont le chinois
Dans le monde de l'intelligence artificielle, ElevenLabs repousse les limites linguistiques avec son nouveau modèle Turbo 2.5. Ce modèle se distingue par ses performances exceptionnelles et sa prise en charge de nombreuses langues. Sa vitesse est trois fois supérieure à la précédente version, avec une latence réduite à 300 millisecondes, offrant ainsi un support plus robuste pour les interactions dynamiques. L'expérience utilisateur est améliorée grâce à un large choix de langues et à des fonctions de conversion pratiques, tout en garantissant la sécurité et la conformité des données.
【Résumé AiBase :】
🚀 Le modèle Turbo 2.5 prend en charge 32 langues, avec une vitesse multipliée par 3 et une latence réduite à 300 millisecondes, pour des interactions dynamiques plus performantes.
🌐 Première prise en charge du vietnamien, du hongrois et du norvégien pour la conversion texte-parole, enrichissant la bibliothèque linguistique et accélérant la conversion texte-parole en anglais.
🔊 Large éventail d'applications, notamment l'IA conversationnelle, l'éducation, le divertissement et la création de contenu, offrant une synthèse vocale réaliste, comme illustré par les applications de Praktika.ai, Kindroid et Aug X Labs.
Lien détaillé : https://elevenlabs.io/api
3. Apple AI publie DCLM, un modèle linguistique open source de 700 millions de paramètres
Apple, en collaboration avec plusieurs institutions, a lancé DCLM, un modèle linguistique open source de 700 millions de paramètres. Entraîné sur un vaste ensemble de données, ce modèle permet une meilleure compréhension et génération du langage. DCLM fournit des outils standardisés d'optimisation des ensembles de données, facilitant les expérimentations des chercheurs. Ce nouveau modèle a démontré des progrès significatifs lors de tests importants, tout en réduisant les besoins en ressources informatiques.
【Résumé AiBase :】
🔑 Apple AI, en collaboration avec plusieurs institutions, lance DCLM, un puissant modèle linguistique open source.
🔑 DCLM fournit des outils standardisés d'optimisation des ensembles de données pour faciliter les expérimentations des chercheurs.
🔑 Ce nouveau modèle a fait des progrès significatifs lors de tests importants, tout en réduisant les besoins en ressources informatiques.
Lien détaillé : https://huggingface.co/collections/mlfoundations/dclm-669938432ef5162d0d0bc14b
4. Xiao Ai, le grand modèle de Xiaomi, ajoute des fonctionnalités de Q&R sur documents IA et d'édition d'images IA
Xiaomi a annoncé que Xiao Ai intègre désormais une fonction « d'édition d'images IA », permettant aux utilisateurs de modifier l'arrière-plan, le style, de supprimer des passants, d'agrandir intelligemment les images et de poser des questions sur les images. De plus, « Xiao Ai, le grand modèle » intègre une fonction « Q&R sur documents IA », offrant une expérience de traitement de documents plus intelligente. Les utilisateurs doivent mettre à jour leur application vers la version V6.126 pour profiter de ces nouvelles fonctionnalités.
【Résumé AiBase :】
✨ Xiao Ai intègre une nouvelle fonction « d'édition d'images IA », incluant la modification de l'arrière-plan, du style, la suppression de passants, l'agrandissement intelligent et les questions sur les images.
🔍 Les utilisateurs doivent mettre à jour leur application vers la version V6.126 pour utiliser ces nouvelles fonctionnalités.
📄 « Xiao Ai, le grand modèle » intègre une nouvelle fonction « Q&R sur documents IA » pour une expérience de traitement de documents plus intelligente.
5. Nouvelle technologie de restauration vidéo IA de Meitu : vitesse multipliée par 10, même en cas de surexposition
L'une des technologies clés dans le domaine de la production vidéo et du traitement d'images est la fonction « anti-scintillement » vidéo. BlazeBVD, un nouvel algorithme anti-scintillement, non seulement supprime rapidement le scintillement des vidéos, mais préserve également l'intégrité du contenu et le réalisme des couleurs. Son apparition révolutionne la post-production vidéo.
【Résumé AiBase :】
🔍 BlazeBVD est une technologie anti-scintillement vidéo automatisée qui améliore efficacement la cohérence temporelle des vidéos.
⚙️ BlazeBVD utilise une méthode d'équilibrage échelle-temps pour traiter l'histogramme des images vidéo, capturant ainsi le scintillement et les variations d'exposition locales.
🚀 BlazeBVD présente des performances exceptionnelles dans les modules anti-scintillement globaux et locaux, et la cohérence temporelle adaptative, avec une vitesse multipliée par 10 par rapport aux technologies existantes.
Lien détaillé : https://arxiv.org/html/2403.06243v1
6. Baidu : les applications des grands modèles entrent en phase d'explosion
Lors du 2024 China Unicom Partner Conference, Shen Dou, vice-président exécutif de Baidu Group et président du groupe Baidu Intelligent Cloud, a prononcé un discours sur l'importance d'adopter l'intelligence artificielle et d'accélérer le développement d'une nouvelle productivité. Shen Dou a souligné que l'intelligence artificielle est une technologie clé de l'innovation, que les grands modèles sont à l'avant-garde de l'intelligence artificielle, et il a montré la croissance exponentielle du nombre d'appels aux grands modèles. Baidu, grâce à ses collaborations avec les entreprises, a constaté l'importance des plateformes de gestion de la puissance de calcul sous-jacente, et a développé sa propre plateforme de puissance de calcul Baigge, pour soutenir l'itération rapide des grands modèles.
【Résumé AiBase :】
🚀 Les applications des grands modèles entrent en phase d'explosion, les entreprises les intégrant dans tous les aspects de leurs activités, et non plus seulement en attendant des applications à succès.
💡 Le « multi-puces sur un seul cloud » devient une nécessité pour les entreprises chinoises. Baidu Intelligent Cloud ouvre sa plateforme de puissance de calcul Baigge, offrant la liberté de choisir les puces.
💻 Baidu développe la chaîne d'outils Qianfan basée sur le grand modèle Wenxin, réduisant les obstacles techniques et les coûts d'utilisation des grands modèles, et lance Qianfan · version améliorée pour l'industrie pour accélérer l'innovation des entreprises.
7. Projet SpreadsheetLLM des chercheurs de Microsoft
Les chercheurs de Microsoft ont récemment publié une étude innovante nommée SpreadsheetLLM, visant à résoudre les problèmes rencontrés par les grands modèles linguistiques lors de l'analyse de feuilles de calcul. Ce projet, grâce à un cadre de codage, permet aux grands modèles linguistiques de « comprendre » le contenu des feuilles de calcul, améliorant ainsi considérablement l'efficacité de la gestion et de l'analyse des données, tout en permettant aux utilisateurs de poser des questions à l'IA en langage naturel, sans avoir besoin de maîtriser des formules et des opérations complexes.
【Résumé AiBase :】
📊 Défis posés par les feuilles de calcul aux grands modèles linguistiques : structure complexe et disposition bidimensionnelle des feuilles de calcul, dépassant la portée des entrées linéaires généralement traitées par les grands modèles linguistiques.
🔍 Analyse technique de SpreadsheetLLM : Microsoft a proposé deux technologies clés, SheetCompressor et Chain of Spreadsheet, améliorant considérablement la capacité des grands modèles linguistiques à comprendre les feuilles de calcul.
🛠️ Impact sur les outils IA de Microsoft : SpreadsheetLLM devrait améliorer les capacités de Microsoft Copilot dans Excel, mais il reste confronté à des défis liés à la précision des données générées et à la consommation de ressources informatiques.
Lien détaillé : https://arxiv.org/html/2407.09025v1
8. Grande présentation matérielle de Google 2024 : Pixel 9, Gemini et nouveau téléphone pliable
Google organisera un grand événement matériel en avance, annonçant de nouveaux produits comme le Pixel 9, avant la sortie de l'iPhone 16 d'Apple. Gemini est un sujet très attendu, les nouveaux appareils devant révolutionner les fonctionnalités IA sur Android. Android 15 apporte de nouvelles fonctionnalités et des ajustements de l'interface utilisateur, tandis que l'avenir de Google Assistant reste incertain. La Pixel Watch 3 et les Pixel Buds Pro 2 seront également présentés.
【Résumé AiBase :】
📱 Google lancera le Pixel 9 avant l'iPhone 16 d'Apple.
🌟 Les nouveaux appareils révolutionneront les fonctionnalités IA sur Android, Gemini étant un sujet très attendu.
🔍 Android 15 apporte de nouvelles fonctionnalités et des ajustements de l'interface utilisateur, tandis que l'avenir de Google Assistant reste incertain.
9. Arcee AI publie le modèle linguistique open source Arcee-Nova : basé sur Qwen2-72B, des performances proches de GPT-4
Le nouveau modèle linguistique open source Arcee-Nova d'Arcee AI offre des performances exceptionnelles, proches de celles de GPT-4, marquant une étape importante et apportant un nouvel espoir à la communauté IA. Arcee-Nova combine Qwen2-72B-Instruct et un modèle d'optimisation personnalisé, offrant des fonctionnalités complètes et une large applicabilité dans divers domaines tels que le service client, la création de contenu, le développement logiciel et l'éducation.
【Résumé AiBase :】
🌟 Arcee-Nova offre des performances exceptionnelles, proches de celles de GPT-4, apportant un nouvel espoir à la communauté IA.
💡 Arcee-Nova combine Qwen2-72B-Instruct et un modèle d'optimisation personnalisé, offrant des fonctionnalités complètes.
📈 Arcee-Nova est largement utilisé dans divers domaines tels que le service client, la création de contenu, le développement logiciel et l'éducation.
Lien détaillé : https://udify.app/chat/s3i0GX51Rwrb4XRm
10. Un supermarché japonais introduit un système de surveillance du sourire par IA
La chaîne de supermarchés japonaise AEON a introduit « Mr Smile », un système de surveillance du sourire par IA, visant à améliorer la qualité du service et l'expérience client. Bien que le système ait eu un effet notable sur l'amélioration de l'attitude du service, il a également suscité des controverses et des inquiétudes concernant la naturalité du sourire des employés et le harcèlement des clients. Comparé à d'autres pratiques sectorielles, comme le concept de « sourire gratuit » de McDonald's et les caisses lentes des supermarchés de Fukuoka, l'initiative d'AEON a reçu des avis mitigés.
【Résumé AiBase :】
📈 Système de surveillance du sourire par IA : le système « Mr Smile » d'AEON évalue le sourire et l'attitude de service des employés en analysant plus de 450 facteurs, dans le but d'améliorer l'expérience client.
🔍 Controverses et inquiétudes : la technologie suscite des inquiétudes concernant le harcèlement des employés, certains considérant qu'un sourire forcé pourrait aggraver la pression sur les employés.