Bienvenue à la rubrique 【AI日报】 ! Votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les actualités les plus importantes du domaine de l'IA, en mettant l'accent sur les développeurs, pour vous aider à comprendre les tendances technologiques et les applications innovantes des produits IA.
Nouveaux produits IA Cliquez ici pour en savoir plus : https://top.aibase.com/
1、Moshi, un grand modèle open source rivalisant avec GPT-4o, fait une entrée fracassante
Moshi est un grand modèle multimodal capable d'écouter et de parler, et pourrait bientôt être capable de voir. La publication de Moshi par le laboratoire Kyutai est une tentative audacieuse dans le domaine de l'IA, qui met en avant l'esprit open source. En termes d'expérience utilisateur, la vitesse de réponse est rapide, mais la prise en charge linguistique reste à améliorer, et son utilisation est simple. Le ton anthropomorphique de Moshi rend les conversations plus naturelles et fluides. Les futures itérations et optimisations amélioreront la précision des réponses. Il aura un impact profond sur le secteur de l'éducation, en offrant aux étudiants des explications itératives. Nous attendons avec impatience l'arrivée de produits similaires, prenant en charge davantage de langues régionales, afin que la technologie de l'IA soit plus accessible au grand public.
【Résumé AiBase :】
💡 Capacités multimodales : Moshi peut écouter les questions vocales et fournir des réponses par inférence en temps réel. De plus, son mode vocal est déjà disponible, bien plus tôt que la sortie prévue de GPT-4o à l'automne.
💡 Aucune restriction géographique : vous pouvez utiliser Moshi où que vous soyez.
💡 Prise en charge des appareils mobiles : même si la prise en charge du mandarin n'est pas optimale, les questions en anglais ne posent aucun problème.
💡 Bientôt open source : Kyutai prévoit de rendre Moshi open source prochainement, en publiant le code, les poids du modèle et les articles de recherche.
Lien détaillé : https://top.aibase.com/tool/moshi-chatMoshi
2、Nouvelles fonctionnalités révélées pour Google Pixel 9 : une expérience intelligente grâce à l'IA, similaire à Microsoft Recall !
La série Google Pixel 9 s'apprête à lancer une série de nouvelles fonctionnalités IA impressionnantes, notamment Add Me, Studio et Pixel Screenshots. Ces fonctionnalités amélioreront l'expérience photographique des utilisateurs, stimuleront la créativité et mettront l'accent sur la protection de la vie privée, démontrant la compréhension approfondie et l'application innovante de la technologie de l'IA par Google. Nous attendons avec impatience que la série Pixel 9 offre davantage de possibilités à la vie numérique.
【Résumé AiBase :】
✨ Fonction Add Me : capture la meilleure expression de chaque personne, fusionne les expressions faciales de différentes photos pour que chacun apparaisse sous son meilleur jour.
🎨 Fonction Studio : intégrée à l'application d'édition de captures d'écran, permettant aux utilisateurs de créer et de remixer des autocollants, libérant une créativité infinie.
🔒 Fonction Pixel Screenshots : offre une solution de protection de la vie privée, fonctionnant uniquement lorsque l'utilisateur prend une capture d'écran manuellement, en utilisant le traitement IA local pour garantir la sécurité de la vie privée des utilisateurs.
3、Perplexity AI lance Pro Search : amélioration de la résolution de problèmes et de l'exécution de code
Perplexity a récemment annoncé une mise à niveau majeure de son service Pro Search. La nouvelle version de Pro Search peut non seulement gérer des requêtes plus complexes, mais elle possède également une capacité de raisonnement en plusieurs étapes, offrant aux utilisateurs un support de recherche plus approfondi et complet. Cette mise à niveau démontre l'énorme potentiel de l'IA dans les domaines de la recherche d'informations et de la résolution de problèmes, établissant une nouvelle norme pour les futurs outils de recherche intelligents.
【Résumé AiBase :】
🔍 Amélioration de la capacité de traitement des requêtes complexes : le nouveau Pro Search peut exécuter des calculs mathématiques et de programmation avancés, fournissant des résultats de recherche plus complets.
🧠 Fonction de raisonnement en plusieurs étapes : Pro Search peut désormais effectuer des raisonnements en plusieurs étapes, atteindre progressivement ses objectifs et prendre des mesures intelligentes en fonction des découvertes.
🔢 Capacités mathématiques et de programmation améliorées : grâce à l'intégration du moteur Wolfram|Alpha, la précision et la vitesse de Pro Search dans la résolution de problèmes mathématiques complexes ont été considérablement améliorées.
4、Cloudflare lance une nouvelle méthode pour bloquer les robots d'exploration IA en un clic
Cloudflare a récemment lancé une nouvelle méthode permettant de bloquer les robots d'exploration IA qui récupèrent le contenu des sites Web et utilisent les données sans autorisation pour entraîner des modèles d'apprentissage automatique. Cette initiative vise à protéger les créateurs de contenu sur Internet.
【Résumé AiBase :】
⭐️ Cloudflare lance une fonction de blocage en un clic des robots d'exploration IA, garantissant que le contenu du site Web n'est pas utilisé par des robots IA non autorisés.
⭐️ L'IA générative est considérée comme une source de vol, et les grandes entreprises prennent des mesures pour empêcher les robots IA d'utiliser du contenu sans autorisation.
⭐️ Cloudflare utilise des modèles d'apprentissage automatique pour identifier et bloquer les robots d'exploration déguisés, protégeant ainsi les droits des créateurs de contenu sur Internet.
5、ElevenLabs lance VOICE ISOLATOR, un outil magique de suppression du bruit
VOICE ISOLATOR, lancé par ElevenLabs, est un nouveau produit qui enthousiasme les amateurs d'audio. Il permet de supprimer le bruit de fond et d'extraire des dialogues clairs, rendant la production audio plus professionnelle. Cet outil simple d'utilisation offre plusieurs fonctions telles que l'extraction des voix, la génération d'effets sonores, etc., améliorant considérablement l'efficacité et la créativité de la production audio. ElevenLabs continue d'innover pour offrir aux utilisateurs de nouvelles possibilités de production audio.
【Résumé AiBase :】
🎵 Supprime le bruit de fond, extrait les dialogues clairs, rendant la production audio plus professionnelle.
🔊 Offre la fonction d'extraction des voix, améliore la voix, supprime le bruit de fond inutile.
🎶 La fonction de génération d'effets sonores permet aux utilisateurs de ne pas perdre de temps à chercher des effets sonores, offrant plus d'espace créatif.
Lien détaillé : https://elevenlabs.io/voice-isolator
6、SenseTime lance Vimi, un modèle d'algorithme de génération de vidéos de personnages contrôlables
SenseTime a lancé Vimi, un grand modèle de génération de vidéos de personnages contrôlables révolutionnaire, démontrant la grande adaptabilité de la technologie de l'IA à des scénarios complexes et l'expérience approfondie de SenseTime dans la technologie de génération de vidéos. Vimi possède une contrôlabilité exceptionnelle, dépassant les technologies traditionnelles, permettant de contrôler précisément les expressions faciales et les mouvements corporels des personnages, tout en traitant les détails avec finesse, prenant en charge une expérience visuelle immersive et générant des vidéos de haute qualité de manière stable.
【Résumé AiBase :】
✨ Vimi a atteint une flexibilité sans précédent dans la génération de vidéos, capable de recevoir des entrées diversifiées et de contrôler précisément la génération de vidéos correspondant aux mouvements cibles des personnages.
🌟 Vimi a dépassé les limites des technologies traditionnelles de contrôle des expressions faciales des images, réalisant un contrôle précis des expressions faciales et des mouvements corporels, générant un contenu vidéo logique et vivant.
💡 Vimi génère de manière stable des vidéos de haute qualité d'une durée d'une minute, en maintenant une qualité d'image constante, démontrant ses capacités exceptionnelles et sa cohérence.
Lien détaillé : https://www.wjx.cn/vm/mhSxfGv.aspx
7、La danse IA est-elle folle ? MimicMotion lance une nouvelle technologie capable de générer des vidéos de n'importe quelle longueur en fonction de n'importe quel mouvement
La nouvelle technologie de MimicMotion, « High-Quality Human Motion Video Generation with Confidence-aware Pose Guidance », a suscité l'enthousiasme du secteur. Cette technologie utilise un guidage de pose conscient de la confiance pour générer des vidéos de mouvement humain de haute qualité, améliorant la qualité vidéo, le mécanisme de raffinement des mains améliorant les détails, générant des vidéos de longueur arbitraire de manière flexible, avec des applications étendues et des perspectives prometteuses, jouant un rôle clé dans la production vidéo et la capture de mouvement.
【Résumé AiBase :】
🌟 Utilise un guidage de pose conscient de la confiance pour générer des vidéos de mouvement humain de haute qualité.
🔍 Le mécanisme de raffinement manuel se concentre sur le polissage des détails, en particulier l'amélioration de l'entraînement des mains.
🎥 Génération flexible de vidéos de longueur arbitraire, perspectives d'application étendues.
Lien détaillé : https://top.aibase.com/tool/mimicmotion
8、Problème de sécurité : le client ChatGPT pour Mac stocke les conversations en texte clair
Le client ChatGPT pour Mac récemment lancé par OpenAI présente une faille de sécurité : les conversations sont stockées en texte clair sur l'ordinateur, et peuvent être accessibles par des acteurs malveillants. L'entreprise a publié une mise à jour pour chiffrer les enregistrements de conversation afin d'améliorer la sécurité.
【Résumé AiBase :】
🔒 Les conversations sont stockées en texte clair sur l'ordinateur, ce qui présente un risque pour la sécurité.
🚫 Les acteurs malveillants ou les applications peuvent facilement lire les conversations ChatGPT et les données qui y sont contenues.
🔑 OpenAI a publié une mise à jour pour chiffrer les historiques de chat afin d'améliorer la sécurité.
9、Nouvelle initiative de Google : divulgation d'informations sur les publicités politiques générées par l'IA
Google prend de nouvelles mesures pour simplifier le processus de divulgation par les annonceurs indiquant si les publicités politiques contiennent du contenu généré par l'intelligence artificielle. Une fois que les annonceurs ont coché la case « Contenu modifié ou synthétique », Google générera automatiquement les informations de divulgation, améliorant ainsi la transparence et la crédibilité des publicités.
【Résumé AiBase :】
✨ Google simplifie le processus de divulgation par les annonceurs du contenu généré par l'IA dans les publicités politiques, améliorant la transparence des publicités.
🔍 Une fois que les annonceurs ont coché la case « Contenu modifié ou synthétique », le système génère automatiquement les informations de divulgation, ce qui réduit la charge de travail des annonceurs.
💡 Les informations de divulgation seront affichées dans les flux d'informations des appareils mobiles, YouTube Shorts et les publicités en streaming. Pour les autres formats de publicités, les annonceurs doivent fournir les informations de divulgation.
10、Obstination ou fidélité ? Nintendo s'oppose à l'utilisation de l'IA générative dans les jeux
Le président de Nintendo, Shuntaro Furukawa, a exprimé sa position concernant l'utilisation de l'intelligence artificielle générative dans les jeux, craignant les atteintes aux droits de propriété intellectuelle et soulignant l'importance du maintien de l'originalité. Il estime que Nintendo possède suffisamment de créativité et d'expérience et n'a pas besoin de recourir à des outils d'intelligence artificielle générative. Le contenu créé par l'IA générative manque de personnalité, ce qui n'est pas conforme à l'accent mis par Nintendo sur l'originalité et la créativité. À l'avenir, Nintendo utilisera l'intelligence artificielle générative avec prudence, en s'appuyant sur la créativité et l'expérience de son équipe interne.
【Résumé AiBase :】
⭐ Nintendo s'oppose à l'utilisation de l'intelligence artificielle générative dans les jeux, craignant les atteintes aux droits de propriété intellectuelle.
⭐ Furukawa souligne que Nintendo possède suffisamment de créativité et d'expérience pour créer une expérience de jeu unique.
⭐ Le contenu créé par l'intelligence artificielle générative manque de personnalité, et Nintendo met l'accent sur l'originalité et la créativité.