Bienvenue sur la rubrique 【AI日报】 ! Votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les actualités les plus importantes du domaine de l'IA, en nous concentrant sur les développeurs et en vous aidant à comprendre les tendances technologiques et les applications innovantes des produits d'IA.
Nouveaux produits IA : Cliquez ici pour en savoir plus : https://top.aibase.com/
1. Le grand modèle de génération vidéo Step-Video de Jieyue Xingchen démarre sa phase de test bêta. Les demandes sont possibles sur Yuewen Video.
Le modèle Step-Video de Jieyue Xingchen est officiellement entré en phase de test bêta. Les utilisateurs peuvent demander un accès via le site Web de Yuewen Video. Ce modèle permet de générer des vidéos à partir de texte, avec une résolution allant jusqu'à 1080p et une durée maximale de 10 secondes. Il se distingue par ses performances remarquables en matière d'optimisation automatique des invites, de style esthétique et de contrôle du mouvement.
【Résumé AiBase :】
🎬 Le modèle Step-Video permet de générer des vidéos haute définition à partir de texte, avec une résolution jusqu'à 1080p et une durée maximale de 10 secondes.
🌟 Step-Video excelle dans la compréhension et la génération de thèmes de style chinois, en respectant l'esprit des poèmes anciens.
⚙️ Ce modèle offre un excellent contrôle du mouvement, générant des vidéos conformes aux lois de la physique et gérant des relations spatiales complexes.
Lien détaillé : https://top.aibase.com/tool/yuewenshipin
2. Luma lance son nouveau modèle de génération d'images Luma Photon : plus rapide et moins coûteux !
Luma Labs a présenté Luma Photon et Photon Flash, deux modèles révolutionnaires de génération d'images, offrant une vitesse de génération exceptionnelle et un faible coût. Luma Photon a démontré d'excellentes performances dans de nombreux tests, générant des images de haute qualité, adaptées à divers domaines tels que la publicité, le cinéma et les arts.
【Résumé AiBase :】
🚀 Luma Photon génère des images 10 fois plus vite que les autres modèles du marché, à un coût de seulement 0,2 cent par image 1080p.
🎨 Il prend en charge les instructions en langage naturel à plusieurs tours, permettant aux utilisateurs d'optimiser progressivement le contenu généré, idéal pour les tâches créatives complexes.
📈 En termes de qualité, de créativité et de compréhension, Luma Photon surpasse tous les modèles du marché lors d'évaluations en double aveugle.
Lien détaillé : https://lumalabs.ai/photon
3. Les œuvres du projet de cocréation de réalisation IA de Keling seront lancées le 6 décembre, avec 9 vidéos IA de qualité cinématographique.
Kuaishou Technology a annoncé le lancement officiel, le 6 décembre, du premier projet de cocréation de réalisation AIGC de Chine : le « projet de cocréation de réalisation IA de Keling ». Ce projet, lancé conjointement par le grand modèle de génération vidéo « Keling AI » développé par Kuaishou et plusieurs réalisateurs renommés, vise à repousser les limites de la création cinématographique grâce à l'IA.
【Résumé AiBase :】
🎥 Ce projet est lancé conjointement par Kuaishou Technology et 9 réalisateurs renommés, couvrant des thèmes variés.
🤖 Tous les courts métrages seront générés à l'aide de Keling AI, favorisant l'utilisation de l'IA dans la création cinématographique.
📈 Depuis son lancement, Keling AI a servi plus de 5 millions d'utilisateurs, générant 51 millions de vidéos et 150 millions d'images.
4. Le modèle d'images 2.1 de Jimeng AI, filiale de ByteDance : la génération d'images IA peut enfin afficher des caractères chinois !
Jimeng AI, filiale de ByteDance, a récemment lancé son modèle d'images 2.1, résolvant le problème de la génération de caractères chinois dans la génération d'images IA. Les utilisateurs peuvent simplement saisir une description textuelle pour générer rapidement des affiches personnalisées, améliorant considérablement l'efficacité des designers. Les applications du nouveau modèle sont vastes, notamment la création d'affiches, la conception de couvertures de livres et les illustrations pour les médias sociaux.
【Résumé AiBase :】
🎨 Le nouveau modèle prend en charge la génération de caractères chinois, améliorant l'efficacité de la conception d'affiches.
📚 Les utilisateurs peuvent créer des affiches et des couvertures personnalisées à partir de descriptions textuelles.
🌌 Le modèle est applicable à de nombreux contextes, tels que les médias sociaux et la création d'histoires.
Lien détaillé : https://top.aibase.com/tool/jimeng
5. Recherche IA de Mita : les données de la « recherche académique » augmentent de 7 fois, ajout d'une fonction « d'explication ».
Shanghai Mita Network Technology Co., Ltd. a récemment procédé à une mise à jour majeure de sa fonction de recherche académique IA Mita, augmentant le volume de données de 7 fois. Les utilisateurs peuvent désormais accéder à des dizaines de millions d'articles Open Access, dont 40 % d'articles SCI et des revues de premier plan comme « Nature » et « Science ». Cette mise à jour ajoute également une fonction « d'explication » pour aider les utilisateurs à comprendre des contenus complexes.
【Résumé AiBase :】
📈 Le volume de données a augmenté de 7 fois, couvrant des dizaines de millions d'articles Open Access, améliorant les capacités de recherche.
📝 Une fonction « d'explication » a été ajoutée pour aider les utilisateurs à comprendre les phrases complexes des documents.
🌍 Un modèle de traduction prenant en charge 44 langues élimine les obstacles à la lecture des articles dans des langues moins courantes.
6. La première création de Fei-Fei Li : une image génère un monde 3D interactif, l'AIGC entre dans une nouvelle ère !
Le dernier projet de Fei-Fei Li, World Labs, propose une technologie de génération 3D révolutionnaire. Les utilisateurs peuvent créer des scènes 3D interactives à partir d'une simple image ou d'une phrase, marquant l'entrée de l'AIGC dans une nouvelle ère immersive. Cette technologie permet non seulement de reproduire fidèlement les détails, mais aussi de simuler divers effets de caméra, offrant aux utilisateurs un contrôle total.
【Résumé AiBase :】
🖼️ Une simple image ou une phrase suffit pour générer des scènes 3D réalistes, ouvrant une nouvelle expérience interactive.
🎥 Cette technologie permet de simuler divers effets de caméra, offrant aux utilisateurs un contrôle total dans le monde 3D.
🚀 World Labs prévoit d'améliorer continuellement l'échelle et la précision des mondes 3D, explorant de nouvelles formes d'interaction utilisateur.
Lien détaillé : https://www.worldlabs.ai/blog
7. Dites adieu au clonage vocal illégal ! Hume AI lance une fonction de contrôle vocal pour créer des voix IA personnalisées.
Hume AI a récemment lancé une fonction expérimentale appelée « contrôle vocal », permettant aux utilisateurs de créer facilement des voix IA personnalisées, sans aucune compétence en codage. Cette fonction permet aux utilisateurs d'ajuster les caractéristiques de la voix à l'aide de curseurs, offrant de nombreuses options de personnalisation pour répondre à divers besoins.
【Résumé AiBase :】
🔊 Hume AI lance la fonction « contrôle vocal », permettant aux utilisateurs de créer facilement des voix IA personnalisées.
🛠️ Cette fonction ne nécessite aucune compétence en codage. Les utilisateurs peuvent ajuster les caractéristiques de la voix à l'aide de curseurs.
🌐 Hume vise à répondre à divers besoins grâce à une IA vocale personnalisée et émotionnellement intelligente.
Lien détaillé : https://www.hume.ai/blog/introducing-voice-control
8. Cohere lance son nouveau modèle de recherche Rerank3.5 : traitement précis des requêtes dans plus de 100 langues.
Le modèle de recherche Rerank3.5 récemment lancé par Cohere marque une avancée majeure dans la recherche de données d'entreprise. Ce modèle prend en charge les requêtes dans plus de 100 langues, excellant notamment dans les principales langues commerciales comme l'arabe, le japonais et le coréen, aidant les entreprises multinationales à surmonter les barrières linguistiques. Les tests internes montrent une amélioration significative des performances de Rerank3.5 dans le secteur des services financiers, permettant de réduire les coûts et les risques.
【Résumé AiBase :】
📊 Rerank3.5 traite les requêtes dans plus de 100 langues, aidant les entreprises mondiales à surmonter les barrières linguistiques.
💡 Les tests internes montrent une amélioration significative des performances de recherche dans le secteur des services financiers, permettant de réduire les coûts et les risques.
🚀 Déployé via les principaux clouds, Cohere vise à devenir la norme du secteur pour la recherche d'entreprise, les entreprises devant s'adapter à l'environnement IA en constante évolution.
Lien détaillé : https://cohere.com/blog/rerank-3pt5
9. Le directeur financier d'OpenAI répond aux rumeurs sur la publicité : aucun projet d'introduction d'un modèle publicitaire pour le moment.
Sarah Friar, directrice financière d'OpenAI, a déclaré lors d'une interview que l'entreprise n'avait actuellement aucun projet d'introduire de la publicité, même si les revenus publicitaires constituent une option attrayante pour les entreprises rentables. Friar a mentionné qu'OpenAI était en forte croissance et qu'elle avait identifié des opportunités dans son modèle commercial actuel, et qu'elle pourrait explorer d'autres sources de revenus à l'avenir.
【Résumé AiBase :】
🌟 La directrice financière d'OpenAI, Sarah Friar, a déclaré qu'il n'y avait actuellement aucune intention d'introduire de la publicité, mais que d'autres sources de revenus pourraient être explorées à l'avenir.
💼 OpenAI a recruté plusieurs experts en publicité et en marketing, suggérant qu'un modèle publicitaire pourrait être envisagé à l'avenir.
🚪 Les changements fréquents au sein de la direction, le fondateur Sam Altman continue de promouvoir la vision de l'entreprise.
10. ChatGPT plante lorsqu'on mentionne « David Mayer », quelle est cette force mystérieuse ?
Récemment, un phénomène étrange est apparu sur les médias sociaux : le chatbot ChatGPT d'OpenAI ne répond pas normalement lorsqu'on mentionne « David Mayer » et interrompt la conversation. Ce phénomène a suscité de nombreuses discussions et spéculations parmi les internautes. De nombreuses personnes ont essayé de poser des questions à ChatGPT sur « David Mayer », mais ont toutes subi le même sort.
【Résumé AiBase :】
🌐 ChatGPT ne répond pas lorsqu'on mentionne « David Mayer » et interrompt la conversation.
🔍 « David Mayer » pourrait être lié à des problèmes juridiques, notamment au droit à l'oubli du RGPD.
🤔 D'autres noms peuvent également provoquer des pannes de ChatGPT, soulignant la complexité des modèles d'IA.
11. WPS Office lance une fonction de sténographie vocale IA.
WPS Office a récemment lancé une fonction de sténographie vocale IA, améliorant l'expérience de conversion vocale en texte, prenant en charge l'enregistrement en temps réel et la traduction multilingue. Cette fonction améliore la précision grâce à la reconnaissance vocale et à la synthèse automatique par IA, et est intégrée en profondeur à WPS Cloud Document, garantissant aux utilisateurs une expérience d'enregistrement fluide. Les utilisateurs peuvent facilement trouver et utiliser cette fonction dans la dernière version de WPS Office.
【Résumé AiBase :】
🗣️ La fonction de sténographie vocale permet l'enregistrement en temps réel et la conversion audio en texte.
🌐 Prise en charge de la traduction multilingue, y compris le chinois et l'anglais.
🔒 Offre une expérience de collaboration sécurisée sur les documents, améliorant la commodité des utilisateurs.
12. Tencent lance le grand modèle de génération vidéo Hunyuan : 13 milliards de paramètres, entièrement open source.