2025-03-10 16:04:04.AIbase.
Huawei Ascend et Step-Video lancent un modèle multimodale open source, faisant leur entrée dans le nouveau domaine de l'IA
2025-03-09 11:04:41.AIbase.
Percée dans les avatars numériques IA ! Hedra lance Character-3 et Hedra Studio : inférence conjointe d'images, de texte et d'audio
2025-03-07 11:08:17.AIbase.
Lancement d'un site Web indépendant pour Tongyi Wanxiang, le modèle vidéo IA d'Alibaba
2025-03-06 14:54:02.AIbase.
Cohere lance Aya Vision, un nouveau modèle d'IA multimodale, en versions 32B et 8B
2025-03-06 14:46:43.AIbase.
Percée dans la recherche multimodale ! Modèle de vecteur multimodal BGE-VL open source par l'Institut de recherche sur l'IA de Beijing
2025-03-04 09:41:14.AIbase.
Huake Byte lance Liquid : Redéfinir la génération et la compréhension des modèles multimodaux
2025-02-28 14:00:59.AIbase.
Le modèle linguistique de grande taille Wenxin 4.5 de Baidu sera lancé le 16 mars, doté de capacités multimodales natives et de réflexion approfondie
2025-02-28 09:25:57.AIbase.
Les robots Figure accélèrent leur entrée sur le marché domestique : tests Alpha prévus pour 2025, repoussant les limites du secteur
2025-02-27 15:56:53.AIbase.
Wenxin 4.5 de Baidu devrait sortir mi-mars, améliorant l'inférence et les capacités multimodales
2025-02-27 09:38:31.AIbase.
Microsoft lance Phi-4, un modèle multimodal et miniature améliorant le traitement de la voix, de la vision et du texte
2025-02-26 11:11:32.AIbase.
Magma : L'agent IA multimodale open source de Microsoft révolutionne le shopping et la robotique
2025-02-26 09:13:48.AIbase.
Microsoft open-source un nouvel agent IA multi-modal « Magma » : passation de commandes automatique et prédiction comportementale
2025-02-25 11:15:31.AIbase.
Família de Guaxinins da SenseTime totalmente atualizada: Fusão multimodal, replicação de páginas da web em 10 segundos
2025-02-24 16:35:32.AIbase.
Tencent Yuanbao dépasse Doubao pour atteindre la deuxième place du classement des applications gratuites d'Apple en Chine, DeepSeek restant en tête
2025-02-21 17:23:48.AIbase.
Ovis2 : Six versions du modèle linguistique multimodal open source d'Alibaba International
2025-02-21 10:31:23.AIbase.
Le moteur Tencent Yuanbao intègre les modèles « HunYuan + DeepSeek » pour lancer une compétence de « compréhension d'image »
2025-02-20 16:44:24.AIbase.
VLM-R1 : Une nouvelle ère pour les modèles linguistiques visuels - Une percée majeure pour l'IA multimodale
2025-02-20 09:30:11.AIbase.
Magma : Microsoft présente un modèle d'IA multimodale intégrant la vision, le langage et les capacités de prise de décision
2025-02-18 08:55:51.AIbase.
Performances optimales ! Modèle de génération vidéo open source Step-Video-T2V de JieYue XingChen
2025-02-13 16:48:41.AIbase.