L'Université nationale de Singapour publie le modèle linguistique multimodal open source NExT-GPT pour soutenir le développement des applications IA multimédia

站长之家

Publié leActualités IA · 2 minutes de lecture · Nov 29, 2023

NExT-GPT : Un Modèle Linguistique Multimodal de l'Université Nationale de Singapour

L'Université Nationale de Singapour a publié NExT-GPT, un modèle linguistique multimodal capable de traiter du texte, des images, des vidéos et de l'audio, stimulant ainsi le développement des applications d'intelligence artificielle multimédia. Le modèle adopte une architecture à trois niveaux, utilisant la technologie MosIT pour l'entraînement de la couche intermédiaire. Sa mise à disposition en open source offre aux chercheurs et développeurs la possibilité d'intégrer des entrées multimodales.

La particularité de NExT-GPT réside dans sa capacité à générer des marqueurs de signalisation modale, ouvrant des perspectives d'applications prometteuses dans les domaines de la génération de contenu et de l'analyse multimédia.

Nvidia et l'Utah lancent un programme d'éducation à l'intelligence artificielle pour former les talents de demain

Nvidia et le gouvernement de l'Utah ont récemment annoncé un partenariat stratégique pour lancer un programme complet d'éducation à l'intelligence artificielle, visant à améliorer les compétences de la main-d'œuvre de l'État et à stimuler la croissance économique. Ce partenariat public-privé fournira des ressources clés pour développer des compétences en intelligence artificielle générative aux universités, collèges communautaires et programmes d'éducation pour adultes de l'Utah. Au cœur du programme, les éducateurs pourront obtenir une certification professionnelle via le programme des ambassadeurs universitaires du Nvidia Deep Learning Institute, et bénéficieront de kits pédagogiques de haute qualité, de contenu pour des ateliers et d'un accès au cloud Nvidia GPU.

Microsoft investit 298 millions de dollars dans les infrastructures d'intelligence artificielle en Afrique du Sud

Le géant de la technologie Microsoft a récemment annoncé un investissement de 298 millions de dollars en Afrique du Sud pour la construction d'infrastructures d'intelligence artificielle et de centres de données. Cette initiative vise à stimuler le développement de l'économie numérique sud-africaine et à fournir aux entreprises et aux particuliers locaux un meilleur soutien et des services technologiques. Avec la demande mondiale croissante d'intelligence artificielle, l'investissement de Microsoft contribuera à renforcer la compétitivité de l'Afrique du Sud dans ce domaine. Le plan d'investissement de Microsoft comprend non seulement des investissements financiers, mais aussi l'introduction de technologies et le développement des talents. En collaborant avec les entreprises et les établissements d'enseignement locaux, Microsoft espère pouvoir, en Afrique du Sud,

L'efficacité des grands modèles explose : la technologie COMET de ByteDance est open source, accélérant la vitesse de 1,7 fois

L'équipe du modèle de langage large Doubao de ByteDance a récemment annoncé avoir réussi à surmonter les goulots d'étranglement clés de l'architecture du modèle d'expert mixte (MoE) et a publié en open source une technologie d'optimisation majeure nommée COMET. Cette technologie améliore considérablement l'efficacité de l'entraînement des grands modèles, permettant une augmentation de l'efficacité allant jusqu'à 1,7 fois et réduisant efficacement les coûts de formation de 40 %. Remarque sur l'image : l'image a été générée par l'IA, le fournisseur de services d'autorisation d'image étant Midjourney. COMET a déjà été appliquée à l'entraînement en cluster de plusieurs milliers de cartes chez ByteDance, permettant des économies de plusieurs millions de GP.

Navigateur possédé par l'IA ? L'outil open source Browser Use enflamme le monde de la technologie ! Les développeurs crient au génie !

Récemment, le monde de la technologie et la communauté des développeurs ont été submergés par un projet open source nommé Browser Use ! Cet outil est comme des ailes pour l'IA, lui permettant de contrôler un navigateur aussi facilement qu'un humain. Il suffit d'un langage naturel pour commander à l'IA d'effectuer automatiquement diverses tâches sur le Web. Ses puissantes capacités d'automatisation et sa flexibilité de déploiement ont instantanément enflammé la passion des amateurs de technologie du monde entier, déclenchant une vague immense sur la plateforme X (anciennement Twitter). Browser Use se propage à une vitesse fulgurante, propulsant l'IA dans le domaine de l'automatisation des navigateurs.