Rakuten lance Rakuten AI 2.0, son premier grand modèle linguistique japonais

AIbase基地

Publié leActualités IA · 5 minutes de lecture · Feb 13, 2025

253

Le groupe Rakuten a annoncé le lancement de ses premiers grands modèles linguistiques (LLM) et petits modèles linguistiques (SLM) japonais, nommés Rakuten AI2.0 et Rakuten AI2.0mini.

Le lancement de ces deux modèles vise à stimuler le développement de l'intelligence artificielle (IA) au Japon. Rakuten AI2.0, basé sur une architecture d'expert mixte (MoE), est un modèle 8x7B composé de huit modèles disposant chacun de 7 milliards de paramètres, chaque modèle agissant comme un expert. Lors du traitement des jetons d'entrée, le système les envoie aux deux experts les plus pertinents, le choix étant effectué par un routeur. Ces experts et le routeur sont entraînés conjointement sur un vaste ensemble de données bilingues japonais-anglais de haute qualité.

Rakuten AI2.0mini est un nouveau modèle dense de 1,5 milliard de paramètres, conçu pour un déploiement rentable sur des appareils périphériques, adapté à des scénarios d'application spécifiques. Il est également entraîné sur des données mixtes japonais-anglais, dans le but de fournir une solution pratique. Les deux modèles ont subi un réglage fin par instructions et une optimisation des préférences, et des modèles de base et des modèles d'instructions ont été publiés pour aider les entreprises et les professionnels à développer des applications d'IA.

Tous les modèles sont disponibles sous licence Apache2.0 et peuvent être obtenus via la bibliothèque officielle Hugging Face du groupe Rakuten. Les utilisations commerciales incluent la génération de texte, la synthèse de contenu, les questions-réponses, la compréhension du texte et la création de systèmes de dialogue. De plus, ces modèles peuvent servir de base à d'autres modèles, facilitant ainsi le développement et les applications ultérieures.

Ting Cai, responsable de l'IA et des données chez Rakuten, a déclaré : « Je suis extrêmement fière de la manière dont notre équipe a su combiner données, ingénierie et science pour lancer Rakuten AI2.0. Nos nouveaux modèles d'IA offrent des solutions puissantes et rentables pour aider les entreprises à prendre des décisions intelligentes, à accélérer la création de valeur et à ouvrir de nouvelles possibilités. En ouvrant nos modèles, nous espérons accélérer le développement de l'IA au Japon, encourager toutes les entreprises japonaises à construire, expérimenter et grandir, et favoriser une communauté collaborative et gagnante-gagnante. »

Blog officiel : https://global.rakuten.com/corp/news/press/2025/0212_02.html

Points clés :
🌟 Rakuten lance ses premiers grands modèles linguistiques (LLM) et petits modèles linguistiques (SLM) japonais, Rakuten AI2.0 et Rakuten AI2.0mini.
📊 Rakuten AI2.0 est basé sur une architecture d'expert mixte et possède huit modèles experts de 7 milliards de paramètres chacun, conçus pour traiter efficacement les données bilingues japonais-anglais.
🛠️ Tous les modèles sont disponibles sur la bibliothèque officielle Hugging Face de Rakuten et conviennent à diverses tâches de génération de texte, pouvant également servir de base à d'autres modèles.

Groupe Rakuten Rakuten AI 2.0 IA Grand modèle linguistique

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily

Recommandations d'actualités IA connexes

Analyse des tendances du marché mondial de l'IA générative - Mars 2025

Apr 3, 2025

La Fondation Wikimedia met en garde contre la charge de bande passante due aux robots d'exploration IA

Ces dernières années, avec le développement rapide de l'intelligence artificielle, la pression sur la bande passante des projets Wikimedia due aux robots d'exploration a augmenté de manière significative. Des représentants de la Fondation Wikimedia ont indiqué qu'depuis janvier 2024, la consommation de bande passante pour les fichiers multimédia a augmenté de 50 %. Cette augmentation provient principalement de programmes automatisés qui extraient constamment du contenu de la bibliothèque d'images sous licence ouverte de Wikimedia pour entraîner des modèles d'IA. Les membres du personnel de la Fondation Wikimedia, Birgit Mueller, Chris Danis et...

Apr 3, 2025

Classement 2024 des revenus des éditeurs mobiles mondiaux : OpenAI fait son entrée

Apr 3, 2025

Lancement officiel de Speech-02 : création de contenu audio de haute qualité en partenariat avec Hedra

Apr 3, 2025

Test interne de JiMeng 3.0 : création directe de posters commerciaux 2K, qualité améliorée et mise en page plus précise

Au réveil, le monde des designers s'effondre. JiMeng teste discrètement son modèle 3.0. Ce nouveau modèle apporte une avancée majeure en termes de qualité d'image. À partir de simples invites textuelles, il génère des images riches en détails et d'une qualité exceptionnelle. L'avantage principal de JiMeng 3.0 réside dans sa maîtrise précise des scènes complexes et des détails. En entrant de brèves invites, le modèle peut générer en peu de temps des images à l'impact visuel remarquable, telles que des paysages naturels réalistes ou des portraits humains très détaillés. Comparé aux versions précédentes, JiMeng 3.0 présente des améliorations significatives en termes d'agencement des scènes, d'harmonie des couleurs et de rendu des détails.

Apr 3, 2025

Tinder lanza el juego de ligue por voz con IA "Game Game" en colaboración con OpenAI, generando controversia

Tinder anunció recientemente una colaboración con OpenAI para lanzar un juego de ligue por voz con IA llamado "Game Game". Este juego utiliza los modelos de voz y el modelo de razonamiento GPT-4 de OpenAI para animar a los usuarios a participar en juegos de rol en diversos escenarios de encuentros hipotéticos, otorgando puntos según el nivel de coqueteo. La empresa enfatiza que los datos de voz recopilados en el juego no se utilizarán para entrenar ningún modelo de IA nuevo. Recientemente, Zillow...

Apr 3, 2025

Sissie Hsiao, responsable de l'application Gemini chez Google, quitte ses fonctions. Le vice-président du laboratoire prend le relais

Selon Semafor, Sissie Hsiao, dirigeante du robot conversationnel IA de Google, quittera son poste de responsable de l'application Gemini. D'après un mémo interne obtenu par le média, Josh Woodward, vice-président du laboratoire Google, lui succédera. Alex Joseph, porte-parole de Google, a confirmé ce changement de personnel, mais a refusé de faire d'autres commentaires. Demis Hassabis, PDG de Google DeepMind, a déclaré dans le mémo que ce changement permettrait de...

Apr 3, 2025

Anthropic lance Claude for Education : un assistant IA pour développer l’esprit critique des étudiants

Anthropic a annoncé aujourd'hui le lancement de Claude for Education, un assistant IA conçu pour le secteur de l'éducation. Son objectif : améliorer le processus d'apprentissage en développant l’esprit critique, plutôt que de simplement fournir des réponses. Le produit est actuellement testé à grande échelle avec des partenaires tels que l’université Northeastern, la London School of Economics et le Champlain College, afin d’évaluer comment l’IA peut renforcer, et non pas réduire, l’expérience d’apprentissage. L’innovation principale de Claude for Education réside dans son mode d’apprentissage, une fonctionnalité qui révolutionne fondamentalement l’interaction des étudiants avec l’IA.

Apr 3, 2025

Yuanding Intelligent obtient un financement de près d'un milliard de yuans et s'associe à Fluidra pour remodeler le secteur

Yuanding Intelligent a récemment finalisé un tour de financement stratégique de près d'un milliard de yuans. Ce tour a été mené par Fluidra, géant du secteur des piscines, avec la participation de Yunqi Capital et une augmentation de la participation des investisseurs existants. Ce financement marque un tournant stratégique pour Yuanding Intelligent, lui permettant d'accéder aux canaux professionnels mondiaux de la piscine. Fluidra, acteur majeur du secteur depuis plus de 50 ans, est présent dans 47 pays et ses marques sont des noms familiers en Europe et en Amérique. Son réseau mondial de distribution, entre autres ressources, aidera Yuanding Intelligent à passer d'une position dominante en ligne à une percée sur tous les canaux. Note sur l'image : Image générée par IA, fournisseur de services d'autorisation d'image Midjourney.

Apr 3, 2025

Wuhan intègre un système d'IA intelligent pour les examens sportifs, près de 100 000 élèves en bénéficient

Du 1er au 18 avril, environ 100 000 élèves de troisième de Wuhan ont participé à leurs examens sportifs. Ces examens ont intégré un nouveau système d'IA intelligent, marquant un tournant majeur dans l'évaluation des épreuves sportives. Traditionnellement, les examens sportifs reposaient sur le chronométrage et la notation manuelle, tandis que les examens de cette année ont adopté un modèle basé sur des dispositifs intelligents et une gestion en nuage, garantissant ainsi l'équité et l'efficacité de l'examen. Selon les informations disponibles, les examens sportifs de cette année ont utilisé plusieurs technologies d'IA, notamment la reconnaissance faciale, la mesure électronique et les capteurs sans fil, couvrant 14 épreuves réparties en trois catégories. Ces épreuves...

Apr 2, 2025

Actualités IA

IA Quotidien

Chronologie de l'IA

Derniers cas

Collection d'images

Collection de vidéos

Collection audio

Collection de contenu

Derniers tutoriels

Classement des produits IA

Classement de la croissance du trafic IA

Classement de la baisse du trafic IA

Classement hebdomadaire de l'IA

États-Unis

Chine

Inde

Brésil

Génération d'images

Assistant personnel

Génération de personnages

Génération de vidéos

Classement des projets IA

Classement de la croissance des projets IA

Classement des développeurs IA

Classement des organisations IA

Deepseek

TTS

LLM

ChatGPT

Aperçu

Rakuten lance Rakuten AI 2.0, son premier grand modèle linguistique japonais

AIbase基地

Cet article provient d'AIbase Daily

Recommandations d'actualités IA connexes

Analyse des tendances du marché mondial de l'IA générative - Mars 2025

La Fondation Wikimedia met en garde contre la charge de bande passante due aux robots d'exploration IA

Classement 2024 des revenus des éditeurs mobiles mondiaux : OpenAI fait son entrée

Lancement officiel de Speech-02 : création de contenu audio de haute qualité en partenariat avec Hedra

Test interne de JiMeng 3.0 : création directe de posters commerciaux 2K, qualité améliorée et mise en page plus précise

Tinder lanza el juego de ligue por voz con IA "Game Game" en colaboración con OpenAI, generando controversia

Sissie Hsiao, responsable de l'application Gemini chez Google, quitte ses fonctions. Le vice-président du laboratoire prend le relais

Anthropic lance Claude for Education : un assistant IA pour développer l’esprit critique des étudiants

Yuanding Intelligent obtient un financement de près d'un milliard de yuans et s'associe à Fluidra pour remodeler le secteur

Wuhan intègre un système d'IA intelligent pour les examens sportifs, près de 100 000 élèves en bénéficient