O Grupo Rakuten anunciou o lançamento de seus primeiros modelos de linguagem grandes (LLM) e pequenos (SLM) japoneses, denominados Rakuten AI2.0 e Rakuten AI2.0mini.

O lançamento desses dois modelos visa impulsionar o desenvolvimento da inteligência artificial (IA) no Japão. O Rakuten AI2.0, baseado na arquitetura de especialista misto (MoE), é um modelo 8x7B, composto por oito modelos com 7 bilhões de parâmetros cada, cada um atuando como um especialista. Sempre que um token de entrada é processado, o sistema o envia para os dois especialistas mais relevantes, selecionados por um roteador. Esses especialistas e o roteador são treinados conjuntamente com grandes quantidades de dados bilíngues de alta qualidade em japonês e inglês.

image.png

O Rakuten AI2.0mini é um novo modelo denso com 1,5 bilhão de parâmetros, projetado para implantação em dispositivos de borda com alta relação custo-benefício, adequado para cenários de aplicação específicos. Ele também é treinado em dados mistos de japonês e inglês, com o objetivo de fornecer soluções convenientes. Ambos os modelos foram ajustados por instruções e otimizados por preferências, com modelos básicos e modelos de instruções lançados para apoiar o desenvolvimento de aplicativos de IA por empresas e profissionais.

image.png

Todos os modelos utilizam a licença Apache2.0 e estão disponíveis no repositório oficial do Grupo Rakuten no Hugging Face, para uso comercial, incluindo geração de texto, resumo de conteúdo, perguntas e respostas, compreensão de texto e construção de sistemas de diálogo. Além disso, esses modelos também podem servir como base para outros modelos, facilitando o desenvolvimento e aplicação posteriores.

A diretora de IA e dados do Grupo Rakuten, Cai Ting, declarou: “Estou incrivelmente orgulhosa de como nossa equipe combinou dados, engenharia e ciência para lançar o Rakuten AI2.0. Nossos novos modelos de IA oferecem soluções poderosas e econômicas para ajudar as empresas a tomar decisões inteligentes, acelerar a realização de valor e abrir novas possibilidades. Ao disponibilizar os modelos abertamente, esperamos acelerar o desenvolvimento da IA no Japão, incentivando todas as empresas japonesas a construir, experimentar e crescer, promovendo uma comunidade colaborativa e de sucesso.”

Blog oficial: https://global.rakuten.com/corp/news/press/2025/0212_02.html

Destaques:

🌟 O Grupo Rakuten lança seus primeiros modelos de linguagem grandes (LLM) e pequenos (SLM) japoneses, chamados Rakuten AI2.0 e Rakuten AI2.0mini.

📊 O Rakuten AI2.0 é baseado em arquitetura de especialista misto, com oito modelos especialistas de 7 bilhões de parâmetros, dedicados ao processamento eficiente de dados bilíngues japonês-inglês.

🛠️ Todos os modelos estão disponíveis no repositório oficial do Rakuten no Hugging Face, aplicáveis a várias tarefas de geração de texto e podem servir como base para outros modelos.