DiT-MoE
Modelo de transformador de difusão com parâmetros em larga escala
Produto ComumProgramaçãoAprendizado ProfundoModelo de Difusão
DiT-MoE é um modelo de transformador de difusão implementado usando PyTorch, capaz de escalar para 16 bilhões de parâmetros, competindo com redes densas e exibindo capacidade de inferência altamente otimizada. Representa a tecnologia de ponta em aprendizado profundo para lidar com conjuntos de dados em larga escala, possuindo importante valor de pesquisa e aplicação.
DiT-MoE Situação do Tráfego Mais Recente
Total de Visitas Mensais
474564576
Taxa de Rejeição
36.20%
Média de Páginas por Visita
6.1
Duração Média da Visita
00:06:34