ultravox-v0_4_1-llama-3_1-70b
Modelo de linguagem grande multimodal de voz
Produto ComumProdutividadeReconhecimento de VozGeração de Texto
fixie-ai/ultravox-v0_4_1-llama-3_1-70b é um modelo de linguagem grande baseado no Llama3.1-70B-Instruct e whisper-large-v3-turbo pré-treinado, capaz de processar entradas de voz e texto, gerando saídas de texto. O modelo converte a entrada de áudio em embeddings usando uma marcação pseudo-especial <|audio|> e a combina com prompts de texto para gerar texto de saída. O desenvolvimento do Ultravox visa expandir os cenários de aplicação do reconhecimento de voz e geração de texto, como agentes de voz, tradução de voz para voz e análise de áudio de fala. O modelo segue a licença MIT e foi desenvolvido pela Fixie.ai.
ultravox-v0_4_1-llama-3_1-70b Situação do Tráfego Mais Recente
Total de Visitas Mensais
29742941
Taxa de Rejeição
44.20%
Média de Páginas por Visita
5.9
Duração Média da Visita
00:04:44