ultravox-v0_4_1-llama-3_1-70b

Modelo de linguagem grande multimodal de voz

Produto ComumProdutividadeReconhecimento de VozGeração de Texto
fixie-ai/ultravox-v0_4_1-llama-3_1-70b é um modelo de linguagem grande baseado no Llama3.1-70B-Instruct e whisper-large-v3-turbo pré-treinado, capaz de processar entradas de voz e texto, gerando saídas de texto. O modelo converte a entrada de áudio em embeddings usando uma marcação pseudo-especial <|audio|> e a combina com prompts de texto para gerar texto de saída. O desenvolvimento do Ultravox visa expandir os cenários de aplicação do reconhecimento de voz e geração de texto, como agentes de voz, tradução de voz para voz e análise de áudio de fala. O modelo segue a licença MIT e foi desenvolvido pela Fixie.ai.
Abrir Site

ultravox-v0_4_1-llama-3_1-70b Situação do Tráfego Mais Recente

Total de Visitas Mensais

29742941

Taxa de Rejeição

44.20%

Média de Páginas por Visita

5.9

Duração Média da Visita

00:04:44

ultravox-v0_4_1-llama-3_1-70b Tendência de Visitas

ultravox-v0_4_1-llama-3_1-70b Distribuição Geográfica das Visitas

ultravox-v0_4_1-llama-3_1-70b Fontes de Tráfego

ultravox-v0_4_1-llama-3_1-70b Alternativas