OmniAudio-2.6B
O modelo de linguagem de áudio para implantação em edge mais rápido do mundo
Novo Produto PremiumProdutividadeProcessamento de áudioComputação de borda
O OmniAudio-2.6B é um modelo multimodal de 2,6 bilhões de parâmetros capaz de processar entradas de texto e áudio de forma perfeita. Ao contrário dos métodos tradicionais que concatenam modelos ASR e LLM, este modelo combina o Gemma-2B, o Whisper turbo e um módulo de projeção personalizado em uma arquitetura eficiente, unificando essas duas capacidades. Isso resulta em processamento com mínima latência e consumo de recursos. Isso permite o processamento direto de texto de áudio em dispositivos de borda, como smartphones, laptops e robôs, de forma segura e rápida.
OmniAudio-2.6B Situação do Tráfego Mais Recente
Total de Visitas Mensais
34880
Taxa de Rejeição
40.83%
Média de Páginas por Visita
2.7
Duração Média da Visita
00:00:46