SlowFast-LLaVA

Modelo de lenguaje grande sin entrenamiento para comprensión e inferencia de video.

Producto ComúnProductividadPreguntas y respuestas sobre videoAprendizaje multimodal

SlowFast-LLaVA es un modelo de lenguaje grande multimodal sin entrenamiento, diseñado específicamente para la comprensión e inferencia de video. Sin necesidad de ajuste fino en ningún conjunto de datos, alcanza un rendimiento comparable o incluso superior al de los modelos de lenguaje grandes de video más avanzados en diversas tareas y benchmarks de preguntas y respuestas sobre video.

Best AI Websites & Tools

SlowFast-LLaVA

SlowFast-LLaVA Situación del tráfico más reciente

SlowFast-LLaVA Tendencia de visitas

SlowFast-LLaVA Distribución geográfica de las visitas

SlowFast-LLaVA Fuentes de tráfico

SlowFast-LLaVA Alternativas

SlowFast-LLaVA — Modelo de lenguaje grande sin entrenamiento para comprensión e inferencia de video.

PPLLaVA — Modelo de implementación de GPU para la comprensión de secuencias de vídeo

NotaGen — NotaGen es un modelo para la generación de música simbólica, que adopta el paradigma de entrenamiento de modelos de lenguaje grande y se centra en la generación de partituras de música clásica de alta calidad.

AoT — Atom of Thoughts (AoT) es un marco para mejorar el rendimiento de la inferencia de los modelos de lenguaje grandes.

TableGPT2-7B — TableGPT2-7B es un modelo de lenguaje grande enfocado en el procesamiento de datos tabulares, ideal para análisis de datos y tareas de inteligencia empresarial.

GLM-PC — GLM-PC es un agente de inteligencia artificial para computadoras basado en el modelo de lenguaje visual CogAgent, diseñado para mejorar la experiencia del usuario.

DeepSeek-R1-Distill-Llama-70B — DeepSeek-R1-Distill-Llama-70B es un modelo de lenguaje grande optimizado mediante aprendizaje por refuerzo, centrado en la capacidad de razonamiento y diálogo.

InternVL2_5-78B-MPO — Se trata de una serie de modelos de lenguaje grandes multimodales de vanguardia que demuestra un rendimiento general excepcional.

MinMo — MinMo es un modelo de lenguaje grande multi modal diseñado para una interacción de voz fluida.

Dria-Agent-a-3B — Modelo de lenguaje grande basado en la serie Qwen2.5-Coder, especializado en aplicaciones de agente.

Dria-Agent-a-7B — Un modelo de lenguaje grande basado en la serie Qwen2.5-Coder, enfocado en aplicaciones de agentes.

Llama-3-Patrono-Lince-8B-Instrucciones-Q4_K_M-GGUF — Modelo de lenguaje grande cuantificado basado en un modelo específico, adecuado para tareas de procesamiento del lenguaje natural, entre otras.

InternVL2.5-38B-MPO — Modelo de la serie InternVL2.5-MPO, basado en InternVL2.5 y optimización de preferencias mixtas, que demuestra un rendimiento excepcional.

InternVL2_5-26B-MPO-AWQ — Modelo de lenguaje grande multimodal avanzado con una capacidad de razonamiento multimodal excepcional.

AnyParser Pro — AnyParser Pro es un modelo de lenguaje grande que extrae contenido de PDF, PPT e imágenes de forma rápida y precisa.

VITA-1.5 — VITA-1.5: Modelo de lenguaje multimodal de gran tamaño de nivel GPT-4o con interacción visual y de voz en tiempo real

InternVL2_5-26B-MPO — Modelo de lenguaje grande multimodales que mejora la interacción entre la visión y el lenguaje.

InternVL2_5-8B-MPO-AWQ — Modelo de lenguaje grande multimodal que mejora la interacción entre la visión y el lenguaje.

HuatuoGPT-o1-8B — Modelo de lenguaje grande (LLM) de vanguardia para el ámbito médico

HuatuoGPT-o1 — Modelo de lenguaje grande para razonamiento complejo en el ámbito médico

InternVL2_5-4B-MPO-AWQ — Modelo de lenguaje grande multimodal, optimizado para la interacción entre imágenes y texto.

InternVL2.5-4B-MPO — Modelo de lenguaje grande multimodal que muestra un rendimiento general excelente.

Valley 2.0 — Modelo de lenguaje grande multimodal que mejora el procesamiento de datos de texto, imágenes y vídeo.

InternVL2_5-2B-MPO — Modelo de lenguaje grande multimodal avanzado

InternVL2_5-1B-MPO — Modelo de lenguaje grande multimodal que mejora la comprensión integral de la visión y el lenguaje.

InternVL2-8B-MPO — Modelo de lenguaje grande multimodal que mejora la capacidad de razonamiento multimodal.

EXAONE-3.5-32B-Instruct-GGUF — Modelo de lenguaje grande multilingüe y de alto rendimiento desarrollado por LG AI Research

DeepSeek-VL2-Small — Modelo de lenguaje visual avanzado de gran tamaño y experto mixto

Command R7B — Modelo de IA generativo rápido y eficiente

InternVL2_5-4B — Modelo de lenguaje grande multimodal que integra la comprensión visual y lingüística.