PowerInfer

Motor de inferencia de modelos lingüísticos grandes de alta velocidad para implementación local

Producto ComúnProductividadModelo lingüísticoMotor de inferencia

PowerInfer es un motor que permite la inferencia de modelos lingüísticos grandes a alta velocidad en computadoras personales utilizando GPUs de consumo. Aprovecha las características de alta localidad en la inferencia de LLM, precargando neuronas activadas en la GPU para reducir significativamente la demanda de memoria de la GPU y la transferencia de datos CPU-GPU. PowerInfer también integra un predictor adaptativo y operadores de cálculo disperso con consciencia neuronal para optimizar la eficiencia de la activación neuronal y la dispersión del cálculo. Puede realizar inferencias en una sola GPU NVIDIA RTX 4090 a una velocidad de generación promedio de 13.20 tokens por segundo, solo un 18% más lento que las GPUs A100 de nivel servidor de gama alta, manteniendo al mismo tiempo la precisión del modelo.

Best AI Websites & Tools

PowerInfer

PowerInfer Situación del tráfico más reciente

PowerInfer Tendencia de visitas

PowerInfer Distribución geográfica de las visitas

PowerInfer Fuentes de tráfico

PowerInfer Alternativas

PowerInfer — Motor de inferencia de modelos lingüísticos grandes de alta velocidad para implementación local

AlphaMaze-v0.2-1.5B — Método innovador para mejorar la capacidad de razonamiento visual de los modelos lingüísticos grandes (LLM) mediante la resolución de tareas de laberintos descritos en texto.

Smithery — Amplía las capacidades de los modelos lingüísticos mediante el servidor Model Context Protocol.

MNN — MNN es un motor de inferencia ligero y de alto rendimiento de código abierto de Alibaba, que admite varios formatos de modelos principales.

P-MMEval — Benchmark de evaluación multilingüe y multitarea para modelos lingüísticos grandes (LLM)

INTELLECT-1 Chat — Herramienta de chat con modelo lingüístico de 10 000 millones de parámetros entrenado mediante colaboración global.

Mochi en ComfyUI — Modelo de generación de video integrado en ComfyUI, de última generación.

WebLLM — Motor de inferencia de modelos lingüísticos de alto rendimiento en el navegador

RDFox — Base de datos y motor de inferencia de grafos de conocimiento de alto rendimiento

Gemma-2-27B-Chino-Chat — Primer modelo lingüístico ajustado con instrucciones para usuarios chino-ingleses

Fal AI — Plataforma de desarrollo de generación de imágenes con IA

gAIgle — Nuevo chat, plugin de máscara

RecurrentGemma-2B — Modelo lingüístico grande de código abierto de Google, capaz de generar contenido textual de alta calidad.

Búsqueda de Lepton — Lepton es una plataforma de búsqueda de modelos lingüísticos de código abierto.

TOFU — El conjunto de datos TOFU proporciona un punto de referencia para tareas de olvido ficticio en modelos lingüísticos grandes.

Extensor de Contexto LLM — Amplía la ventana de contexto del LLM

MLC Chat — Aplicación de chat con modelos lingüísticos abiertos (LLM) para iPad y iPhone.

GATE — Marco de aprendizaje que utiliza modelos lingüísticos para guiar la especificación de tareas

DreamLLM — Comprensión y creación multimodales integrales

TextSynth — Herramienta de generación de texto basada en modelos lingüísticos de gran tamaño.