ReDrafter

Tecnología innovadora para acelerar la inferencia de LLM en GPU NVIDIA

Producto ComúnProductividadGPU NVIDIAInferencia LLM
ReDrafter es un novedoso método de decodificación predictiva que combina un modelo de borrador RNN y un mecanismo de atención de árbol dinámico para mejorar significativamente la velocidad de inferencia de los modelos lingüísticos grandes (LLM) en las GPU NVIDIA. Esta tecnología acelera la generación de tokens de LLM, reduciendo la latencia percibida por el usuario, a la vez que disminuye el consumo de GPU y energía. Desarrollado por el equipo de investigación de aprendizaje automático de Apple y en colaboración con NVIDIA para su integración en el marco de aceleración de inferencia NVIDIA TensorRT-LLM, ReDrafter ofrece a los desarrolladores de aprendizaje automático que utilizan GPU NVIDIA una capacidad de generación de tokens más rápida.
Abrir sitio web

ReDrafter Situación del tráfico más reciente

Total de visitas mensuales

197433

Tasa de rebote

73.71%

Páginas promedio por visita

2.1

Duración promedio de la visita

00:00:47

ReDrafter Tendencia de visitas

ReDrafter Distribución geográfica de las visitas

ReDrafter Fuentes de tráfico