DualPipe
Un algoritmo de paralelismo de canalización bidireccional que superpone el cálculo y la comunicación durante el entrenamiento V3/R1.
Nuevo Producto PremiumOtrosAprendizaje profundoEntrenamiento distribuido
DualPipe es un innovador algoritmo de paralelismo de canalización bidireccional, desarrollado por el equipo de DeepSeek-AI. Este algoritmo, mediante la optimización de la superposición de cálculo y comunicación, reduce significativamente las burbujas de la canalización y aumenta la eficiencia del entrenamiento. Destaca en el entrenamiento distribuido a gran escala, especialmente en tareas de aprendizaje profundo que requieren una paralelización eficiente. DualPipe está desarrollado en PyTorch, es fácil de integrar y ampliar, y es adecuado para desarrolladores e investigadores que necesitan computación de alto rendimiento.
DualPipe Situación del tráfico más reciente
Total de visitas mensuales
474564576
Tasa de rebote
36.20%
Páginas promedio por visita
6.1
Duración promedio de la visita
00:06:34