es
Ranking de Productos de IA
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
Inicio
Noticias de IA
AI Diario
Guías de Monetización
Tutoriales de IA
Navegación de Herramientas de IA
Biblioteca de Productos de IA
es
Ranking de Productos de IA
Busca la dinámica global de productos de IA
Busca información global de IA y descubre nuevas oportunidades de IA
Información de Noticias
Aplicaciones de Productos
Casos de Monetización
Tutoriales de IA
Tipo :
Información de Noticias
Aplicaciones de Productos
Casos de Monetización
Tutoriales de IA
2024-11-28 11:04:56
.
AIbase
.
13.6k
Mooncake: Arquitectura de inferencia de modelos grandes de código abierto, construida conjuntamente por Kimi y la Universidad Tsinghua
La empresa tecnológica Yue Zhi Anmian y el laboratorio MADSys de la Universidad Tsinghua han lanzado conjuntamente un proyecto de código abierto llamado Mooncake, cuyo objetivo es construir una arquitectura de inferencia de modelos grandes centrada en KVCache. En junio de 2024, ambas partes lanzaron conjuntamente el diseño del sistema de inferencia Mooncake subyacente a Kimi, un diseño basado en la separación PD y en la arquitectura de cálculo de almacenamiento, que mejoró significativamente el rendimiento de la inferencia y atrajo una gran atención de la industria.
2024-11-28 11:03:24
.
AIbase
.
13.6k
Kimi y la Universidad Tsinghua lanzan Mooncake, una arquitectura de inferencia de modelos grandes de código abierto para mejorar la eficiencia de la IA
En la era del rápido desarrollo de la inteligencia artificial, el nivel de inteligencia de los modelos grandes está mejorando constantemente, pero también surgen desafíos cada vez más evidentes en la eficiencia de los sistemas de inferencia. Cómo hacer frente a las altas cargas de inferencia, reducir los costos de inferencia y acortar los tiempos de respuesta se ha convertido en un problema importante al que se enfrenta la industria. Kimi, en colaboración con el laboratorio MADSys de la Universidad Tsinghua, ha lanzado Mooncake, un diseño de sistema de inferencia basado en KVCache, que se publicó oficialmente en junio de 2024. El sistema de inferencia Mooncake a través de...