El tamaño de los parámetros de los grandes modelos lingüísticos ha aumentado 100 veces, superando ahora el billón, lo que resulta en un enorme consumo de recursos y, por consiguiente, en costos cada vez más altos de almacenamiento, inferencia, mantenimiento e implementación. Las empresas de grandes modelos están llevando a cabo activamente un "ajuste de costos". Esto implica: primero, la escalabilidad de datos, mejorando la rentabilidad marginal de los datos a través de efectos de escala; segundo, la compresión de modelos, manteniendo el rendimiento y logrando una velocidad de inferencia más rápida, menor latencia y menor demanda de recursos; tercero, la eficiencia computacional, mejorando el rendimiento de los chips y los clústeres de computación; y cuarto, la estratificación comercial, donde las rutas de comercialización de grandes modelos de diferentes tamaños, funciones y orientaciones están empezando a diferenciarse claramente. Controlar los gastos y optimizar la eficiencia, para un servicio a largo plazo y sostenible, el "ajuste de costos" de los grandes modelos es un paso necesario.
Los grandes modelos de lenguaje entran en una nueva fase de 'reducción de costos'

脑极体
55
© Todos los derechos reservados AIbase 2024, haz clic para ver la fuente original - https://www.aibase.com/es/news/2788