Recientemente, Inflection AI tomó una decisión notable en su última plataforma empresarial: abandonar las GPU de Nvidia y optar por los aceleradores Gaudi3 de Intel. Este cambio marca un ajuste estratégico de la compañía en el campo de la IA, ya que sus aplicaciones de cliente "Pi" se ejecutaban anteriormente con GPU de Nvidia. Ahora, Inflection3.0 se basará en Gaudi3, y los usuarios podrán elegir entre ejecutarla localmente o en la nube Tiber AI Cloud.

Chip AI dibujo (1)

Nota de la fuente de la imagen: Imagen generada por IA, proveedor de servicios de licencias de imágenes Midjourney

Inflection AI, fundada en 2022, se centró inicialmente en el desarrollo de Pi, un asistente personal conversacional. Sin embargo, tras la salida de sus fundadores Mustafa Suleyman y Karén Simonyan en primavera para unirse a Microsoft, la empresa comenzó a centrarse en la creación de modelos de ajuste fino personalizados para empresas, utilizando los datos de los clientes para mejorar la calidad del servicio.

Inflection3.0 es la última versión de la plataforma, cuyo objetivo es crear aplicaciones de IA exclusivas para empresas mediante el ajuste fino de los modelos con conjuntos de datos propietarios. Cabe destacar que Intel será uno de los primeros clientes en utilizar este servicio, lo que lleva a preguntarse si Inflection pagará el precio completo por estos aceleradores.

Aunque Inflection planea ejecutar sus servicios en aceleradores Gaudi3, claramente no establecerá el sistema rápidamente. Al igual que la versión anterior, Inflection2.5, la última versión también se ejecutará en el servicio Tiber AI Cloud de Intel. Sin embargo, Inflection es consciente de que algunos clientes pueden desear mantener sus datos localmente, por lo que planea ofrecer sistemas físicos basados en aceleradores Intel AI a partir del primer trimestre de 2025.

Una de las ventajas del uso de los aceleradores Gaudi3 es que Inflection ha mejorado significativamente la relación precio-rendimiento. El CEO de Inflection AI, Sean White, declaró en un blog que, gracias al uso de la tecnología de Intel, han observado una mejora de hasta el doble en la relación precio-rendimiento en comparación con los productos de la competencia actuales. También se considera que Gaudi3 es más rápido y menos costoso que el H100 de Nvidia en cuanto a velocidad de entrenamiento e inferencia.

Las especificaciones técnicas de Gaudi3 también son bastante potentes, con 128 GB de memoria HBM2e, un ancho de banda de hasta 3,7 Tbps y un rendimiento de 1.835 teraFLOPS en FP8 o BF16 denso. Con una precisión de 16 bits, el rendimiento de punto flotante de Gaudi3 es casi el doble que el del H100, lo cual es crucial para las cargas de trabajo de entrenamiento y ajuste fino en las que se centra Inflection.

Además, Intel anunció recientemente que IBM desplegará aceleradores Gaudi3 en su plataforma en la nube y planea lanzarlos a principios de 2025. Esto significa que los aceleradores Gaudi3 están ganando gradualmente el reconocimiento del mercado.

Puntos clave:

🌟 Inflection AI decide abandonar las GPU de Nvidia y utilizar los aceleradores Gaudi3 de Intel.

🚀 Inflection3.0 se basará en Gaudi3 para ofrecer aplicaciones de IA personalizadas a las empresas.

💰 Con Gaudi3, Inflection AI ha logrado una mejora de hasta el doble en la relación precio-rendimiento.