El equipo de inteligencia artificial de Nueva York, Nous Research, conocido por crear modelos de lenguaje "personalizados e ilimitados", ha lanzado una nueva API de inferencia de modelos. Esto marca el comienzo de la apertura de los modelos de lenguaje de esta institución de IA, que siempre ha sido un poco "rebelde", a un público más amplio de desarrolladores e investigadores a través de una interfaz programada.

QQ_1741832058993.png

Modelos "sin límites"

Nous Research siempre ha llamado la atención por desafiar las "restricciones" de grandes empresas de IA como OpenAI y Anthropic. Su lema suena a "liberalismo". Ahora, finalmente han decidido empaquetar esta "libertad" en una API para que más personas puedan experimentarla.

La primera API incluye dos productos estrella: un modelo universal pesado Hermes3Llama70B basado en la arquitectura Meta Llama3.1, y un modelo de inferencia DeepHermes-38B Preview, lanzado el mes pasado, que puede cambiar entre respuestas estándar y "cadenas de pensamiento" (Chain-of-Thought, CoT) detalladas. Esto ofrece a los desarrolladores una opción entre un "menú de lujo" y una opción "económica".

Sin embargo, probar este "servicio de IA" no es tan simple como hacer un pedido. Nous Research utiliza un sistema de lista de espera por orden de llegada. Para compensar a los usuarios que esperan, ofrecen amablemente 5 dólares de crédito gratuito para cada nueva cuenta.

Esta estrategia, por un lado, es una medida técnica para hacer frente a posibles picos de demanda; después de todo, en comparación con las grandes empresas con "poder adquisitivo", Nous puede tener recursos de GPU limitados.

Por otro lado, esta "oferta limitada" es una inteligente estrategia de marketing que crea una "escasez", despertando la curiosidad sobre lo que ofrece.

Curiosamente, a pesar de su enfoque "poco convencional", Nous Research ha optado por alinear el diseño de su API con el de la API de OpenAI, incluyendo las interfaces completions y chat completions.

Esto permite una integración perfecta para los desarrolladores familiarizados con la interfaz de OpenAI, quienes pueden integrar fácilmente los modelos de Nous en sus aplicaciones. Esto demuestra que Nous, además de mantener sus propios principios, también tiene en cuenta las consideraciones comerciales prácticas. Después de todo, la facilidad de uso es fundamental.

De la "descarga gratuita" al "despliegue de pago": una evolución comercial

Hace solo cuatro meses, Nous Research lanzó su primer chatbot de interfaz de usuario, Nous Chat. Antes de eso, se centraban en la publicación de modelos de código abierto para el despliegue local por parte de los usuarios.

Anteriormente, los usuarios tenían que descargar el código y ejecutarlo localmente, un proceso lento, complejo y potencialmente costoso. Ahora, a través de la API, los desarrolladores pueden usar modelos de alto rendimiento sin preocuparse por la infraestructura. Esto marca un paso importante hacia un modelo comercial más sostenible para Nous Research, alejándose del modelo puramente de código abierto.

El lanzamiento de esta API refleja el esfuerzo de Nous Research por buscar la comercialización mientras mantiene los principios de código abierto. Publican los pesos de los modelos abiertamente, pero obtienen ingresos a través del despliegue comercial. Es como caminar sobre una cuerda floja: mantener la "libertad" sin sacrificar la viabilidad.

Este modelo mixto está claramente diseñado para atraer a diferentes grupos de usuarios: los desarrolladores individuales y los investigadores pueden seguir descargando y ejecutando modelos gratuitamente, mientras que las empresas que buscan confiabilidad, conveniencia y rendimiento optimizado pueden optar por usar la API de pago.

Nous Research afirma que su servicio de inferencia se expandirá con el tiempo, posiblemente incluyendo más modelos especializados, como Hermes2Pro, que destaca en las llamadas a funciones, y su proyecto Psyche. Para las nuevas empresas de inteligencia artificial que innovan con modelos de código abierto, la API de Nous Research ofrece una nueva opción, alterando el panorama existente, lo que podría intensificar la competencia en el campo de la inferencia de IA y promover el avance tecnológico.

Acceso: https://portal.nousresearch.com/login