Noticias de IA

No te pierdas ningún momento de la innovación global en IA

IA Diario

Tendencias diarias de la industria de la IA en tres minutos

Cronología de la IA

Hitos de la industria de la IA

Guía de Monetización de la IA

Últimos Casos

Compartiendo casos de monetización de IA

Colección de Imágenes

Casos de monetización de creación de imágenes con IA

Colección de Videos

Casos de monetización de creación de videos con IA

Colección de Audio

Casos de monetización de creación de audio con IA

Colección de Contenido

Casos de monetización de redacción de contenido con IA

Tutoriales de IA

Últimos Tutoriales

Compartiendo gratuitamente los últimos tutoriales de IA

Rankings de Productos de IA

Ranking de Productos de IA

Muestra el ranking de visitas totales de sitios web de IA

Ranking de Crecimiento de Tráfico de IA

Rastrea los sitios web de IA de más rápido crecimiento por tráfico

Ranking de Descenso de Tráfico de IA

Se centra en los sitios web de IA con descensos de tráfico significativos

Ranking Semanal de IA

Muestra el ranking semanal de visitas de sitios web de IA

Rankings de Países Populares

Estados Unidos

Sitios web de IA más populares entre los usuarios estadounidenses

China

Sitios web de IA más populares entre los usuarios chinos

India

Sitios web de IA más populares entre los usuarios indios

Brasil

Sitios web de IA más populares entre los usuarios brasileños

Rankings de Categorías Populares

Generación de Imágenes

Ranking total de visitas de sitios web de generación de imágenes con IA

Asistente Personal

Ranking total de visitas de sitios web de asistentes personales con IA

Generación de Personajes

Ranking total de visitas de sitios web de generación de personajes con IA

Generación de Videos

Ranking total de visitas de sitios web de generación de videos con IA

Rankings de Datos de Código Abierto Populares

Ranking de Proyectos de IA

Proyectos de IA populares en GitHub por estrellas totales

Ranking de Crecimiento de Proyectos de IA

Proyectos de IA populares en GitHub por tasa de crecimiento

Ranking de Desarrolladores de IA

Ranking de desarrolladores de IA populares en GitHub

Ranking de Organizaciones de IA

Ranking de organizaciones de IA populares en GitHub

Categorías de Código Abierto Populares

Deepseek

Proyectos de código abierto de Deepseek populares en GitHub

TTS

Proyectos de código abierto de TTS populares en GitHub

LLM

Proyectos de código abierto de LLM populares en GitHub

ChatGPT

Proyectos de código abierto de ChatGPT populares en GitHub

Biblioteca de Proyectos de Código Abierto de IA

Visión General

Visión general de los proyectos de código abierto de IA populares en GitHub

Biblioteca de productos Navegación de herramientas

Plataforma abierta Kimi de la cara oculta de la luna inicia prueba pública de "almacenamiento en caché de contexto", reduce el coste de los modelos de texto largo en un 90%

AIbase

Publicado elNoticias de IA · 5 minutos de lectura · Jul 2, 2024

204

Ayer, la plataforma abierta Kimi de la empresa 月之暗面 anunció el inicio de la prueba beta de su caché de contexto (Context Caching). Esta tecnología, sin modificar el precio de la API, puede reducir hasta un 90% el coste de uso de los modelos de lenguaje extenso para desarrolladores, además de mejorar significativamente la velocidad de respuesta del modelo.

El caché de contexto (Context Caching) es una técnica de gestión de datos eficiente que permite al sistema almacenar previamente grandes cantidades de datos o información que probablemente se soliciten con frecuencia. De esta manera, cuando se solicita la misma información de nuevo, el sistema puede proporcionarla rápidamente desde la caché, sin necesidad de volver a calcularla o recuperarla de la fuente de datos original, lo que ahorra tiempo y recursos. El caché de contexto (Context Caching) es especialmente adecuado para escenarios con solicitudes frecuentes y referencias repetidas a un gran contexto inicial, lo que puede reducir significativamente los costes de los modelos de texto largo y mejorar la eficiencia.

微信截图_20240702081354.png

En concreto, el «caché de contexto» se puede aplicar en escenarios con solicitudes frecuentes y referencias repetidas a un gran contexto inicial, ofreciendo los siguientes dos efectos:

Reducción de costes de hasta el 90%: Por ejemplo, en escenarios que requieren muchas preguntas sobre un documento fijo, el caché de contexto puede ahorrar una gran cantidad de costes. Para un manual de producto de aproximadamente 90.000 caracteres, donde el personal de soporte técnico necesita realizar varias preguntas y respuestas en poco tiempo, la integración del caché de contexto puede reducir los costes a aproximadamente el 10% del coste original.
Reducción del 83% en la latencia del primer token: Para una solicitud de un modelo de 128k, normalmente se tarda 30 segundos en devolver el primer token. Con el caché de contexto, la latencia del primer token se puede reducir a un promedio de 5 segundos, lo que supone una reducción del 83% en el tiempo de latencia.

El modelo de precios del caché de contexto (Context Caching) se divide principalmente en tres partes:

Coste de creación de la caché:
Al llamar a la interfaz de creación de la caché, una vez creada correctamente, se cobra según la cantidad real de tokens en la caché. 24 yuanes/M token
Coste de almacenamiento de la caché:
Durante el tiempo de vida útil de la caché, se cobra un coste de almacenamiento por minuto. 10 yuanes/M token/minuto
Coste de llamada a la caché:
Coste de los tokens incrementales de la llamada a la caché: se cobra al precio original del modelo.
Coste por número de llamadas a la caché:
Durante el tiempo de vida útil de la caché, si el usuario realiza una solicitud a la caché ya creada a través de la interfaz de chat, y el contenido del mensaje de chat coincide con la caché activa, se cobrará un coste por cada llamada a la caché. 0,02 yuanes/llamada

Almacenamiento de archivos arriba y abajo Plataforma abierta Kimi Cara oculta de la luna Modelo grande de barco de bandera de texto largo

Este artículo proviene de AIbase Daily

¡Bienvenido a la columna [AI Diario]! Aquí está tu guía diaria para explorar el mundo de la inteligencia artificial. Todos los días te presentamos el contenido más destacado en el campo de la IA, centrándonos en los desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA.

—— Creado por el grupo AIbase Daily

Noticias de IA relacionadas recomendadas

Lanzamiento de la versión de Pensamiento Visual de Kimi, de la cara oculta de la luna: creada con el modelo k1, capaz de reconocer el contenido de las imágenes

El asistente de inteligencia artificial Kimi, de la cara oculta de la luna, ha lanzado una nueva función: la versión de Pensamiento Visual. Esta actualización permite a Kimi observar y analizar en detalle las imágenes enviadas por los usuarios, revelando los secretos que esconden. Ahora los usuarios pueden hacer preguntas directamente a Kimi y utilizar su capacidad de pensamiento visual para resolver sus dudas.

Dec 16, 2024

6.8k

La cara oculta de la luna responde a la participación de Tencent en la financiación de 300 millones de dólares de Kimi: Sin comentarios

Recientemente, algunos medios informaron que Tencent participó en una ronda de financiación de 300 millones de dólares para la empresa china de inteligencia artificial unicornio, Luna Oscura Tecnología Co., Ltd., pero Luna Oscura no hizo comentarios al respecto. En mayo, la valoración de Luna Oscura ya había alcanzado los 3.000 millones de dólares, convirtiéndose en una de las empresas emergentes de modelos grandes más destacadas.

Aug 6, 2024

3.2k

Boletín diario de IA: Kuaishou lanza la versión web de Keling y el código abierto de Keling Kolors; La plataforma de video de IA de DAMO Academy, "Xun Guang", causa sensación; La cara oculta de la luna lanza el plugin del navegador Kimi

¡Bienvenido al apartado del "Boletín diario de IA"! Aquí encontrará su guía diaria para explorar el mundo de la inteligencia artificial. Cada día le presentamos los temas más destacados del ámbito de la IA, centrados en los desarrolladores, para ayudarle a comprender las tendencias tecnológicas y las innovadoras aplicaciones de productos de IA. Conozca los nuevos productos de IA: https://top.aibase.com/1、Keling AI vuelve a sorprender: lanza versión web, añade control de fotogramas inicial y final, control de movimiento de cámara, etc. Keling AI ha lanzado recientemente nuevas funciones importantes, incluyendo el lanzamiento de la versión web, mejora de la calidad de imagen, y control de fotogramas inicial y final y de la cámara.

Jul 8, 2024

1.6k

Solicitud de API abierta para el modelo de lenguaje grande Moonshot: la IA de la cara oculta de la luna lidera la nueva ola del desarrollo de IA

El modelo Moonshot abre oficialmente las solicitudes de API para ayudar a los desarrolladores a crear más aplicaciones. Moonshot es totalmente compatible con la API de OpenAI, lo que facilita la migración de los usuarios, con una longitud de contexto máxima de 128K. El precio del modelo Moonshot-v1-128k es de 0,06 yuanes, y los nuevos usuarios también reciben un crédito de 15 yuanes en tokens. La cara oculta de la luna ha recibido una financiación de 200 millones de dólares, con una inversión conjunta de Ant Group y Alibaba Group. La API abierta ofrece a los usuarios posibilidades de aplicación más amplias y fomenta la experiencia con Moo

Feb 6, 2024

3.2k