¡Bienvenido a la sección 【AI日报】! Aquí encontrará su guía diaria para explorar el mundo de la inteligencia artificial. Todos los días le presentaremos los temas más relevantes del campo de la IA, centrándonos en los desarrolladores y ayudándole a comprender las tendencias tecnológicas y las innovadoras aplicaciones de los productos de IA.
Conozca los nuevos productos de IA aquí: https://top.aibase.com/
1. La capacidad de sincronización labial de la API de Kling AI se abre completamente; la prueba virtual se actualiza al modelo V1.5
Kuaishou Technology Co., Ltd. de Beijing anunció recientemente que la API de Kling AI (Kling) ha completado una nueva ronda de actualizaciones, principalmente con avances significativos en las funciones de prueba virtual y sincronización labial. El modelo V1.5 actualizado admite combinaciones de ropa de "parte superior + parte inferior", lo que mejora el realismo de la experiencia de prueba. Al mismo tiempo, la apertura completa de la capacidad de sincronización labial hace que el contenido de video generado sea más vívido, lo que brinda nuevas posibilidades creativas. Estos avances tecnológicos brindarán un sólido apoyo a los clientes en los campos del comercio electrónico y la publicidad, impulsando la innovación y el desarrollo del contenido visual.
【Resumen de AiBase:】
👗 El modelo V1.5 de Kling AI admite combinaciones de ropa, mejorando el realismo y la utilidad de la prueba virtual.
🎤 La capacidad de sincronización labial está completamente abierta, lo que permite una sincronización perfecta entre la boca del personaje del video y la voz en off.
🚀 La actualización ayudará a los usuarios empresariales a dar nuevos pasos en el crecimiento de sus negocios e impulsará la innovación en el contenido visual.
2. El modelo de lenguaje grande Doubao afirma haber alcanzado el nivel de GPT-4, revelando por primera vez su capacidad para procesar 3 millones de caracteres de texto largo
En el informe de progreso tecnológico 2024 de Doubao, el modelo de lenguaje grande de ByteDance, se anunció que su última versión, Doubao-pro-1215, ha alcanzado un rendimiento integral comparable al de GPT-4, y en algunos campos profesionales incluso supera a GPT-4. Este avance marca el auge de la tecnología de modelos de lenguaje grandes en China, mostrando una mejora significativa en la precisión de comprensión y la calidad de generación, especialmente en escenarios complejos. Además, ofrece precios de servicio más competitivos.
【Resumen de AiBase:】
🚀 El modelo de lenguaje grande Doubao ha alcanzado un rendimiento integral comparable al de GPT-4, y en algunos campos profesionales incluso lo supera.
💡 Mediante la optimización del procesamiento de datos y la arquitectura innovadora del modelo, Doubao ha logrado un progreso significativo en la precisión de comprensión y la calidad de generación.
📚 Por primera vez, se revela la capacidad de procesamiento de textos extra largos de 3 millones de caracteres, con un retraso de procesamiento controlado en menos de 15 segundos.
3. Se lanza la versión preliminar del modelo de razonamiento profundo GLM-Zero de Zhipu
Zhipu AI lanzó la versión preliminar de su primer modelo de razonamiento basado en aprendizaje por refuerzo, GLM-Zero-Preview, al final de su año fiscal. Este modelo se centra en mejorar la capacidad de razonamiento de la IA en campos como la lógica matemática y la programación, mostrando un rendimiento excelente. Aunque todavía hay una brecha con los modelos de OpenAI, la empresa planea continuar optimizándolo y expandiendo sus campos de aplicación. Los usuarios pueden experimentar este modelo en la plataforma Zhipu Qingyan, y los desarrolladores también pueden acceder a él mediante API.
【Resumen de AiBase:】
🚀 GLM-Zero-Preview se centra en mejorar la capacidad de razonamiento de la IA, especialmente en lógica matemática y programación.
🛠️ Los usuarios pueden experimentar GLM-Zero-Preview gratuitamente en la plataforma Zhipu Qingyan, admite la carga de texto e imágenes y proporciona el proceso de razonamiento completo.
📈 Con el aumento de la cantidad de entrenamiento, el efecto de GLM-Zero-Preview en el razonamiento profundo mejora constantemente, mostrando la importancia del aprendizaje por refuerzo.
Enlace de detalles: https://chatglm.cn/main/gdetail/676411c38945bbc58a905d31?lang=zh
4. Baidu publica la palabra clave de IA del año 2024: "Respuesta"
Al final de 2024, Baidu publicó la palabra clave de IA del año: "Respuesta", lo que refleja la dependencia y las expectativas de las personas hacia la IA. A medida que las personas buscan respuestas en la IA con más frecuencia, palabras como "respuesta" y "¿por qué?" revelan las emociones sociales y las dudas personales. Baidu, mediante el análisis de palabras clave de alta frecuencia, muestra cómo la IA se integra en la vida cotidiana de las personas, convirtiéndose en un apoyo para el pensamiento y las emociones.
【Resumen de AiBase:】
🤖 La IA se ha convertido en una herramienta importante para las personas que buscan respuestas en su vida diaria, lo que refleja las emociones y la confusión de la sociedad.
🔍 Las palabras clave de alta frecuencia revelan los problemas y deseos comunes de las personas en la vida, el trabajo y las emociones.
🌟 Baidu destaca que la IA seguirá siendo un compañero para la humanidad, explorando juntos las posibilidades futuras y los campos desconocidos.
5. Tongyi publica el informe de tendencias de uso de IA por jóvenes en 2024: la proporción de personas de 85 y 90 años que prestan atención a la IA es mayor
Según el "Informe de tendencias de uso de IA por jóvenes en 2024", las aplicaciones de IA se han extendido ampliamente a todos los aspectos de la vida, especialmente en el trabajo, el estudio y la expresión creativa. La generación Z, las mujeres y los gerentes empresariales muestran el mayor interés en la IA. Más del 80% de los encuestados dijeron que prestan mucha atención a las herramientas de IA, y casi la mitad de los encuestados usan la IA todos los días, lo que muestra que la IA se ha convertido en una parte indispensable de la vida.
【Resumen de AiBase:】
🧑🎓 La generación Z, las mujeres y los gerentes empresariales muestran un interés creciente en la IA, y más del 80% de los encuestados prestan mucha atención a las herramientas de IA.
🎨 La IA se utiliza ampliamente en la expresión creativa y las actividades de entretenimiento, y los jóvenes están dispuestos a probar el contenido generado por IA.
🔍 Aunque las expectativas hacia la IA están aumentando, la preocupación por la privacidad de los datos también está aumentando, por lo que es necesario mantener la vigilancia.
6. El CEO de OpenAI anuncia nuevos productos tecnológicos para 2025: la IAG y el modo para adultos generan debate
Sam Altman, CEO de OpenAI, anunció que lanzará varios nuevos productos tecnológicos en 2025, especialmente la inteligencia artificial general (IAG) y las funciones de agentes inteligentes, lo que ha generado un gran interés. El lanzamiento de nuevos productos refleja la continua innovación de OpenAI en el campo de la inteligencia artificial, especialmente en respuesta a los comentarios de los usuarios, mostrando la sensibilidad de la empresa a las necesidades del mercado. El lanzamiento del modo para adultos ha generado un acalorado debate entre los internautas, que esperan que pueda brindar una experiencia de generación de contenido más abierta.
【Resumen de AiBase:】
🌟 OpenAI planea lanzar nuevos productos como IAG y agentes inteligentes en 2025, mostrando su continua innovación en el campo de la inteligencia artificial.
💬 El modo para adultos ha llamado la atención de los internautas, que esperan que proporcione una experiencia de generación de contenido más abierta.
📈 El anuncio tecnológico de Altman se basa en los comentarios de los usuarios, lo que refleja la importancia que OpenAI da a las necesidades de los usuarios en el desarrollo de productos.
7. El robot Zhiyuan publica el primer conjunto de datos de un millón de máquinas reales del mundo, AgiBot World
Zhiyuan Robotics, en colaboración con varias instituciones, ha publicado el conjunto de datos AgiBot World, el primer conjunto de datos de un millón de máquinas reales basado en escenarios del mundo real, con el objetivo de impulsar el desarrollo de la tecnología de robots humanoides. El tamaño y la calidad de este conjunto de datos superan a los productos similares existentes, lo que impulsará en gran medida el entrenamiento y la aplicación de los modelos de lenguaje grandes para robots.
【Resumen de AiBase:】
🌍 AgiBot World es el primer conjunto de datos de un millón de máquinas reales basado en escenarios del mundo real, que admite el entrenamiento de modelos de lenguaje grandes para robots generalizados y de propósito general.
📦 El conjunto de datos abarca cinco escenarios principales: hogar, restauración, industria, etc., e incluye más de 3000 artículos reales y más de 80 videos de habilidades.
📈 Zhiyuan Robotics planea publicar en el futuro decenas de millones de datos de simulación para impulsar la aplicación generalizada de la tecnología de robots humanoides.
Enlace de detalles: https://github.com/OpenDriveLab/agibot-world
8. Hugging Face lanza SmolAgents: crea agentes inteligentes con tres líneas de código, simplificando el desarrollo de IA
El paquete de herramientas SmolAgents de Hugging Face ha revolucionado el desarrollo de IA, haciendo que la creación de agentes inteligentes sea más sencilla y eficiente que nunca. Con solo tres líneas de código, los desarrolladores pueden utilizar modelos preentrenados para construir rápidamente agentes inteligentes potentes, reduciendo enormemente el umbral de desarrollo. El diseño ligero de SmolAgents y su API intuitiva permiten a los desarrolladores de todos los niveles comenzar rápidamente y completar tareas rápidamente.
【Resumen de AiBase:】
🚀 SmolAgents simplifica la creación de agentes inteligentes con tres líneas de código, reduciendo el umbral de desarrollo.
📊 Este paquete de herramientas utiliza modelos preentrenados y admite funciones como comprensión del lenguaje, búsqueda inteligente y ejecución de código dinámico.
💻 SmolAgents es adecuado para diversas situaciones de desarrollo, completa tareas rápidamente y es adecuado para desarrolladores individuales y equipos pequeños.
Enlace de detalles: https://github.com/huggingface/smolagents
9. Shanghai añade 9 nuevos servicios de inteligencia artificial generativa registrados
La Oficina de Ciberseguridad de Shanghai publicó recientemente un anuncio sobre la adición de 9 nuevos servicios de inteligencia artificial generativa registrados, con el objetivo de promover la innovación y la aplicación regulada de la inteligencia artificial generativa en la ciudad. Este registro eleva el número total de registros a 63, destacando que todos los servicios en línea deben indicar su número de registro para mejorar la transparencia y la confianza de los usuarios. Los nuevos servicios registrados incluyen Wuyouzhimian, AI Synchronous Oral Practice, etc., con el objetivo de proporcionar a los usuarios un entorno de servicio más seguro y confiable.
【Resumen de AiBase:】
📈 Shanghai ha añadido 9 nuevos servicios de inteligencia artificial generativa, alcanzando un total de 63 registros, lo que promueve el desarrollo saludable de la industria.
🔍 Todas las aplicaciones de inteligencia artificial generativa en línea deben indicar su número de registro para mejorar la transparencia de los servicios.
💡 Los nuevos servicios incluyen Wuyouzhimian, AI Synchronous Oral Practice, etc., con el objetivo de proporcionar a los usuarios una experiencia de uso segura y confiable.
10. ¡Demasiado caro! ¡La consulta única del modelo o3 de OpenAI llega a los 1000 dólares!
El modelo o3AI recientemente lanzado por OpenAI se considera su producto de inteligencia artificial más potente, pero su costo operativo es asombroso, con un costo de más de 1000 dólares por tarea. El o3 obtuvo un excelente resultado de 87.5% en la prueba de referencia ARC-AGI, casi el triple que el modelo o1 de la generación anterior. Sin embargo, esta notable mejora en el rendimiento conlleva un enorme costo, lo que genera preocupación en la industria sobre su rentabilidad.
【Resumen de AiBase:】
💸 El costo de una sola consulta del modelo o3AI supera los 1000 dólares, lo que muestra su alto costo operativo.
📊 En la prueba de referencia ARC-AGI, o3 obtuvo una puntuación de 87.5%, casi el triple que el modelo o1 de la generación anterior.
🔍 Actualmente, o3 no se ha lanzado al público, se espera que una "versión mini" se lance en enero del próximo año.
11. Nvidia adquiere con éxito Run:ai y decide publicar su software de gestión de GPU como código abierto
Nvidia completó recientemente la adquisición de la empresa de software israelí Run:ai, con el objetivo de mejorar la eficiencia de gestión de la computación en la nube de IA. Si bien no se ha revelado el monto exacto de la adquisición, la transacción tiene un valor aproximado de 700 millones de dólares. Nvidia anunció que publicará el software de Run:ai como código abierto para apoyar un ecosistema de IA más amplio. El software de Run:ai puede programar de manera eficiente los recursos de GPU de Nvidia y optimizar el rendimiento de la computación de IA.
【Resumen de AiBase:】
🌟 Nvidia completa la adquisición de Run:ai y anuncia que publicará su software como código abierto para promover el desarrollo de la tecnología de IA.
💻 El software de Run:ai puede programar eficazmente los recursos de GPU de Nvidia y mejorar la eficiencia de la computación de IA.
🤝 Run:ai seguirá ofreciendo soporte a sus clientes, comprometiéndose a maximizar la eficiencia del uso de la infraestructura de IA.
12. Alibaba Cloud vuelve a bajar los precios: el modelo de lenguaje grande Qwen-VL baja de precio, 1 yuan puede procesar 600 imágenes
Alibaba Cloud ha reducido nuevamente el precio del modelo de lenguaje grande Qwen-VL, con una reducción de más del 80%. Después de esta reducción de precio, los usuarios solo necesitan 1 yuan para procesar 600 imágenes de 720P o 1700 imágenes de 480P. Los modelos de la serie Qwen-VL son muy populares por su potente capacidad de comprensión visual y son adecuados para una variedad de dispositivos terminales. La reducción de precios de Alibaba Cloud se debe principalmente a la optimización de la infraestructura y al aumento del volumen de llamadas del modelo.
【Resumen de AiBase:】