¡Bienvenido a la sección 【AI日报】! Aquí encontrará su guía diaria para explorar el mundo de la inteligencia artificial. Cada día le presentaremos los temas más relevantes del ámbito de la IA, centrándonos en los desarrolladores y ayudándole a comprender las tendencias tecnológicas y las innovadoras aplicaciones de los productos de IA.

Productos de IA nuevos Consulte más información:https://top.aibase.com/

1、xAI lanza una API para desarrolladores, ofreciendo un crédito de uso gratuito de 25 dólares al mes

xAI, la empresa de Elon Musk, anunció hoy que su interfaz de programación de aplicaciones (API) ya está disponible para el público, y que hasta fin de año se ofrecerán 25 dólares mensuales en créditos de API gratuitos. El precio de la API de xAI es ligeramente superior al de otros modelos, pero los 25 dólares gratuitos podrían atraer a los desarrolladores a probar, al menos, las herramientas y la plataforma de xAI. Los desarrolladores pueden esperar más funciones y actualizaciones.

image.png

【Resumen de AiBase:】

✨ La API de xAI permite a los desarrolladores crear aplicaciones sobre el modelo de lenguaje grande Grok.

🔥 La API de xAI admite llamadas a funciones, lo que permite que el LLM reciba comandos y acceda a las funciones de otras aplicaciones y servicios conectados.

💡 La API de xAI es compatible con los SDK de OpenAI y Anthropic, lo que facilita a los desarrolladores cambiar el modelo a Grok-beta u otros modelos en la plataforma xAI.

2、Kunlun Wanwei lanza oficialmente la versión más reciente de la función de «Búsqueda avanzada de IA» de TianGong AI

Kunlun Wanwei Technology Co., Ltd. anunció el lanzamiento oficial de la versión más reciente de la función de búsqueda avanzada de IA de su TianGong AI de desarrollo propio, que ofrece a los usuarios una experiencia de búsqueda más precisa y profesional, especialmente en los ámbitos de la inversión financiera y la investigación académica. TianGong AI ha logrado un salto cualitativo gracias a la optimización inteligente de su capacidad de razonamiento analítico multinivel, la búsqueda de IA profesional en inversiones financieras, la búsqueda de IA profesional en investigación académica y el análisis de lectura de documentos de IA.

image.png

【Resumen de AiBase:】

🔍 Capacidad mejorada de razonamiento analítico multinivel, que proporciona resultados de búsqueda precisos y convierte las necesidades del usuario en respuestas inteligentes.

💼 La función de búsqueda de IA profesional en inversiones financieras incluye la comparación de datos financieros, el análisis de empresas y la interpretación de informes, y admite la extracción y el análisis de datos clave.

📚 La búsqueda de IA profesional en investigación académica incluye más de 200 millones de artículos científicos en inglés, y puede mostrar rápidamente las referencias y los resúmenes que coinciden exactamente, permitiendo a los usuarios obtener el contenido principal de los artículos.

3、Actualización importante de la serie de modelos Claude AI: se lanza Claude3.5Haiku, con un gran aumento del rendimiento de la IA

Anthropic ha lanzado recientemente una importante actualización de su serie de modelos Claude AI, que incluye la versión mejorada Claude3.5Sonnet y el nuevo Claude3.5Haiku. Esta actualización no solo ha supuesto un progreso significativo en el rendimiento, sino que también ha demostrado una mayor competitividad en cuanto a rentabilidad. Las nuevas versiones de los modelos han mostrado un rendimiento excelente en varias pruebas de referencia, especialmente el modelo Claude3.5Haiku, que ha destacado en tareas de programación.

image.png

【Resumen de AiBase:】

🌟 Los modelos Claude3.5Sonnet y Haiku han logrado un gran avance en rendimiento y rentabilidad.

💻 La nueva API permite a Claude interactuar directamente con la interfaz de la computadora, mejorando la colaboración entre humanos y máquinas.

🚀 La actualización acelerará la adopción de la tecnología de IA en diversos sectores, ayudando a las empresas a lograr aplicaciones de IA eficientes a un menor costo.

4、Tencent lanza el modelo de lenguaje grande de código abierto Hunyuan-large, que admite secuencias de texto de hasta 256 K

Tencent lanzó hoy el modelo de lenguaje grande de código abierto MOE Hunyuan-large, con un total de 398 B de parámetros y 52 B de parámetros activados. Es líder en 9 grandes dimensiones, incluyendo tareas de PNL en chino e inglés, código y matemáticas, superando a modelos de código abierto de primera línea como Llama3.1 y Mixtral.

【Resumen de AiBase:】

📊 Tencent lanza el modelo Hunyuan-large de 398 B de parámetros, superando ampliamente a modelos como Llama3.1.

🧠 El modelo admite secuencias de texto de hasta 256 K, mejorando la capacidad de procesamiento de textos largos.

📜 Próximamente se lanzará el conjunto de evaluación de Pergaminos de Pingüino de código abierto, para ayudar en la evaluación de textos largos y la investigación de aplicaciones en el sector.

5、¡Apple lanza una gran novedad! Llega Ferret-UI2, ¡con una comprensión de la interfaz de usuario al máximo!

Actualmente, la diversidad de pantallas de los dispositivos y la complejidad de las operaciones resultan abrumadoras. Apple presenta Ferret-UI2, un modelo de comprensión de la interfaz de usuario multiplataforma que, según se afirma, puede unificar la interfaz de usuario en diversos dispositivos, incluyendo iPhone, Android, iPad, páginas web y Apple TV. Ferret-UI2 admite múltiples plataformas, introduce tecnología de codificación de imágenes dinámicas de alta resolución y un método de mejora de malla adaptativa para mejorar la capacidad de percepción de la interfaz de usuario. Gracias al aprendizaje de tareas básicas y avanzadas a través de datos de entrenamiento de alta calidad, presenta un excelente rendimiento en tareas de comprensión de la interfaz de usuario multiplataforma.

image.png

【Resumen de AiBase:】

🔍 Ferret-UI2 admite múltiples plataformas, puede comprender las pantallas de interfaz de usuario de diversos dispositivos, se adapta a ecosistemas de dispositivos diversificados y ofrece una amplia gama de escenarios de aplicación.

🖼 Ferret-UI2 introduce tecnología de codificación de imágenes dinámicas de alta resolución y un método de mejora de malla adaptativa para mejorar la capacidad de percepción de la interfaz de usuario, identificando con precisión los elementos visuales y sus relaciones.

🚀 Ferret-UI2, a través de datos de entrenamiento de alta calidad, aprende tareas básicas y avanzadas, mostrando un rendimiento excelente en tareas de comprensión de la interfaz de usuario multiplataforma y una buena capacidad de generalización.

Enlace de detalles:https://huggingface.co/jadechoghari/Ferret-UI-Llama8b

6、Apple integrará ChatGPT de OpenAI en iOS 18.2

Apple anunció que integrará ChatGPT de OpenAI en la próxima versión de iOS 18.2, ofreciendo a los usuarios un Siri y otras funciones más inteligentes. Las nuevas funciones incluyen la opción de actualizar a ChatGPT Plus, donde los usuarios pueden suscribirse al servicio de pago de OpenAI por 20 dólares al mes. El modelo de negocio de la colaboración entre Apple y OpenAI aún no está claro, pero ambas partes esperan beneficiarse mutuamente aumentando la visibilidad.

image.png

【Resumen de AiBase:】

🔹 iOS 18.2 integrará ChatGPT, y los usuarios podrán actualizar a ChatGPT Plus.

🔹 ChatGPT Plus ofrece más funciones; la versión gratuita es limitada, mientras que los usuarios de pago disfrutan de una experiencia más completa.

🔹 El modelo de negocio de la colaboración entre Apple y OpenAI aún no está claro, pero ambas partes esperan beneficiarse mutuamente aumentando la visibilidad.

7、Rive lanza la función Layouts: adaptación automática de imágenes a diversas pantallas, ¡solución a los problemas de diseño!

La función Layouts lanzada por Rive supone un gran avance para diseñadores y desarrolladores, liberándolos de las preocupaciones de adaptación de pantalla. Esta función permite que los gráficos animados se adapten automáticamente a diferentes dispositivos y tamaños de pantalla, manteniendo la fluidez de los efectos animados y ofreciendo una mejor experiencia al usuario.

【Resumen de AiBase:】

✨ Adaptación automática al tamaño de la pantalla, manteniendo la fluidez de los efectos animados, lo que permite a los diseñadores crear fácilmente diseños sensibles.

🌟 Compatibilidad entre dispositivos, los gráficos se transfieren suavemente entre diferentes plataformas; una sola creación para la adaptación a múltiples plataformas.

💡 Compatibilidad con múltiples idiomas, el tamaño del diseño se ajusta automáticamente según la longitud del texto, garantizando una visualización coherente.

Enlace de detalles:https://rive.app/blog/introducing-layouts

8、Nuevo modelo de reconocimiento de voz de código abierto Moonshine: cinco veces más rápido que OpenAI Whisper

Moonshine es un modelo de reconocimiento de voz de código abierto diseñado para procesar datos de audio de forma más eficiente, especialmente adecuado para fragmentos de audio cortos, compatible con la ejecución sin conexión y con un menor consumo de recursos informáticos.

image.png

【Resumen de AiBase:】

🚀 Moonshine es cinco veces más rápido que OpenAI Whisper, más económico y eficiente.

🔍 Adecuado para procesar fragmentos de audio cortos, ajustando el tiempo de procesamiento según la duración del audio.

💻 Compatible con la ejecución sin conexión, adecuado para dispositivos de hardware con recursos limitados.

Enlace de detalles:https://github.com/usefulsensors/moonshine

9、Shanghai AI Lab publica el proyecto o1 versión LLaMA

Recientemente, el equipo de Shanghai AI Lab publicó el proyecto o1 versión LLaMA, cuyo objetivo es replicar la herramienta de resolución de problemas matemáticos de OpenAI, o1. Emplea la búsqueda de árbol de Monte Carlo, el aprendizaje por refuerzo de autojuego, PPO y la tecnología AlphaGo Zero, atrayendo la atención de la comunidad de desarrolladores. El proyecto ha logrado un progreso significativo, superando otras soluciones comerciales de código cerrado y consiguiendo un gran avance en la replicación de OpenAI o1 basada en la arquitectura AlphaGo Zero. Ya se han publicado de código abierto el conjunto de datos de preentrenamiento, el modelo y el código de entrenamiento de aprendizaje por refuerzo.

【Resumen de AiBase:】

🔍 Emplea tecnología avanzada para replicar la herramienta de resolución de problemas matemáticos de OpenAI, o1.

💡 La estrategia de optimización por pares ha logrado un progreso significativo, superando otras soluciones comerciales de código cerrado.

🚀 Ha logrado un gran avance en la replicación de OpenAI o1 basada en la arquitectura AlphaGo Zero.

Enlace de detalles:https://arxiv.org/pdf/2410.02884https://arxiv.org/pdf/2406.07394

10、Inauguración del primer restaurante del mundo que utiliza servicios de IA generativa

Una empresa de inteligencia artificial disruptiva ha lanzado el primer proyecto mundial que utiliza IA generativa para ayudar a los camareros de restaurantes, convirtiendo al restaurante de alta cocina Cibo Vino en el primero en adoptar este servicio de IA. Esta tecnología ha mejorado la eficiencia de la formación de los camareros y ofrece a los clientes hasta 2,7 millones de sugerencias de maridaje perfecto de comida, vino y cócteles, a la vez que permite gestionar las alergias, las necesidades dietéticas y la compatibilidad con múltiples idiomas de los clientes.

【Resumen de AiBase:】

🍽️ Cibo Vino se convierte en el primer restaurante del mundo que utiliza servicios de IA generativa, ofreciendo formación innovadora para empleados y asistencia en recomendaciones.

🤖 La tecnología Brown Bacon AI ofrece cerca de 2,7 millones de sugerencias de maridaje perfecto de comida y bebida, mejorando enormemente la calidad del servicio.

🌍 La tecnología admite múltiples idiomas, gestiona con precisión las necesidades dietéticas y las alergias de los clientes, mejorando la experiencia gastronómica.