¡Bienvenido a la sección 【AI日报】! Aquí encontrará su guía diaria para explorar el mundo de la inteligencia artificial. Todos los días le presentamos los temas más relevantes del campo de la IA, con enfoque en los desarrolladores, para ayudarle a comprender las tendencias tecnológicas y las innovadoras aplicaciones de productos de IA.

Productos de IA nuevos ¡Infórmese aquí!:https://top.aibase.com/

1. El misterioso modelo Blueberry irrumpe en escena: ¿Nuevo líder en el mundo de la generación de imágenes por IA o simple truco publicitario?

La aparición del misterioso modelo Blueberry ha generado gran atención y debate en la industria. Su rendimiento en la arena de la IA lo ha llevado rápidamente a la cima, convirtiéndose en el nuevo líder en el campo de la generación de imágenes a partir de texto. Sin embargo, la verdadera identidad de Blueberry ha dado lugar a especulaciones y debates entre los usuarios, creando un ambiente de misterio e intriga.

image.png

【Resumen de AiBase:】

🌟 El modelo Blueberry, gracias a su excelente rendimiento, supera a sus conocidos competidores y se convierte en el nuevo líder en la generación de imágenes a partir de texto.

💡 El modelo Blueberry tiene una estrecha relación con Flux, lo que ha generado especulaciones y debates.

🔍 El modelo Blueberry demuestra un excelente rendimiento, pero aún hay margen de mejora en aspectos como el procesamiento de texto.

Enlace a más información:https://artificialanalysis.ai/text-to-image/arena

2. Google invierte 2700 millones de dólares para volver a contratar a un experto en IA: el fundador de Character.AI

Google ha pagado la asombrosa cifra de 2700 millones de dólares para volver a contratar al experto en IA Noah Shazeer. Su empresa emergente, Character.AI, también obtuvo millones de dólares en esta transacción. Los gigantes tecnológicos de Silicon Valley compiten ferozmente por los talentos en investigación de IA, lo que genera preocupación por una posible burbuja en el mercado.

【Resumen de AiBase:】

💰 Google ha pagado la asombrosa cantidad de 2700 millones de dólares para volver a contratar al experto en IA Noah Shazeer.

🔍 La empresa emergente de Shazeer, Character.AI, también obtuvo millones de dólares en esta transacción.

🤖 Los gigantes tecnológicos de Silicon Valley compiten ferozmente por los talentos en investigación de IA, lo que genera preocupación por una posible burbuja en el mercado.

3. Alibaba Mama lanza código abierto del nuevo modelo de reparación de imágenes por IA FLUX-Controlnet-Inpainting

El equipo creativo de Alibaba Mama ha lanzado el código abierto del modelo de reparación de imágenes por IA FLUX-Controlnet-Inpainting, que combina las ventajas de FLUX.1-dev y ControlNet para lograr una reparación de alta calidad. El modelo comprende las descripciones en lenguaje natural del usuario, pudiendo reparar imágenes con precisión y cambiar su estilo. Actualmente se encuentra en fase de prueba alfa y se seguirán realizando optimizaciones y lanzando nuevas versiones.

image.png

【Resumen de AiBase:】

🔧 Combina las ventajas de FLUX.1-dev y ControlNet para lograr una reparación de imágenes de alta calidad.

🎨 El modelo comprende las descripciones en lenguaje natural del usuario, permitiendo una reparación precisa de las imágenes y un cambio de estilo.

🚀 Se encuentra en fase de prueba alfa y se seguirán realizando optimizaciones y lanzando nuevas versiones.

Enlace a más información:https://github.com/alimama-creative/FLUX-Controlnet-Inpainting

4. Una herramienta de IA gratuita y de código abierto para convertir libros electrónicos en audiolibros: ¡con clonación de voz!

Drew Thomasson ha lanzado recientemente el proyecto de código abierto ebook2audiobookXTTS, que utiliza Calibre y Coqui TTS para convertir libros electrónicos en audiolibros, ofreciendo una experiencia de lectura de alta calidad. La herramienta admite varios idiomas, la clonación de voz personalizada y se caracteriza por su eficiencia, compatibilidad con múltiples idiomas y facilidad de uso.

【Resumen de AiBase:】

🔥 Conversión eficiente: Utiliza Calibre para convertir varios formatos de libros electrónicos y detecta automáticamente los capítulos.

🌍 Compatibilidad con múltiples idiomas: Admite inglés de forma predeterminada, así como español, francés, alemán, etc., satisfaciendo las necesidades de usuarios de todo el mundo.

🎤 Clonación de voz a elección: Los usuarios pueden utilizar archivos de voz personalizados para crear una experiencia auditiva única.

Enlace a más información:https://github.com/DrewThomasson/ebook2audiobookXTTS

5. ¿Cuanto más inteligente, más mentiroso? ¡La investigación advierte sobre el aumento de las respuestas engañosas de la IA!

Los robots de chat de inteligencia artificial son cada vez más potentes, pero las investigaciones muestran que también aumenta la probabilidad de que mientan. Cuanto más grande es el modelo de lenguaje, mayor es el porcentaje de respuestas incorrectas. Los investigadores recomiendan establecer un umbral de respuesta para la IA y animarla a rechazar las preguntas sobre las que no esté segura.

【Resumen de AiBase:】

🔍 Los robots de chat de IA son cada vez más potentes, pero también aumenta la probabilidad de que mientan.

📉 Cuanto más grande es el modelo de lenguaje, mayor es el porcentaje de respuestas incorrectas.

🤖 Los investigadores recomiendan establecer un umbral de respuesta para la IA y animarla a rechazar las preguntas sobre las que no esté segura.

6. ORYX: El modelo de lenguaje grande multimodal que está cambiando la comprensión visual de la IA

En el contexto del rápido desarrollo de la inteligencia artificial, el modelo de lenguaje grande multimodal ORYX está cambiando nuestra comprensión de la comprensión visual de la IA. Este sistema de IA, desarrollado conjuntamente por la Universidad Tsinghua, Tencent y la Universidad Tecnológica de Nanyang, es un verdadero "transformer" en el campo del procesamiento visual, con la capacidad de procesar entradas visuales de cualquier resolución y compresión dinámica.

image.png

【Resumen de AiBase:】

🔍 ORYX es un modelo de IA diseñado específicamente para el procesamiento de imágenes, vídeos y la comprensión espacio-temporal de escenas 3D.

🌟 La principal ventaja de ORYX es su capacidad para comprender el contenido visual y detectar las relaciones y el trasfondo de dicho contenido.

💡 ORYX ha demostrado un potencial asombroso, capaz de comprender en profundidad el contenido de los vídeos y captar con precisión la posición y las relaciones de los objetos en el espacio 3D.

Enlace a más información:https://arxiv.org/pdf/2409.12961

7. ¡Una tomografía computarizada para las pinturas al óleo! La IA desvela los secretos creativos de las famosas pinturas de Rafael

En los últimos años, las técnicas de imagen no destructiva han avanzado rápidamente en los campos de la investigación y conservación de pinturas. Investigadores italianos han logrado aplicar con éxito algoritmos de aprendizaje profundo al análisis espectral del conjunto de datos MA-XRF, desarrollando un nuevo método de análisis. Este método presenta un excelente rendimiento en el procesamiento de espectros XRF en el conjunto de datos MA-XRF, lo que supone un gran avance en el campo del análisis de obras de arte.

image.png

【Resumen de AiBase:】

🔍 Los algoritmos de aprendizaje profundo han logrado un gran avance en el análisis espectral del conjunto de datos MA-XRF.

💡 El nuevo método permite cuantificar con mayor precisión la intensidad de las líneas de fluorescencia y elimina los artefactos de los métodos de análisis tradicionales.

🎨 La tecnología de inteligencia artificial ofrece nuevas ideas para analizar los espectros XRF de forma más precisa y eficiente.

Enlace a más información:https://www.science.org/doi/10.1126/sciadv.adp6234

8. OpenAI planea duplicar el precio de ChatGPT en cinco años, con un objetivo de ingresos de 100.000 millones de dólares para 2029

Un documento interno de OpenAI que se ha filtrado recientemente revela que la empresa planea duplicar el precio de ChatGPT en los próximos cinco años, con el objetivo de alcanzar unos ingresos de 100.000 millones de dólares en 2029. Esta medida ha generado una gran atención y refleja las ambiciosas aspiraciones de OpenAI en el campo de la inteligencia artificial.

【Resumen de AiBase:】

🚀 OpenAI planea duplicar el precio de ChatGPT a 44 dólares en los próximos cinco años, con el objetivo de alcanzar unos ingresos anuales de 100.000 millones de dólares.

📈 Los ingresos de OpenAI se han triplicado en el último año, y se espera que ChatGPT genere 2700 millones de dólares este año.

💻 Microsoft es la mayor fuente de costes de OpenAI, y la rentabilidad de su inversión ha afectado a la valoración y al precio de las acciones de ambas empresas.

9. Nuevo hito de Hugging Face: el número de modelos de IA gratuitos supera el millón, y los usuarios crean un nuevo repositorio de IA cada 10 segundos

Hugging Face ha anunciado que el número de modelos de IA ha superado el millón, mostrando una tendencia creciente de soluciones especializadas. La plataforma crea un nuevo repositorio cada 10 segundos, lo que impulsa la popularización de las aplicaciones de IA.

【Resumen de AiBase:】

🌟 El número de modelos de IA de código abierto de Hugging Face supera el millón, mostrando una tendencia creciente de soluciones especializadas.

🛠️ La plataforma crea un nuevo repositorio cada 10 segundos, incluyendo modelos, conjuntos de datos y espacios de aplicaciones.

📈 Se espera que en el futuro el número de modelos de IA sea comparable al de los repositorios de código, impulsando las aplicaciones de IA en todos los sectores.

10. Google DeepMind lanza AlphaChip: diseño de chips de aceleración de IA, ¡con una asombrosa mejora de la eficiencia!

El nuevo sistema de IA AlphaChip, recientemente lanzado por Google DeepMind, tiene como objetivo acelerar y optimizar el diseño de chips, impulsando el progreso de la industria de los chips. AlphaChip ya ha logrado una notable optimización de la disposición en la última serie de TPU de Google, mostrando una asombrosa mejora de la eficiencia. Los recursos de código abierto permiten a los investigadores externos utilizar modelos preentrenados para sus aplicaciones, impulsando aún más el desarrollo del campo del diseño de chips.

【Resumen de AiBase:】

🌟 AlphaChip es un sistema de IA de Google DeepMind diseñado para acelerar y optimizar el diseño de chips.

🔍 Este sistema ya se ha aplicado en la última serie de TPU de Google y ha logrado una notable optimización de la disposición.

📚 DeepMind ha abierto parte de los recursos de AlphaChip, permitiendo a los investigadores externos utilizarlos para el preentrenamiento y las aplicaciones.

11. Un tribunal alemán permite a la organización sin ánimo de lucro LAION utilizar imágenes protegidas por derechos de autor para el entrenamiento de la IA

La decisión judicial de Hamburgo, Alemania, ha suscitado un nuevo debate sobre la recopilación y el uso de datos de entrenamiento de IA, ofreciendo una importante referencia para el marco jurídico del desarrollo de la IA. La decisión permite a LAION utilizar imágenes con derechos de autor para la investigación científica no comercial, lo que ha generado controversia.

【Resumen de AiBase:】

🤖 Un tribunal alemán ha dictaminado que el uso de imágenes con derechos de autor por parte de LAION, con fines no lucrativos, es legal.

🔍 La decisión destaca que el conjunto de datos es gratuito para fines de investigación y apoya la recopilación de datos por parte de las instituciones de investigación de IA.

⚖️ El tribunal no ha resuelto la aplicabilidad más amplia de las excepciones a la minería de textos y datos, por lo que la relación futura entre la IA y los derechos de autor sigue siendo incierta.

12. Nueva herramienta de rastreo de código abierto Crawl4AI: extracción ultrarrápida de contenido web y extracción de datos

En la era impulsada por la inteligencia artificial, los modelos de lenguaje grandes como GPT-3 y BERT necesitan cada vez más datos de alta calidad. Crawl4AI, como herramienta de código abierto, resuelve las limitaciones de los rastreadores web tradicionales y ofrece una solución eficiente y personalizable para el entrenamiento de LLM. Los formatos de salida incluyen JSON y Markdown, lo que facilita enormemente la recopilación de datos de forma sencilla y eficiente. Es adecuado para diversas aplicaciones impulsadas por LLM y simplifica el proceso de adquisición de datos para proyectos de aprendizaje automático e inteligencia artificial para investigadores y desarrolladores.

image.png

【Resumen de AiBase:】

🚀 Crawl4AI es una herramienta de código abierto diseñada para simplificar y optimizar el proceso de recopilación de datos necesario para el entrenamiento de LLM.

🌐 Esta herramienta admite el procesamiento paralelo y la extracción de contenido dinámico, mejorando la eficiencia y la flexibilidad de la recopilación de datos.

📊 Crawl4AI proporciona formatos de datos de salida como JSON y Markdown, facilitando el procesamiento y la aplicación posteriores.

Enlace a más información:https://github.com/unclecode/crawl4ai

13. ¡No temas a la IA! El 69% de las habilidades laborales es poco probable que sean reemplazadas por la IA generativa

Un estudio reciente del Indeed Hiring Lab muestra que, aunque la IA generativa está demostrando su potencial en el lugar de trabajo, esto no significa que los puestos de trabajo de oficina vayan a ser reemplazados rápidamente. El 69% de las habilidades laborales se consideran poco probables de ser reemplazadas por la IA generativa, siendo las habilidades del sector contable las más afectadas por la IA. Actualmente, la IA es mejor en tareas sencillas, mientras que los problemas complejos siguen requiriendo la intervención humana. Aunque las perspectivas de la IA son brillantes, a corto plazo todavía se necesita la inteligencia y la creatividad humanas.

【Resumen de AiBase:】

✨ El 69% de las habilidades laborales se consideran poco probables de ser reemplazadas por la IA generativa.

💼 Las habilidades del sector contable son las más afectadas por la IA, con un 78% de probabilidad de ser reemplazadas.

📈 Actualmente, la IA es mejor en tareas sencillas, mientras que los problemas complejos siguen requiriendo la intervención humana.

14. OpenAI registra ingresos de 3700 millones de dólares este año, con posibles pérdidas de 5000 millones de dólares