Boletín diario de IA: Alibaba lanza FLUX.1-Turbo-Alpha; el modelo multimodal MM1 de Apple se actualiza a MM1.5; se rechaza la solicitud de derechos de autor de la obra de arte de IA premiada "Ópera espacial"

¡Bienvenido al apartado de noticias diarias sobre IA! Aquí encontrará su guía diaria para explorar el mundo de la inteligencia artificial. Cada día le presentaremos los temas más relevantes del ámbito de la IA, centrándonos en los desarrolladores y ayudándole a comprender las tendencias tecnológicas y las innovadoras aplicaciones de productos de IA.

Para conocer los nuevos productos de IA, haga clic aquí:https://top.aibase.com/

1. Alibaba lanza FLUX.1-Turbo-Alpha: basado en FLUX.1-dev, destilación Lora en 8 pasos

El equipo creativo de Alibaba Mama ha lanzado FLUX.1-Turbo-Alpha, entrenado con el modelo FLUX.1-dev. Utiliza un modelo Lora destilado en 8 pasos, con un discriminador de múltiples cabezas que mejora significativamente la calidad de la destilación. Es compatible con diversas aplicaciones relacionadas con FLUX. Se recomienda una escala de guía de 3.5 y una escala Lora de 1. Próximamente se lanzará una versión con menos pasos. El modelo se puede integrar con el framework Diffusers, y se puede cargar para generar imágenes de alta calidad con unas pocas líneas de código. El proceso de entrenamiento se realizó con más de 1 millón de imágenes, utilizando un método de entrenamiento adversarial, con una puntuación estética superior a 6.3 y una resolución superior a 800. El lanzamiento de FLUX.1-Turbo-Alpha impulsa la popularización y aplicación de la tecnología de inteligencia artificial.

【Resumen de AiBase:】
🌟 Basado en FLUX.1-dev, utiliza destilación en 8 pasos y un discriminador de múltiples cabezas para mejorar la calidad de la generación de imágenes.
🖼️ Admite la generación de imágenes a partir de texto y el control de la red de reparación, permitiendo a los usuarios crear fácilmente diversas escenas interesantes.
📊 El proceso de entrenamiento utiliza entrenamiento adversarial con más de 1 millón de imágenes para garantizar una salida de alta calidad del modelo.
Enlace de detalles:https://huggingface.co/alimama-creative/FLUX.1-Turbo-Alpha

2. ¡Adiós a la tediosa alineación! ¡F5-TTS facilita la conversión de texto a voz!

Recientemente, un equipo de investigación de la Universidad Jiao Tong de Shanghai, la Universidad de Cambridge y el Instituto de Investigación de Automóviles Geely presentó un nuevo sistema de texto a voz (TTS), llamado F5-TTS. Lo especial de este sistema es que utiliza un método no autorregresivo, combinando la coincidencia de flujo con el transformador de difusión (DiT), simplificando con éxito los pasos complejos de los modelos TTS tradicionales.

【Resumen de AiBase:】
🌟 F5-TTS es un nuevo sistema de texto a voz no autorregresivo que simplifica la complejidad de los modelos TTS tradicionales.
⚡ Este sistema combina ConvNeXt y DiT para mejorar la alineación entre texto y voz, mejorando la calidad de la síntesis.
🔒 El equipo de investigación se centra en cuestiones éticas y recomienda la introducción de mecanismos de marca de agua y detección para prevenir el uso indebido.
Acceso al proyecto: https://github.com/SWivid/F5-TTS
Dirección de prueba: https://huggingface.co/spaces/mrfakename/E2-F5-TTS

3. ¡Se revelan nuevas funciones de IA para documentos de OPPO! ¡Admite la conversión de formatos de Apple iWork, traducción de documentos y escaneo de documentos!

OPPO anunció hoy una nueva aplicación de documentos con varias funciones, incluyendo "apertura de archivos a voluntad", "escritura asistida por IA", "conversión de formatos a voluntad" y "búsqueda de documentos a voluntad".

【Resumen de AiBase:】
📝 OPPO lanzará una nueva aplicación de documentos con varias funciones de IA.
🔄 La aplicación puede convertir formatos de Apple iWork, mejorando la compatibilidad.
📄 Ofrece funciones de escaneo y traducción de documentos, optimizando la experiencia de procesamiento de documentos.

4. ¡Lanzamiento de la versión 0.6 de Ant CodeFuse IDE! Admite el diagnóstico de problemas del editor y la reparación con IA

Se ha lanzado la versión 0.6 de Ant CodeFuse IDE, que incluye nuevas funciones de reparación de problemas con IA en el editor y funciones de autocompletado implícito, mejorando la comodidad y la eficiencia de la escritura de código. El IDE admite los lenguajes de programación más utilizados y ofrece sugerencias para la escritura de código y la corrección de problemas.

【Resumen de AiBase:】
🚀 El IDE incluye una nueva función de reparación de problemas de IA del editor, permitiendo a los desarrolladores resolver mensajes de error mediante el botón de reparación inteligente que se activa al pasar el ratón.
⚙️ Experiencia de autocompletado de código optimizada, admite la aparición simultánea de autocompletado desplegable y autocompletado implícito, los usuarios pueden aceptar rápidamente el autocompletado implícito con la tecla Tab.
💻 CodeFuse IDE está desarrollado sobre la base del modelo de lenguaje grande de Ant y el framework OpenSumi, proporcionando funciones como terminales inteligentes y generación de pruebas unitarias.
Enlace de detalles:https://github.com/codefuse-ai/codefuse-ide

5. ¡El "crisol multi-modal" de Apple se actualiza! MM1.5 mejora la comprensión de texto denso y múltiples imágenes

Apple lanzó recientemente una importante actualización de su modelo de inteligencia artificial multimodal MM1, actualizándolo a la versión MM1.5. Esta actualización no es solo un simple cambio de número de versión, sino una mejora integral de las capacidades, lo que permite que el modelo muestre un rendimiento más potente en diversos campos. La mejora principal de MM1.5 radica en su innovador método de procesamiento de datos, incluyendo el uso de datos OCR de alta definición y descripciones de imágenes sintéticas, así como una mezcla optimizada de datos de ajuste fino de instrucciones visuales.

【Resumen de AiBase:】
🚀 MM1.5 utiliza un método de entrenamiento centrado en los datos, optimizando el conjunto de datos de entrenamiento y mostrando una mejora significativa en el reconocimiento de texto, la comprensión de imágenes y la ejecución de instrucciones visuales.
💡 MM1.5 incluye varias versiones de 1.000 millones a 30.000 millones de parámetros, incluyendo variantes densas y mixtas de expertos (MoE), incluso los modelos de menor escala pueden alcanzar un nivel de rendimiento impresionante.
🔍 La mejora de las capacidades de MM1.5 se refleja principalmente en la comprensión de imágenes con texto denso, la referencia y localización visual, la inferencia de múltiples imágenes, la comprensión de vídeo y la comprensión de la interfaz de usuario móvil, ampliando los escenarios de aplicación.
Enlace de detalles:https://arxiv.org/pdf/2409.20566

6. ¡Los datos sintéticos son tóxicos! El equipo de Meta confirma: el 1% de los datos puede provocar el colapso total de los grandes modelos

Recientemente, ha ocurrido algo extraño en el mundo de la IA. Es como si un influencer gastronómico empezara a comer su propia comida, volviéndose adicto y la comida cada vez peor. Esto es bastante alarmante, y se conoce profesionalmente como colapso del modelo (model collapse). El colapso del modelo es un fenómeno en el que, durante el entrenamiento de un modelo de IA, el uso excesivo de datos generados por el propio modelo conduce a un círculo vicioso, lo que resulta en una disminución progresiva de la calidad de la generación y, finalmente, en el fracaso del modelo.

【Resumen de AiBase:】
🔍 Fenómeno de colapso del modelo: los modelos de IA que dependen excesivamente de datos sintéticos durante el entrenamiento experimentan una disminución en la calidad de la generación y, finalmente, un colapso.
💡 Soluciones: priorizar el uso de datos reales, utilizar datos sintéticos con precaución, controlar el tamaño del modelo y evitar el colapso del modelo.
📈 Los experimentos han demostrado que incluso el 1% de datos sintéticos puede provocar el colapso del modelo, y cuanto mayor es el tamaño del modelo, más grave es el fenómeno.
Enlace de detalles:https://arxiv.org/pdf/2410.04840

7. Se rechaza la solicitud de derechos de autor de la obra de arte de IA premiada "Ópera Espacial"

Recientemente, la solicitud de registro de derechos de autor del artista de medios sintéticos Jason Allen para su obra "Ópera Espacial" fue rechazada por la oficina de derechos de autor, generando controversia. Allen apeló la decisión, argumentando que la obra contiene una gran cantidad de elementos de creación humana y debería estar protegida por derechos de autor. La cuestión de si las obras generadas por IA deberían estar protegidas por derechos de autor se ha convertido en un punto central, suscitando un debate sobre las leyes de derechos de autor de las obras de arte generadas por IA.

【Resumen de AiBase:】
🌟 Allen argumenta que la obra contiene una gran cantidad de elementos de creación humana y debería estar protegida por derechos de autor.
🤖 La oficina de derechos de autor considera que las obras generadas por IA carecen de suficiente creación humana y rechaza el registro.
📜 La apelación de Allen podría impulsar un mayor debate sobre las leyes de derechos de autor de las obras de arte generadas por IA.

8. El beneficio del tercer trimestre de TSMC aumenta un 40%, impulsado por el auge de la IA

TSMC anunció recientemente que espera que su beneficio neto del tercer trimestre aumente significativamente en un 40%, gracias al aumento de la demanda de chips de IA. Entre sus clientes se encuentran empresas conocidas como Apple y Nvidia, impulsando el desarrollo de la tecnología de IA. El mercado es optimista sobre el futuro desempeño de TSMC, y tanto los ingresos como los planes de gasto de capital han aumentado.

【Resumen de AiBase:】
💰 Se espera que el beneficio neto del tercer trimestre de TSMC alcance los 298.200 millones de dólares taiwaneses, un 40% más que el año anterior.
📈 Los clientes de TSMC están lanzando nuevos productos, lo que impulsa un crecimiento superior a las expectativas.
🌍 TSMC está aumentando sus inversiones en la construcción de nuevas fábricas, y se espera que el gasto de capital futuro oscile entre 30.000 y 32.000 millones de dólares.

9. CEO de Anthropic: la IA ayudará a la humanidad a combatir enfermedades; la esperanza de vida humana podría extenderse a 150 años en 5 a 10 años

En un artículo del CEO de Anthropic, Dario Amodei, predice audazmente el futuro desarrollo de la inteligencia artificial (IA). A pesar de las preocupaciones públicas sobre los riesgos de la IA, cree que el potencial positivo de la IA es enorme y puede aportar avances sin precedentes a la sociedad humana. Amodei destaca la urgencia de abordar los riesgos de la IA y advierte contra la exageración de las posibles consecuencias de la tecnología. Amodei prevé transformaciones en biología, salud, neurociencia, salud mental, economía, pobreza y países inteligentes.

【Resumen de AiBase:】
🔬 Biología y salud: la IA puede acelerar el progreso médico, controlar las enfermedades infecciosas, reducir la mortalidad por cáncer, tratar enfermedades genéticas y se espera que la esperanza de vida humana se duplique hasta los 150 años.
🧬 Libertad biológica: la IA otorga a los humanos más control sobre sus características biológicas, incluyendo la reproducción y la elección de la apariencia.
🧠 Neurociencia y salud mental: las aplicaciones de IA mejoran la comprensión y el tratamiento de las enfermedades mentales, mejorando la salud mental.

10. Apple podría lanzar el próximo año unas gafas Vision por 2000 dólares

Apple planea lanzar unas nuevas gafas Vision por aproximadamente 2000 dólares, utilizando materiales más baratos y un procesador de menor rendimiento. Este dispositivo no incluirá la función EyeSight y forma parte del plan de realidad mixta de Apple. Apple también lanzará la segunda generación de Vision Pro, gafas inteligentes y AirPods con cámara, así como una pantalla similar al iPad a un precio asequible y un dispositivo de escritorio con brazo robótico. A pesar de que el plan de realidad mixta no ha tenido un gran éxito, Apple sigue adelante con el desarrollo de estos productos.

【Resumen de AiBase:】
🔍 Apple planea lanzar unas nuevas gafas Vision por aproximadamente 2000 dólares, utilizando materiales más baratos y un procesador de menor rendimiento.
🚀 Apple lanzará en el futuro la segunda generación de Vision Pro, gafas inteligentes y AirPods con cámara, impulsando el desarrollo del campo de la realidad mixta.
💡 Apple también planea lanzar una pantalla similar al iPad a un precio asequible y un dispositivo de escritorio con brazo robótico como parte de su estrategia de hogar inteligente.

11. La cuota de mercado de Google en el mercado de publicidad de búsqueda en Estados Unidos podría caer por debajo del 50%

La cuota de mercado de Google en el mercado de publicidad de búsqueda en Estados Unidos podría caer por debajo del 50% en 2025, enfrentándose a nuevos competidores. Nuevos competidores como TikTok, Amazon y la startup de inteligencia artificial Perplexity están ganando cuota de mercado. Amazon está creciendo rápidamente en el gasto en publicidad de búsqueda, presionando a Google. El desarrollo de la inteligencia artificial está cambiando el panorama de la publicidad de búsqueda, y Google planea insertar anuncios en los resúmenes de búsqueda de IA. El mercado de la publicidad de búsqueda está experimentando una profunda transformación.

【Resumen de AiBase:】
📉 Se prevé que la cuota de mercado de la publicidad de búsqueda de Google caiga por debajo del 50% en 2025, enfrentándose a nuevos competidores.
📱 TikTok y Amazon están creciendo rápidamente, ganando cuota de mercado a Google.
🤖 Google planea incluir anuncios en los resúmenes de búsqueda de IA, ofreciendo a las marcas nuevos canales de publicidad.

12. Lenovo lanza ThinkSmart Core Gen2, diseñado para videoconferencias con IA para una colaboración eficiente

Lenovo presenta ThinkSmart Core Gen2, un gran avance en el campo de la colaboración inteligente. Equipado con el procesador Intel Core Ultra, su potente capacidad de procesamiento de IA mejora la eficiencia de las reuniones, redefiniendo los espacios de reunión y la forma de trabajar, ofreciendo una experiencia de colaboración inteligente.

【Resumen de AiBase:】

Noticias de IA

IA Diario

Cronología de la IA

Al hardware

Últimos Casos

Colección de Imágenes

Colección de Videos

Colección de Audio

Colección de Contenido

Últimos Tutoriales

Ranking de Productos de IA

Ranking de Crecimiento de Tráfico de IA

Ranking de Descenso de Tráfico de IA

Ranking Semanal de IA

Estados Unidos

China

India

Brasil

Generación de Imágenes

Asistente Personal

Generación de Personajes

Generación de Videos

Ranking de Proyectos de IA

Ranking de Crecimiento de Proyectos de IA

Ranking de Desarrolladores de IA

Ranking de Organizaciones de IA

Deepseek

TTS

LLM

ChatGPT

Visión General

Boletín diario de IA: Alibaba lanza FLUX.1-Turbo-Alpha; el modelo multimodal MM1 de Apple se actualiza a MM1.5; se rechaza la solicitud de derechos de autor de la obra de arte de IA premiada "Ópera espacial"

站长之家

Este artículo proviene de AIbase Daily

Noticias de IA relacionadas recomendadas

xAI Holdings de Musk planea recaudar $200 mil millones, con un objetivo de valoración superior a los $1.2 billones

Manus completa una ronda de financiación de 75 millones de dólares, elevando su valoración a casi 500 millones

Meta lanza el modelo WebSSL: una nueva exploración del aprendizaje visual sin lenguaje

OpenAI impulsa la revolución de la IA en la educación: explorando nuevos modelos de enseñanza inteligente

XPeng Motors explora la tecnología de mapeo crowdsourced, pero la empresa reitera su compromiso con la ruta de modelos grandes sin mapas

¿Cómo pueden los editores obtener beneficios con la IA? Exploración de diferentes modelos de ingresos y sus ventajas e inconvenientes

MagicColor: IA colorea automáticamente los bocetos de forma automática, incluso imágenes con múltiples personajes con una coloración precisa por zonas

Arm abandona la adquisición de Alphawave y explora nuevas estrategias para capturar la cuota de mercado de chips de IA

OpenAI obtiene 400 mil millones de dólares en financiación, su valoración se dispara a 3 billones de dólares

OpenAI anuncia una financiación exitosa de 400.000 millones de dólares, con una valoración de 3 billones de dólares