¡Bienvenido a la sección 【AI日报】! Aquí encontrará su guía diaria para explorar el mundo de la inteligencia artificial. Todos los días le presentaremos los temas más relevantes del campo de la IA, centrándonos en los desarrolladores y ayudándole a comprender las tendencias tecnológicas y las innovadoras aplicaciones de los productos de IA.
Conozca los nuevos productos de IA aquí:
1. Google DeepMind lanza Genie2: generación de mundos virtuales infinitos con un solo clic
El modelo Genie2, recientemente lanzado por Google DeepMind, genera en tiempo real mundos virtuales diversos y lógicamente coherentes a partir de instrucciones en lenguaje natural, mostrando un gran potencial en el entrenamiento y la interacción con la IA. Genie2 no solo puede crear entornos 3D complejos, sino que también permite a los usuarios interactuar con él durante largos periodos de tiempo, enriqueciendo enormemente los escenarios de entrenamiento de la IA.
【Resumen de AiBase:】
🌍 Genie2 puede generar en tiempo real mundos virtuales diversos a partir de instrucciones en lenguaje natural, incluyendo complejos entornos 3D.
🤖 El modelo permite interacciones de hasta un minuto entre el usuario y la IA, enriqueciendo enormemente los escenarios de entrenamiento de la IA.
📸 A partir de una sola imagen, Genie2 puede construir rápidamente un mundo interactivo completo, incluso utilizando fotografías reales para generar escenas virtuales.
Enlace a más información: https://deepmind.google/discover/blog/genie-2-a-large-scale-foundation-world-model/
2. ¡Impresionante! Fish Audio lanza Fish Speech 1.5 con 5 nuevos idiomas y función de conversación fluida en tiempo real
El modelo de síntesis de voz Fish Speech 1.5, recientemente lanzado por Fish Audio, ha experimentado mejoras significativas. No solo admite cinco nuevos idiomas, sino que también cuenta con una función de conversación fluida en tiempo real, lo que facilita la interacción del usuario. El modelo ha sido entrenado con más de 1 millón de horas de datos multilingües y puede generar una salida de síntesis de voz de alta calidad, obteniendo el segundo puesto en el anonimato TTS-Arena.
【Resumen de AiBase:】
🎤 Síntesis de voz con cero y pocos ejemplos: solo se necesitan de 10 a 30 segundos de muestra de voz para generar voz de alta calidad.
🌍 Soporte multilingüe: admite inglés, japonés, coreano, chino y otros idiomas, rompiendo las barreras del idioma.
⚡ Alta precisión y velocidad: síntesis de voz en tiempo real en hardware de alto rendimiento, con una tasa de error de hasta el 2%.
Enlace a más información: https://fish.audio/zh-CN/
3. Se rumorea que Apple y Baidu colaboran: la versión china del iPhone podría integrar el modelo Wenxin 4.0
Apple y Baidu han llegado a un acuerdo para integrar el gran modelo de IA Ernie 4.0 de Baidu en la versión china del iPhone, con el objetivo de mejorar la experiencia de IA del usuario. A pesar de los desafíos en el proceso de adaptación, Apple aún tiene tiempo para realizar las pruebas y ajustes necesarios para asegurar el lanzamiento a tiempo de Apple Intelligence.
【Resumen de AiBase:】
🤖 Apple y Baidu colaboran para integrar el gran modelo de IA Ernie 4.0 en la versión china del iPhone.
📈 Apple paga por el uso, con el objetivo de mejorar la experiencia de IA de los usuarios de iPhone.
📱 La serie iPhone 16 se está quedando atrás en cuanto a funciones de IA y necesita adaptarse más rápidamente al mercado.
4. El asistente de IA Doubao de ByteDance ya admite la generación de imágenes con texto específico con un solo clic
El asistente de IA inteligente Doubao, de ByteDance, ha mejorado significativamente su capacidad de generación de imágenes a partir de texto. Ahora, los usuarios pueden generar imágenes con texto específico con un solo clic. Esta nueva función es el resultado del esfuerzo del equipo de modelos de lenguaje grande de Doubao, integrando modelos de lenguaje grande y tecnología de imágenes digitales, optimizando la capacidad de aprendizaje de datos en chino y mejorando la capacidad de generación de caracteres chinos.
【Resumen de AiBase:】
🆕 La nueva función permite a los usuarios generar imágenes con texto específico con un solo clic, mejorando la comodidad de uso.
🔍 Doubao, mediante la integración de modelos de lenguaje grande y tecnología de imágenes digitales, ha optimizado el aprendizaje del chino y la capacidad de generación de caracteres chinos.
🚀 Esta actualización demuestra la profunda exploración de Doubao en la aplicación de la tecnología de IA, y esperamos un mayor desarrollo en el futuro.
5. Baidu: Ernie Bot ocupa el primer lugar en la tasa de uso de los internautas chinos entre los productos de IA generativa
Hasta junio de 2024, el tamaño de los usuarios de inteligencia artificial generativa en China llegó a los 230 millones, y Ernie Bot ocupó el primer lugar con una tasa de uso del 11,5%. La cantidad de llamadas diarias del gran modelo Ernie alcanza los 1500 millones, procesando más de 1,7 billones de tokens, lo que demuestra su rápido desarrollo en tecnología y aplicaciones. Los productos de conversación representan el 62% de la cuota de mercado, la función de IA de la biblioteca se ha utilizado más de 2800 millones de veces y la plataforma de agentes inteligentes ha atraído a una gran cantidad de empresas y desarrolladores.
【Resumen de AiBase:】
📈 Tamaño de los usuarios: hasta junio de 2024, los usuarios de productos de IA generativa en China alcanzaron los 230 millones, representando el 16,4% de la población total.
💡 Ernie Bot: Ernie Bot de Baidu ocupa el primer lugar en la tasa de uso de los internautas chinos con un 11,5%, con una cantidad de llamadas diarias de 1500 millones.
🛠️ Amplia aplicación: los productos de conversación representan el 62% de la cuota de mercado, la función de IA de la biblioteca se ha utilizado más de 2800 millones de veces y la plataforma de agentes inteligentes ha atraído a 150.000 empresas.
6. ChatGPT supera los 300 millones de usuarios activos semanales
Sam Altman, CEO de OpenAI, anunció en la cumbre DealBook del New York Times que ChatGPT ha superado los 300 millones de usuarios activos semanales, mostrando su gran atractivo en el mercado y la dependencia de los usuarios. Desde su lanzamiento en 2022, el número de usuarios de ChatGPT ha experimentado un crecimiento explosivo, enviando actualmente más de 1000 millones de mensajes al día.
【Resumen de AiBase:】
🌟 ChatGPT ha superado los 300 millones de usuarios activos semanales, mostrando su gran atractivo en el mercado.
📈 Se envían más de 1000 millones de mensajes al día a través de ChatGPT, aumentando la dependencia de los usuarios.
🛠 OpenAI sigue lanzando nuevas funciones para mejorar la experiencia del usuario, incluyendo un motor de búsqueda de IA y una nueva interfaz.
7. OpenAI anuncia un evento de transmisión en vivo de 12 días: se revelarán nuevas tecnologías, pero GPT-5 no se lanzará por ahora
OpenAI anunció recientemente en la plataforma X que lanzará un evento de transmisión en vivo de 12 días para mostrar nuevas tecnologías y proyectos innovadores. A pesar del entusiasmo por GPT-5, OpenAI ha aclarado que su sucesor no se lanzará este año. El CEO Sam Altman negó los rumores sobre el modelo Orion y prometió lanzar más innovaciones tecnológicas.
【Resumen de AiBase:】
🔍 OpenAI lanzará mañana un evento de transmisión en vivo de 12 días para mostrar nuevas tecnologías y proyectos innovadores.
🚫 OpenAI aclara que GPT-5 no se lanzará este año, y el CEO califica los informes sobre el modelo Orion como falsos.
📊 El modelo O1 admite el procesamiento de aproximadamente 200.000 tokens y cuenta con funciones de análisis de imágenes, y el modelo de video Sora también es muy esperado.
8. El CEO de Apple, Tim Cook, afirma que nunca ha considerado cobrar por la IA de Apple: la IA es una función básica
Tim Cook, CEO de Apple, declaró recientemente en una entrevista que Apple nunca ha considerado cobrar por sus funciones de IA. Destacó que la IA debe considerarse una función básica de los dispositivos inteligentes, al igual que la multitáctil, una parte indispensable. Esta declaración ha calmado eficazmente las especulaciones sobre posibles cargos por los servicios de IA de Apple.
【Resumen de AiBase:】
💡 Cook afirma que Apple no cobrará por las funciones de IA, considerando que la IA es una función básica.
📈 El enfoque estratégico de Apple ha pasado del hardware a los servicios, pero los servicios de IA no tendrán coste.
🗣️ Cook expresa su preocupación por la jubilación, destacando su estrecha relación con Apple.
9. Musk planea ampliar diez veces la supercomputadora Colossus AI
xAI, la empresa de inteligencia artificial de Elon Musk, anunció recientemente un ambicioso plan para ampliar diez veces la capacidad de su supercomputadora Colossus AI. Esta ampliación se ubicará en Memphis, Tennessee, e integrará más de 1 millón de GPU para satisfacer las crecientes necesidades de computación.
【Resumen de AiBase:】
🌟 Elon Musk planea ampliar diez veces la supercomputadora Colossus AI, con la previsión de integrar más de 1 millón de GPU.
💼 Esta ampliación creará nuevas oportunidades de empleo en la región de Memphis, impulsando el desarrollo económico local.
🚀 xAI espera mejorar su competitividad en el mercado y promover la innovación en la tecnología de inteligencia artificial mediante el aumento de la capacidad de computación.
10. Zhu Xiaohu responde a la controversia sobre la resolución de accionistas entre Yue Zhi Anmian y Circular Intelligence, que provocó un arbitraje
Zhu Xiaohu respondió al caso de arbitraje entre el fundador de Yue Zhi Anmian y Circular Intelligence, enfatizando que el proyecto fue desarrollado internamente por Circular Intelligence y no obtuvo una resolución formal de los accionistas. El incidente revela la complejidad de los retrasos en las resoluciones de los accionistas y los conflictos de intereses, reflejando la responsabilidad legal y ética de las empresas emergentes chinas en el proceso de escisión.
【Resumen de AiBase:】
📈 Yue Zhi Anmian es un proyecto desarrollado internamente por Circular Intelligence, que aún no ha obtenido una resolución formal de los accionistas.
⚠️ Yang Zhilin y Zhang Yutao iniciaron la financiación sin el consentimiento de los inversores, lo que provocó una fuerte reacción.
💼 Zhang Yutong fue despedido por ocultar un conflicto de intereses, y el incidente revela la complejidad de las responsabilidades de los accionistas en las empresas emergentes.
11. La IA generativa amenaza los ingresos de los creadores: ¡se perderán 35.000 millones de dólares australianos en los próximos cinco años!
Un reciente informe de investigación económica global revela que el rápido desarrollo de la inteligencia artificial generativa representará una seria amenaza para los ingresos de los creadores de música y cine. Según un estudio encargado por la Confederación Internacional de Sociedades de Autores y Compositores (CISAC), se estima que los ingresos de los creadores correrán un riesgo de 35.000 millones de dólares australianos hasta 2028. Los creadores de música se enfrentan a una pérdida de ingresos del 24%, mientras que los creadores de cine a una pérdida del 21%.
【Resumen de AiBase:】
📉 Pérdida de ingresos de los creadores: la inteligencia artificial generativa provocará una pérdida de ingresos del 24% para los creadores de música y del 21% para los creadores de cine.
💰 Expansión del mercado: se espera que el mercado de los servicios de generación de IA crezca de 4800 millones de dólares australianos a 103.000 millones de dólares australianos.
⚖️ Llamamiento a políticas: expertos y organizaciones de creadores instan a los gobiernos a tomar medidas para garantizar los derechos e ingresos de los creadores.
12. Lanzamiento del modelo AWPortraitCN: tecnología de generación de imágenes diseñada para la estética de los bebés chinos
AWPortraitCN es un modelo de generación de imágenes basado en FLUX.1-dev, que se centra en generar imágenes de retratos que se ajusten mejor a las características faciales y la estética de los chinos. Este modelo ha sido entrenado con diversas imágenes de retratos y presenta un rendimiento excelente y una fácil operación. Los usuarios pueden generar fácilmente imágenes de retratos de alta calidad a través de la plataforma Shakker AI, promoviendo la democratización de la tecnología de inteligencia artificial.
【Resumen de AiBase:】
🎨 El modelo AWPortraitCN está diseñado para el mercado chino, optimizando la generación de retratos de personas.
📸 Entrenado con imágenes de retratos de varios tipos, mostrando resultados realistas y detallados.
🌐 Los usuarios pueden probarlo en línea, promoviendo el desarrollo de la ciencia abierta y de código abierto.
Dirección del modelo: https://huggingface.co/Shakker-Labs/AWPortraitCN