¡Bienvenido a la sección 【AI日报】! Aquí encontrará su guía diaria para explorar el mundo de la inteligencia artificial. Cada día le presentaremos los temas más relevantes del campo de la IA, enfocados en desarrolladores, para ayudarle a comprender las tendencias tecnológicas y las innovadoras aplicaciones de los productos de IA.

Nuevos productos de IA https://top.aibase.com/

1. ¡Moshi, el modelo de lenguaje grande de código abierto que rivaliza con GPT-4o, hace su impactante debut!

Moshi es un modelo multimodal de gran tamaño que posee capacidades auditivas y de habla, y en el futuro podría mostrar capacidades visuales. El lanzamiento de Moshi por parte del laboratorio Kyutai es un atrevido intento en tecnología de IA, que demuestra el espíritu de código abierto. En cuanto a la experiencia del usuario, la velocidad de respuesta es rápida, aunque el soporte de idiomas necesita mejoras, y su uso es sencillo. El tono humanizado de Moshi hace que las conversaciones sean más naturales y fluidas; las futuras optimizaciones iterativas mejorarán la precisión de las respuestas. Tendrá un profundo impacto en el sector educativo, ofreciendo a los estudiantes explicaciones cíclicas. Esperamos que aparezcan más productos similares, que admitan más idiomas locales y que la tecnología de IA se acerque a la vida de las personas.

【Resumen de AiBase:】

💡 Capacidad multimodal: Moshi puede escuchar preguntas de voz y responder con inferencia en tiempo real; además, su modo de voz ya está disponible, mucho antes del lanzamiento previsto de GPT-4o.

💡 Sin restricciones geográficas: Puede usar Moshi desde cualquier lugar.

💡 Compatible con dispositivos móviles: Aunque el soporte para mandarín no es muy bueno, las preguntas en inglés funcionan perfectamente.

💡 Próximamente de código abierto: Kyutai planea lanzar Moshi como código abierto próximamente, momento en el que se publicarán el código, los pesos del modelo y el artículo científico.

Enlace de detalles: https://top.aibase.com/tool/moshi-chatMoshi

2. Se revelan nuevas funciones de Google Pixel 9: ¡con la ayuda de la IA, llega una experiencia inteligente similar a Microsoft Recall!

La serie Google Pixel 9 está a punto de lanzar una serie de impresionantes nuevas funciones de IA, incluyendo Add Me, Studio y Pixel Screenshots. Estas funciones mejorarán la experiencia fotográfica del usuario, estimularán la expresión creativa y priorizarán la protección de la privacidad, demostrando la profunda comprensión y aplicación innovadora de Google de la tecnología de IA. Esperamos que la serie Pixel 9 aporte más posibilidades a la vida digital.

【Resumen de AiBase:】

✨ Función Add Me: Captura la mejor expresión de cada persona, fusionando las expresiones faciales de diferentes fotos para asegurar que todos aparezcan en su mejor momento.

🎨 Función Studio: Integrada en la aplicación de edición de capturas de pantalla, permite a los usuarios crear y remezclar pegatinas, liberando la creatividad ilimitada.

🔒 Función Pixel Screenshots: Ofrece una solución de protección de la privacidad, funcionando solo cuando el usuario realiza una captura de pantalla manualmente; el procesamiento de IA local garantiza la seguridad de la privacidad del usuario.

3. Perplexity AI lanza Pro Search: mejora la resolución de problemas y la capacidad de ejecución de código

Perplexity anunció recientemente una importante actualización de su servicio Pro Search. La nueva versión de Pro Search no solo puede manejar consultas más complejas, sino que también cuenta con capacidad de razonamiento en múltiples pasos, ofreciendo a los usuarios un soporte de investigación más profundo y completo. Esta actualización muestra el enorme potencial de la IA en la recuperación de información y la resolución de problemas, estableciendo un nuevo estándar para las futuras herramientas de investigación inteligente.

image.png

【Resumen de AiBase:】

🔍 Mejora de la capacidad de procesamiento de consultas complejas: El nuevo Pro Search puede ejecutar cálculos matemáticos y de programación avanzados, proporcionando resultados de investigación más completos.

🧠 Función de razonamiento en múltiples pasos: Pro Search ahora puede realizar razonamientos en múltiples pasos, logrando objetivos gradualmente y tomando acciones inteligentes según los descubrimientos.

🔢 Capacidad matemática y de programación mejorada: Gracias a la integración del motor Wolfram|Alpha, la precisión y la velocidad de Pro Search para resolver problemas matemáticos complejos han mejorado significativamente.

4. Cloudflare presenta un nuevo método para bloquear con un solo clic los rastreadores web de robots de IA

Cloudflare lanzó recientemente un nuevo método para bloquear a los robots de IA que rastrean el contenido de los sitios web y utilizan los datos sin autorización para entrenar modelos de aprendizaje automático. Esta medida tiene como objetivo proteger la seguridad de los creadores de contenido en Internet.

【Resumen de AiBase:】

⭐️ Cloudflare presenta una función para bloquear con un solo clic los rastreadores web de IA, asegurando que el contenido del sitio web no sea utilizado por robots de IA sin autorización.

⭐️ La IA generativa se considera una fuente de robo, y las grandes empresas están tomando medidas para evitar que los robots de IA utilicen el contenido sin autorización.

⭐️ Cloudflare utiliza modelos de aprendizaje automático para identificar y bloquear rastreadores web disfrazados, protegiendo los derechos de los creadores de contenido en Internet.

5. ElevenLabs lanza VOICE ISOLATOR, un eliminador de ruido

VOICE ISOLATOR, el nuevo producto de ElevenLabs, entusiasma a los aficionados al audio. Elimina el ruido de fondo, extrae diálogos claros y profesionaliza la producción de audio. Esta herramienta es fácil de usar y ofrece funciones como la extracción de voces y la generación de efectos de sonido, mejorando enormemente la eficiencia y la creatividad en la producción de audio. ElevenLabs continúa innovando para ofrecer nuevas posibilidades en la producción de audio.

【Resumen de AiBase:】

🎵 Elimina el ruido de fondo, extrae diálogos claros y profesionaliza la producción de audio.

🔊 Ofrece la función de extracción de voces, mejora la voz y elimina el ruido de fondo innecesario.

🎶 La función de generación de efectos de sonido permite a los usuarios crear sin perder tiempo buscando efectos, ofreciendo más espacio creativo.

Enlace de detalles: https://elevenlabs.io/voice-isolator

6. SenseTime lanza Vimi, un modelo de algoritmo de generación de video de personajes controlables

SenseTime lanzó el modelo de lenguaje grande Vimi, un hito en la generación de videos de personajes controlables, que demuestra la alta adaptabilidad de la tecnología de IA a escenarios complejos y la profunda acumulación de SenseTime en la tecnología de generación de video. Vimi tiene una capacidad de control excepcional, superando las tecnologías tradicionales, controlando con precisión las expresiones faciales y los movimientos corporales, mientras que el procesamiento de detalles es fino, admite una experiencia visual inmersiva y genera videos de alta calidad de forma estable.

微信截图_20240704103219.png

【Resumen de AiBase:】

✨ Vimi ha logrado una flexibilidad sin precedentes en la generación de videos, pudiendo recibir entradas diversas y controlar con precisión la generación de videos que coinciden con los movimientos objetivo del personaje.

🌟 Vimi supera las limitaciones de las tecnologías tradicionales de control de expresiones faciales en imágenes, logrando un control preciso de las expresiones faciales y los movimientos corporales, generando contenido de video lógico y natural.

💡 Vimi genera de forma estable videos de alta calidad de hasta 1 minuto de duración, manteniendo una calidad de imagen uniforme, mostrando su extraordinaria capacidad y coherencia.

Enlace de detalles: https://www.wjx.cn/vm/mhSxfGv.aspx

7. ¿La IA también baila con locura? MimicMotion lanza una nueva tecnología que puede generar videos de cualquier longitud según cualquier movimiento.

La nueva tecnología de MimicMotion, "Generación de video de movimiento humano de alta calidad con guía de postura consciente de la confianza", ha causado sensación en la industria. Esta tecnología utiliza la guía de postura consciente de la confianza para generar videos de movimiento humano de alta calidad, mejorando la calidad del video, el mecanismo de refinamiento de la mano mejora los detalles, genera videos de cualquier longitud de forma flexible, tiene amplias perspectivas de aplicación y desempeñará un papel clave en la producción de videos y la captura de movimiento.

【Resumen de AiBase:】

🌟 Utiliza la guía de postura consciente de la confianza para generar videos de movimiento humano de alta calidad.

🔍 El mecanismo de refinamiento manual se centra en el pulido de detalles, especialmente en el entrenamiento de manos.

🎥 Genera videos de cualquier longitud de forma flexible, con amplias perspectivas de aplicación.

Enlace de detalles: https://top.aibase.com/tool/mimicmotion

8. El cliente de ChatGPT para Mac presenta un problema de seguridad en el almacenamiento de conversaciones en texto plano

El cliente de ChatGPT para Mac lanzado recientemente por OpenAI presenta una vulnerabilidad de seguridad: las conversaciones se almacenan en texto plano en el ordenador y pueden ser accedidas por agentes malintencionados. La empresa ya ha lanzado una actualización para cifrar los registros de conversación y mejorar la seguridad.

image.png

【Resumen de AiBase:】

🔒 Las conversaciones se almacenan en texto plano en el ordenador, lo que supone un riesgo para la seguridad.

🚫 Los agentes malintencionados o las aplicaciones pueden leer fácilmente las conversaciones de ChatGPT y los datos que contienen.

🔑 OpenAI ha lanzado una actualización para cifrar los registros de chat y mejorar la seguridad.

9. Nueva iniciativa de Google: revelará información sobre el uso de la IA en la generación de anuncios políticos

Google está adoptando nuevas medidas para simplificar el proceso de divulgación de los anunciantes sobre si los anuncios políticos contienen contenido generado por inteligencia artificial. Una vez que los anunciantes seleccionen la casilla de verificación "Contenido modificado o sintético", Google generará automáticamente la información de divulgación, mejorando la transparencia y la credibilidad de los anuncios.

【Resumen de AiBase:】

✨ Google simplifica el proceso de divulgación de los anunciantes sobre si los anuncios políticos contienen contenido generado por IA, mejorando la transparencia de los anuncios.

🔍 Una vez que los anunciantes seleccionen la casilla de verificación "Contenido modificado o sintético", el sistema generará automáticamente la información de divulgación, reduciendo la carga de los anunciantes.

💡 La información de divulgación se mostrará en el flujo de información de dispositivos móviles, YouTube Shorts y anuncios de transmisión; otros formatos de anuncios requerirán que los anunciantes proporcionen la información de divulgación.

10. ¿Obstinación o perseverancia? Nintendo se opone al uso de la IA generativa en los juegos

El presidente de Nintendo, Shuntaro Furukawa, ha expresado su postura sobre el uso de la inteligencia artificial generativa en los juegos, mostrando su preocupación por la violación de los derechos de propiedad intelectual y destacando la importancia de mantener la singularidad. Cree que Nintendo tiene suficiente creatividad y experiencia y no necesita depender de las herramientas de inteligencia artificial generativa. El contenido creado por la IA generativa carece de personalidad, lo que no concuerda con la originalidad y la creatividad que Nintendo prioriza. En el futuro, Nintendo tratará con cautela el uso de la inteligencia artificial generativa, confiando en la creatividad y la experiencia de su equipo interno.

【Resumen de AiBase:】

⭐ Nintendo se opone al uso de la inteligencia artificial generativa en los juegos, preocupada por la violación de los derechos de propiedad intelectual.

⭐ Furukawa destaca que Nintendo tiene suficiente creatividad y experiencia para crear experiencias de juego únicas.

⭐ El contenido creado por la inteligencia artificial generativa carece de personalidad, y Nintendo prioriza la originalidad y la creatividad.