¡Bienvenido a la sección de noticias diarias de IA! Aquí encontrará su guía diaria para explorar el mundo de la inteligencia artificial. Todos los días le presentamos los temas más relevantes del campo de la IA, enfocados en desarrolladores, para ayudarle a comprender las tendencias tecnológicas y las innovadoras aplicaciones de productos de IA.

Conozca los nuevos productos de IA https://top.aibase.com/

1. ¡Inferencia a nivel de posgrado! Anthropic lanza el modelo Claude 3.5 Sonnet, capaz de ejecutar código en la ventana de chat

Anthropic anunció hoy el lanzamiento de Claude 3.5 Sonnet, el primer producto de la serie Claude 3.5. Este modelo supera a sus competidores y a su predecesor, Claude 3 Opus, en varias evaluaciones, manteniendo una velocidad y un coste comparables a los modelos de gama media, estableciendo un nuevo estándar en la industria. Claude 3.5 Sonnet establece nuevos puntos de referencia en la industria en áreas como la inferencia a nivel de posgrado, el conocimiento a nivel universitario y la capacidad de codificación, mostrando una mejora significativa en el rendimiento.

【Resumen de AiBase:】

⭐Mejora del rendimiento: Destaca en varias evaluaciones de inferencia, dominio del conocimiento y capacidad de codificación.

⭐Velocidad y coste de funcionamiento: La velocidad de funcionamiento es el doble que la de su predecesor, Claude 3 Opus, con un coste cinco veces menor, ofreciendo una excelente relación calidad-precio.

⭐Mayor capacidad de comprensión: Destaca en tareas que requieren razonamiento visual, como la interpretación de gráficos y diagramas, y puede transcribir con precisión texto de imágenes imperfectas.

⭐La nueva función Artifacts permite a los usuarios solicitar a Claude que genere fragmentos de código, documentos de texto o diseños de sitios web.

Más información aquí: https://mp.weixin.qq.com/s/GIh5YZwIyw2qIj2Mtjej4g

2. Se dicta sentencia en el primer caso de infracción de software de cambio de rostro con IA en Beijing

En el primer caso de infracción de software de cambio de rostro con IA juzgado en el Tribunal de Internet de Beijing, el tribunal dictaminó que el acusado había infringido los derechos de información personal del demandante, pero no había constituido una infracción de los derechos de imagen del demandante. El caso involucra tecnología de síntesis profunda y la ley de protección de información personal, lo que ha suscitado un debate sobre la legalidad de la tecnología de cambio de rostro y la protección de la privacidad.

image.png

【Resumen de AiBase:】

🔍 El tribunal dictaminó que el acusado infringió los derechos de información personal del demandante, pero no los derechos de imagen.

💡 Los vídeos de plantillas de cambio de rostro no tienen un carácter identificativo en el sentido del retrato, por lo que no constituyen una infracción de los derechos de imagen del demandante.

💻 La conducta del acusado implica el tratamiento de datos personales, infringiendo los derechos de información personal del demandante.

Más información: https://www.chinaz.com/ainews/9700.shtml

3. Tencent Yuanbao lanza una nueva versión con integración en la búsqueda de WeChat

Tencent Yuanbao ha lanzado recientemente una nueva versión que mejora principalmente el procesamiento de textos extra largos y las funciones de búsqueda y análisis de IA, añadiendo la integración con la búsqueda de WeChat para ofrecer a los usuarios una experiencia más eficiente y cómoda. Esta actualización no solo mejora la eficiencia en el procesamiento de documentos extra largos, sino que también amplía la compatibilidad con formatos de archivo, la generación de gráficos y las funciones de análisis de imágenes. La nueva versión también mejora las funciones de búsqueda, integrando motores de búsqueda como la búsqueda de WeChat para ofrecer un servicio más completo.

image.png

【Resumen de AiBase:】

🚀 Mejora la capacidad de procesamiento de textos extra largos, admitiendo textos de hasta 10 millones de caracteres en un solo documento.

📊 Análisis de múltiples archivos: Analiza hasta 50 archivos a la vez, admitiendo varios formatos de archivo.

🔍 Mejora las funciones de búsqueda, integrando motores de búsqueda como la búsqueda de WeChat para ofrecer resultados de búsqueda inteligentes.

Enlace de detalles: https://top.aibase.com/tool/tengxunyuanbao

4. CNKI anuncia el lanzamiento del asistente de investigación académica CNKI AI 4.0

China National Knowledge Infrastructure (CNKI) ha lanzado recientemente la versión 4.0 del asistente de investigación académica con IA, que combina la tecnología de grandes modelos de IA y datos de alta calidad para mejorar la eficiencia de la recuperación, lectura y creación académica de literatura. Las nuevas funciones incluyen generación controlable, expansión de literatura, búsqueda de académicos, traducción completa y servicios de expansión académica para satisfacer las necesidades personalizadas de los usuarios. Las mejoras más destacadas son la búsqueda mejorada con preguntas y respuestas y el servicio de búsqueda de académicos. Dirección de acceso: https://top.aibase.com/tool/zhiwangcnki-ai-xueshuyanjiuzhushou

image.png

【Resumen de AiBase:】

🔍 La versión 4.0 del asistente de investigación académica con IA combina la tecnología de grandes modelos de IA y datos de alta calidad para mejorar la eficiencia de la recuperación, lectura y creación académica de literatura.

🔄 Las nuevas funciones incluyen generación controlable, expansión de literatura, búsqueda de académicos, traducción completa y servicios de expansión académica para satisfacer las necesidades personalizadas de los usuarios.

🔗 Las mejoras más destacadas son la búsqueda mejorada con preguntas y respuestas y el servicio de búsqueda de académicos, que ofrecen respuestas más precisas e información detallada sobre los académicos.

Enlace de detalles: https://top.aibase.com/tool/zhiwangcnki-ai-xueshuyanjiuzhushou

5. Groq lanza el modelo whisper-large-v3, que admite transcripción y traducción de voz, y es de acceso gratuito

El modelo Whisper Large-V3, recientemente lanzado por Groq, ofrece a los usuarios potentes funciones de transcripción y traducción de voz, que se pueden utilizar en Playground o en proyectos locales mediante API. Los usuarios pueden disfrutar de una transcripción de alta velocidad y traducción de varios idiomas al inglés. La API de Whisper es compatible con el estándar de OpenAI, ofreciendo funciones de voz a texto y traducción, lo que facilita su integración en aplicaciones. Ofrece un rendimiento superior utilizando el avanzado modelo "whisper-large-v3".

image.png

【Resumen de AiBase:】

🔊 Transcripción de alta velocidad: Un vídeo de 4 minutos y 30 segundos tarda solo unos 3 segundos en transcribirse.

🌐 Admite varios idiomas: Admite la transcripción de varios idiomas y la traducción al inglés.

🛠️ Interfaz API: Ofrece funciones de voz a texto y traducción que se pueden integrar en aplicaciones.

Enlace de detalles: https://console.groq.com/playground

6. El proyecto de código abierto de Fudan, Hallo, ya es compatible con el plugin ComfyUI

El proyecto Hallo es un proyecto de código abierto que genera vídeos de personas hablando a partir de audio e imágenes. Aunque tiene un umbral de instalación relativamente alto, ofrece más posibilidades y diversión para la conversión de imágenes y otros flujos de trabajo. Emplea un paradigma de difusión de extremo a extremo, introduciendo un módulo de síntesis visual impulsado por audio por capas para lograr una precisión de alineación entre la entrada de audio y la salida visual, generando vídeos de personas hablando de forma natural. A pesar de su complejidad de instalación, inyecta nueva vitalidad en el ecosistema de código abierto, y se espera que en el futuro aparezcan más proyectos similares que aporten comodidad y diversión.

【Resumen de AiBase:】

🔊 El proyecto Hallo es compatible con el plugin ComfyUI, generando vídeos de personas hablando de forma natural a partir de audio e imágenes.

🎤 Emplea un paradigma de difusión de extremo a extremo, introduciendo un módulo de síntesis visual impulsado por audio por capas para mejorar la precisión de la alineación.

😊 El módulo de audio por capas permite controlar la diversidad de expresiones y posturas, permitiendo una personalización individualizada y generando resultados naturales.

Enlace de detalles: https://github.com/AIFSH/ComfyUI-Hallo

7. Se acusa a la herramienta de IA Perplexity de seguir extrayendo contenido de sitios web incluso cuando está prohibido

Perplexity es una empresa emergente de IA que busca remodelar la experiencia de lectura online mediante una innovadora forma de interacción con la información online. Sin embargo, ha generado controversia al eludir el protocolo de exclusión de robots para obtener contenido web restringido. Aunque el CEO defendió las acciones de la empresa, se enfrenta a críticas por cuestiones de derechos de autor. Las acciones de Perplexity plantean dilemas éticos y legales en el ámbito de los medios digitales.

【Resumen de AiBase:】

🤖 Perplexity elude el protocolo de exclusión de robots para obtener contenido web restringido, generando controversia.

💼 El CEO defiende las acciones de la empresa, pero se enfrenta a críticas por cuestiones de derechos de autor.

⚖️ Las acciones de Perplexity plantean dilemas éticos y legales en el ámbito de los medios digitales.

8. Secuelas del robo de identidad de una influencer ucraniana mediante IA: tras la denuncia, la empresa que utilizó su imagen ha eliminado las imágenes correspondientes

Olga Loiek, una youtuber ucraniana de 21 años, descubrió recientemente que alguien había utilizado la IA para clonar su imagen y que estas imágenes clonadas se estaban utilizando de forma indebida en internet. El clonador no solo creó numerosos vídeos con tecnología de IA, sino que también afirmó falsamente que los personajes de los vídeos eran rusos. Este incidente ha suscitado un debate sobre las cuestiones legales y éticas del uso de la tecnología de IA, especialmente en lo que respecta a la protección de la privacidad y los derechos de imagen.

【Resumen de AiBase:】

🔍 Abuso del fenómeno de clonación: Más de 4900 vídeos clonados, difusión de información falsa y posibles actos fraudulentos.

🛡 Infracción de los derechos de imagen: La variedad de imágenes clonadas puede inducir a error al público y suscitar debates legales.

⚖ Desafíos de la tecnología de IA: Es necesario estar alerta ante los riesgos de abuso, proteger los derechos individuales y suscitar debates éticos.

Más información: https://www.chinaz.com/ainews/9707.shtml

9. ¡Una gran unión! Universal Music se une a la empresa emergente de música con IA SoundLabs para crear modelos de clonación de voz personalizados para los cantantes

Universal Music Group y la empresa de tecnología musical con IA SoundLabs han colaborado para lanzar la función MicDrop, que permite a los artistas crear modelos de voz personalizados con control total, superando las barreras del idioma y protegiendo los derechos de los artistas. Esta tecnología revolucionaria lleva la creación musical a un nuevo espacio creativo, impulsando la aplicación y el desarrollo de la IA en el sector musical.

【Resumen de AiBase:】

🎤 Los artistas crean modelos de voz personalizados con control total, garantizando la claridad de la propiedad y los derechos de uso.

🎸 La función MicDrop puede convertir la voz en instrumentos, ofreciendo mayor flexibilidad y espacio creativo en la creación musical.

🌍 La función de conversión de idiomas ayuda a los artistas a superar las barreras del idioma, distribuyendo música a nivel mundial y ampliando su público.

10. ¿Solución para el arrepentimiento? Los agentes inteligentes podrían ser el antídoto de IA tras las compras compulsivas del 618

Los agentes inteligentes se convierten en el salvador de los compradores compulsivos del 618, aportando una innovación en la toma de decisiones de consumo. Las plataformas de agentes inteligentes están surgiendo como setas, permitiendo convocar con un solo clic la colaboración de diferentes agentes inteligentes para crear asistentes inteligentes personalizados. Los agentes inteligentes de compras online se combinan con el comercio electrónico para crear nuevos modelos de negocio.

【Resumen de AiBase:】

🤖 Los agentes inteligentes se convierten en una nueva herramienta para la toma de decisiones de consumo, cambiando la forma en que compran los compradores compulsivos.

🔍 Surgen plataformas de agentes inteligentes que permiten convocar con un solo clic la colaboración de diferentes agentes inteligentes para ofrecer servicios de asistentes inteligentes personalizados.

💡 Los agentes inteligentes de compras online se combinan con el comercio electrónico para ofrecer recomendaciones de consumo más precisas y crear nuevos modelos de negocio.

11. GaussianCube: modelado de generación 3D de alta calidad, ¡un salto en el rendimiento del 74%!