¡Bienvenido a la sección 【AI日报】! Aquí encontrará su guía diaria para explorar el mundo de la inteligencia artificial. Todos los días le presentaremos los temas más relevantes del ámbito de la IA, centrándonos en los desarrolladores y ayudándole a comprender las tendencias tecnológicas y las innovadoras aplicaciones de los productos de IA.

Conozca los nuevos productos de IA https://top.aibase.com/

1. El ex ejecutivo de Baidu, Jing Kun, crea una empresa de búsqueda con IA valorada en 1800 millones de dólares y lanza su primer producto, Genspark

Jing Kun, ex ejecutivo de Baidu, fundó la nueva empresa MainFunc y lanzó su primer producto, Genspark, con el objetivo de ofrecer una experiencia de búsqueda de alta calidad mediante la tecnología de IA. La empresa recibió una financiación inicial de 60 millones de dólares, alcanzando una valoración de 260 millones de dólares, lo que demuestra un enorme potencial de mercado. El currículum de Jing Kun es excelente, y ahora vuelve a liderar el sector de la búsqueda con IA. Esperamos que siga innovando y desarrollándose.

image.png

【Resumen de AiBase:】

🚀 MainFunc es una empresa innovadora de productos de IA fundada por Jing Kun y Zhu Kaihua, ex director de tecnología de Xiaodu, que lanza su primer producto de búsqueda AI Agent, Genspark.

💰 La empresa ha completado una ronda de financiación inicial de 60 millones de dólares, alcanzando una valoración de 260 millones de dólares, con un enorme potencial de mercado.

🔍 Genspark se posiciona como un motor AI Agent, centrado en la prestación de servicios de búsqueda. Mediante la tecnología de IA, genera páginas personalizadas denominadas "Sparkpages", lo que ahorra tiempo al usuario y proporciona información fiable.

Dirección del sitio web: https://mainfunc.ai/

Entrada al producto de búsqueda: https://top.aibase.com/tool/sparkpage

2. La plataforma abierta Kimi lanzará la prueba beta de Context Caching (almacenamiento en caché del contexto)

La plataforma abierta Kimi anunció recientemente que la esperada función Context Caching está a punto de iniciar su prueba beta. Esta innovadora función será compatible con los modelos de lenguaje extenso de texto largo y, mediante un eficiente mecanismo de almacenamiento en caché del contexto, ofrecerá a los usuarios una experiencia sin precedentes. Context Caching es una tecnología de vanguardia que, al almacenar en caché el contenido repetido de los tokens, reduce considerablemente el coste para los usuarios que solicitan el mismo contenido.

微信截图_20240620091624.png

【Resumen de AiBase:】

🔑 La función Context Caching es compatible con los modelos de lenguaje extenso de texto largo y, mediante un eficiente mecanismo de almacenamiento en caché del contexto, ofrece una experiencia sin precedentes.

🚀 Context Caching puede identificar e almacenar de forma inteligente los fragmentos de texto ya procesados, lo que aumenta considerablemente la velocidad de respuesta de la interfaz de API.

💡 Es adecuado para escenarios de solicitudes a gran escala y con un alto grado de repetición. Mediante la reutilización del contenido almacenado en caché, se mejora la eficiencia del procesamiento y se reducen los costes.

3. TikTok lanza Symphony, un paquete completo de IA para escribir guiones, editar vídeos y crear avatares digitales

El paquete de herramientas de contenido con IA Symphony, lanzado por TikTok, está revolucionando la forma de crear y compartir contenido, permitiendo que cualquiera pueda convertirse en un maestro creativo. Symphony Assistant ofrece una ayuda personalizada, descubre tendencias, proporciona orientación creativa, estimula la inspiración, escribe guiones y ofrece sugerencias de optimización. Symphony Creative Studio puede generar varias previsualizaciones de vídeos de TikTok en 60 segundos, admite la traducción a varios idiomas y la edición de vídeo. Symphony Digital Avatars ayuda a las marcas a ampliar sus estrategias creativas, ofreciendo avatares de personas reales.

【Resumen de AiBase:】

🚀 Symphony Assistant ofrece ayuda integral para la creación, desde la detección de tendencias hasta la escritura de guiones, lo que simplifica y agiliza el proceso de creación.

💡 Symphony Creative Studio permite generar rápidamente varias previsualizaciones de vídeos de TikTok. Las funciones de traducción a varios idiomas y edición de vídeo hacen que el contenido sea más atractivo.

👤 Symphony Digital Avatars crea avatares de personas reales mediante IA generativa, lo que ayuda a las marcas a ampliar sus estrategias creativas a nivel mundial.

Enlace de detalles: https://www.tiktok.com/business/en-US/blog/tiktok-symphony-ai-creative-suite

4. Baidu Wenku: El producto de IA "Chengpian" ya admite la generación de textos largos de 100.000 caracteres

El último producto de IA de Baidu Wenku, "Chengpian", ha logrado un gran avance en la generación de textos largos y la edición multimodal, ofreciendo a los usuarios funciones integrales de creación y edición. El producto se basa en una potente tecnología de IA que permite a los usuarios acceder fácilmente a recursos académicos profesionales, crear contenido de texto e imagen extra largo y realizar una edición y ajuste multiformato integral.

image.png

【Resumen de AiBase:】

🚀 "Chengpian" admite la generación de textos largos de 100.000 caracteres y la capacidad de edición multimodal, satisfaciendo las necesidades de los usuarios en el ámbito profesional.

💡 Rompe las barreras de los recursos académicos, permitiendo a los usuarios acceder fácilmente a información y documentación de sitios académicos profesionales de todo el mundo.

✨ Admite la comprensión y generación de textos e imágenes extra largos. Permite cargar archivos de varios formatos a la vez y realizar resúmenes rápidos, preguntas y respuestas y creación.

Enlace de detalles: https://top.aibase.com/tool/chengpianai

5. Se publican los resultados de la primera evaluación del examen de ingreso a la universidad con IA; GPT-4o obtiene el segundo lugar

En esta inusual evaluación del examen de ingreso a la universidad con IA, varios modelos de IA se sometieron a una prueba completa de sus capacidades en lengua materna, matemáticas e inglés, mostrando su potencial y limitaciones en el ámbito académico. Si bien su rendimiento fue bueno en lengua materna e inglés, todavía hay margen de mejora en el razonamiento matemático. En el futuro, con el avance de la tecnología, la IA será más inteligente y prestará un mejor servicio a la sociedad humana.

【Resumen de AiBase:】

🧠 Los modelos de IA participaron en una prueba completa de sus capacidades, mostrando su potencial y limitaciones académicas.

📚 El rendimiento fue bueno en lengua materna e inglés, pero aún hay margen de mejora en el razonamiento matemático.

🚀 El avance tecnológico hará que la IA sea más inteligente y preste un mejor servicio a la sociedad humana.

6. Flash Diffusion es aplicable a cualquier modelo de difusión y permite generar imágenes en pocos pasos

El método Flash Diffusion ha supuesto un avance revolucionario en la tecnología de generación de imágenes, acelerando el proceso de generación de modelos de difusión preentrenados, mostrando un rendimiento excelente, eficiente y versátil. Los investigadores han utilizado técnicas innovadoras, como distribuciones ajustables y objetivos adversarios, para mejorar la precisión y la eficiencia computacional del modelo de predicción. Este método se adapta a diferentes redes troncales, reduciendo significativamente los pasos de muestreo mientras se mantiene una generación de alta calidad. Flash Diffusion aporta nueva vitalidad, mejorando la eficiencia y la versatilidad de la generación de imágenes, y es probable que tenga un profundo impacto en diversos campos.

image.png

【Resumen de AiBase:】

⚡ Acelera el proceso de generación de modelos de difusión preentrenados, mostrando un rendimiento excelente, eficiente y versátil.

🔍 Utiliza técnicas innovadoras, como distribuciones ajustables y objetivos adversarios, para mejorar la precisión y la eficiencia computacional del modelo de predicción.

🌟 Se adapta a diferentes redes troncales, reduciendo significativamente los pasos de muestreo mientras se mantiene una generación de alta calidad.

Enlace de detalles: https://top.aibase.com/tool/flash-diffusion

7. ¡La generación de imágenes con IA se puede "personalizar"! Huawei y Tsinghua se unen para lanzar la tecnología de generación personalizada PMG

En la era de la personalización, Huawei y la Universidad Tsinghua han colaborado para lanzar la tecnología de generación personalizada PMG. Esta tecnología utiliza el comportamiento y las preferencias históricas del usuario para generar contenido multimodal que se ajusta a las necesidades del usuario, como memes, diseños de camisetas y carteles de películas. Mediante pruebas experimentales, la tecnología PMG ha demostrado un enorme potencial y valor comercial, ofreciendo a los usuarios una experiencia más rica y personalizada.

image.png

【Resumen de AiBase:】

⚙️ La tecnología PMG utiliza el comportamiento y las preferencias históricas del usuario para generar contenido multimodal personalizado.

💡 PMG extrae las preferencias del usuario mediante la generación de palabras clave y la generación de vectores latentes, lo que permite la generación de contenido multimodal.

📈 La tecnología PMG ha demostrado su eficacia en escenarios de aplicación como la generación de imágenes de ropa de comercio electrónico, la creación de carteles de películas y la generación de memes, mostrando excelentes resultados de generación.

Enlace de detalles: https://github.com/mindspore-lab/models/tree/master/research/huawei-noah/PMG

8. Gboard revoluciona la experiencia de escritura; Google utiliza modelos de lenguaje extenso para corregir todos los errores con un solo clic

Gboard es el teclado inteligente de Google para dispositivos móviles. La función "Corrección", recientemente lanzada, utiliza modelos de lenguaje extenso para corregir errores en oraciones y párrafos completos con un solo clic, cambiando por completo la experiencia tradicional de corrección carácter por carácter. Esta función ya está disponible en los dispositivos Pixel 8, beneficiando a numerosos usuarios. El equipo de investigación generó conjuntos de datos simulados mediante un complejo marco de síntesis de errores, combinando técnicas de aprendizaje supervisado y aprendizaje por refuerzo para optimizar el rendimiento del modelo, lo que demuestra el enorme potencial de los modelos de lenguaje extenso para mejorar la experiencia de interacción de entrada en dispositivos móviles.

【Resumen de AiBase:】

🔍 Utiliza modelos de lenguaje extenso para corregir errores en oraciones y párrafos completos con un solo clic, cambiando la experiencia tradicional de corrección carácter por carácter.

🚀 Genera conjuntos de datos simulados mediante un complejo marco de síntesis de errores, combinando técnicas de aprendizaje supervisado y aprendizaje por refuerzo para optimizar el rendimiento del modelo.

💡 Se implementa en TPU V5 en la nube, mejorando la eficiencia de la entrada del usuario mediante la optimización de la latencia.

Enlace de detalles: https://arxiv.org/abs/2406.04523

9. Se puede utilizar el modelo de generación de imágenes Lumina-T2X de Nvidia en Confyui

El modelo de generación de imágenes Lumina-T2X de Nvidia se puede utilizar en Confyui. Como modelo de código abierto, su rendimiento estético y calidad de imagen son casi idénticos a los del líder del sector, MJ V6, un logro especialmente valioso en el ámbito del código abierto.

image.png

【Resumen de AiBase:】

🌟 Lumina-T2X utiliza una arquitectura DiT unificada, capaz de generar varios tipos de contenido multimedia, ampliando el ámbito de aplicación de la IA en la creación de contenido.

💡 El modelo de generación de imágenes Lumina-T2I mejora la calidad de generación y reduce los costes de entrenamiento, mostrando el potencial económico de la tecnología de IA.

🔑 La clave del éxito de Lumina-T2I radica en que el tronco del modelo utiliza Large-DiT, el modelo de codificación de texto utiliza Llama2-7B y el VAE utiliza SDXL, sentando las bases para la generación de imágenes de alta calidad.

Los interesados pueden probar este complemento en Confyui: https://github.com/kijai/ComfyUI-LuminaWrapper

10. Ilya, figura clave de OpenAI, funda la nueva empresa de IA SSI, dirigida a la superinteligencia segura

Después de dejar OpenAI, Ilya Sutskever fundó Safe Superintelligence Inc., centrada en resolver los problemas de seguridad de los sistemas de inteligencia artificial superinteligentes. La empresa se dedica a investigar cómo controlar y limitar la IA que supera la inteligencia humana, y planea resolver los problemas de seguridad mediante avances en ingeniería y ciencia. SSI es una entidad con fines de lucro desde su creación, sin la presión de los negocios a corto plazo, y actualmente está contratando personal técnico.

【Resumen de AiBase:】

🔒 SSI se centra en resolver los problemas de seguridad de los sistemas de IA superinteligentes y se dedica a investigar métodos para controlar y limitar la IA que supera la inteligencia humana.

🚀 SSI planea resolver los problemas de seguridad de la IA mediante avances en ingeniería y ciencia, mejorando las capacidades y la seguridad de la IA.

💼 SSI es una entidad con fines de lucro, sin la presión de los negocios a corto plazo, y está contratando personal técnico.

11. GPT-4 supera la prueba de Turing; más de la mitad de las personas no pueden distinguir entre GPT-4 y un humano

Uno de los hitos importantes en el campo de la inteligencia artificial es la prueba de Turing. Un experimento reciente muestra que la probabilidad de que GPT-4 sea confundido con un humano en una prueba de Turing interactiva de dos personas es del 54%, lo que ha suscitado la preocupación por el realismo del rendimiento de los sistemas de IA. Los participantes tienden a utilizar el estilo lingüístico y los factores socioemocionales para juzgar si el otro participante es humano, lo que ha tenido un profundo impacto en el debate sobre la inteligencia artificial.

【Resumen de AiBase:】

🤖 La probabilidad de que GPT-4 sea confundido con un humano en la prueba de Turing es del 54%, mostrando un rendimiento realista.

🔍 Los participantes tienden a utilizar el estilo lingüístico y los factores socioemocionales para juzgar si el otro participante es humano.

💡 Los resultados sugieren que los sistemas de IA podrían engañar a los humanos en aplicaciones prácticas, planteando nuevos retos éticos, de privacidad y de seguridad.

12. Herramienta de diseño con IA Kittl: Introduzca indicaciones de texto para generar iconos, imágenes recortadas, etc.