¡Bienvenido a la sección 【AI日报】! Aquí encontrará su guía diaria para explorar el mundo de la inteligencia artificial. Todos los días le presentamos los temas más relevantes del ámbito de la IA, enfocados en desarrolladores, para ayudarle a comprender las tendencias tecnológicas y las innovadoras aplicaciones de los productos de IA.

Descubre nuevos productos de IA aquí: https://top.aibase.com/

1. Kunlun Wanwei lanza el primer modelo de generación de vídeo para cortometrajes de IA de código abierto: SkyReels-V1

Kunlun Wanwei ha anunciado el lanzamiento de código abierto del primer modelo de generación de vídeo para la creación de cortometrajes de IA, SkyReels-V1, y su algoritmo de control de expresiones y movimientos, SkyReels-A1. Su objetivo es solucionar los problemas de alto coste y dificultad de uso de los modelos existentes. Esta innovación impulsará el desarrollo del sector de los cortometrajes de IA, ofreciendo una capacidad de generación de contenido audiovisual de mayor calidad. SkyReels-V1, entrenado con datos de alta calidad, permite un control preciso de la interpretación de los personajes, admite diversas combinaciones de expresiones y movimientos, y mejora el realismo y la expresividad del vídeo.

【Resumen de AiBase:】

🎥 SkyReels-V1 es el primer modelo de generación de vídeo de cortometrajes de IA de código abierto de China, compatible con 33 expresiones y más de 400 combinaciones de movimientos.

🤖 SkyReels-A1 es el primer algoritmo de control de expresiones y movimientos de nivel SOTA, capaz de reproducir microexpresiones con alta fidelidad.

🌐 Kunlun Wanwei se compromete con la tecnología de código abierto para impulsar la innovación y el desarrollo del sector de los cortometrajes de IA, reduciendo los costes de producción.

Enlace de detalles: https://github.com/SkyworkAI/SkyReels-V1

2. Lanzamiento del modelo estrella de xAI, Grok3: supera a GPT-4o, con una capacidad de cálculo 10 veces mayor

xAI lanzó el lunes su último modelo de IA estrella, Grok3, que representa un avance significativo para la empresa en el campo de la inteligencia artificial. Grok3 tiene una capacidad de cálculo 10 veces superior a la de su versión anterior, Grok2, puede analizar imágenes y responder preguntas, y ha superado a GPT-4o de OpenAI en varias pruebas de referencia. La nueva función DeepSearch permite a los usuarios obtener rápidamente análisis de información profunda, mejorando aún más la utilidad de la aplicación Grok. En el futuro se lanzará un modo de voz, que se espera que ofrezca a los usuarios una experiencia más completa.

image.png

【Resumen de AiBase:】

🧠 Grok3 es el último modelo de IA lanzado por xAI, con una capacidad de cálculo 10 veces superior a la de su versión anterior.

📈 Grok3 puede analizar imágenes y responder preguntas, y ha superado a GPT-4o en varias pruebas de referencia.

🔍 La nueva función DeepSearch ofrece análisis de información profunda, permitiendo a los usuarios obtener información rápidamente.

3. Step lanza un modelo de voz de 130 mil millones de parámetros de nivel superior: diálogo en tiempo real + clonación de emociones, ¡una revolución!

Step Audio ha lanzado recientemente un modelo de voz con 130 mil millones de parámetros, lo que representa un gran avance en el campo de la interacción por voz. Este modelo combina la comprensión y la generación de voz controlada, mostrando una potente capacidad de soporte multilingüe y reconocimiento de dialectos, permitiendo una experiencia de interacción de voz personalizada. Además, sus funciones de control emocional y clonación de voz ofrecen a los usuarios posibilidades de interacción más ricas, lo que indica que la IA de voz será más inteligente y natural en el futuro.

【Resumen de AiBase:】

🚀 Este modelo es el primer sistema de diálogo de voz en tiempo real del sector que integra la comprensión y el control de la generación de voz, con una gran capacidad de control.

🌍 Admite varios idiomas y dialectos, incluyendo chino, inglés, japonés, cantonés y dialecto de Sichuan, facilitando la comunicación entre idiomas.

🎶 Cuenta con funciones de clonación de voz y control emocional, permitiendo a los usuarios configurar libremente el tono emocional de la voz y crear asistentes de voz personalizados.

Enlace de detalles: https://github.com/stepfun-ai/Step-Audio/tree/main

4. ¡El mejor resultado! Step Star lanza el modelo de generación de vídeo Step-Video-T2V

Hoy, Step Star y el Grupo Geely Automobile han lanzado conjuntamente dos modelos de lenguaje multimodal de código abierto, especialmente el modelo de generación de vídeo Step-Video-T2V, que, con sus 30 mil millones de parámetros, muestra una capacidad excepcional en el campo de la generación de vídeo. Este modelo no solo destaca en la generación de vídeos de alta calidad, sino que también comprende las instrucciones con precisión, admite varios movimientos de cámara y las imágenes generadas son realistas y cumplen las leyes de la física. Los desarrolladores pueden experimentar este modelo en la aplicación Yuewen y proporcionar comentarios para impulsar el progreso tecnológico.

image.png

【Resumen de AiBase:】

🌟 El modelo Step-Video-T2V tiene 30 mil millones de parámetros, genera vídeos de 204 fotogramas con una resolución de 540P, y su rendimiento es líder a nivel mundial.

🎨 El modelo destaca en la suavidad del movimiento y la estética, superando a los modelos de vídeo de código abierto existentes.

📱 Los dos modelos ya están disponibles en la aplicación Yuewen, donde los desarrolladores pueden experimentar y proporcionar sugerencias para impulsar el desarrollo tecnológico.

Enlace de detalles: https://github.com/stepfun-ai/Step-Audio

5. La talentosa mujer de la IA, Luo Fuli, ya ha comenzado su nuevo puesto de trabajo

Luo Fuli, la talentosa joven de 95 años en el campo de la IA, ha comenzado recientemente un nuevo viaje profesional, aunque aún no se ha revelado información sobre la empresa. Su nombramiento, con un salario de millones de yuanes ofrecido por el fundador de Xiaomi, Lei Jun, ha generado un gran interés. Luo Fuli obtuvo un máster en lingüística computacional en la Universidad de Pekín y posteriormente acumuló una amplia experiencia en investigación en empresas como Alibaba DAMO Academy y DeepSeek.

【Resumen de AiBase:】

✨ Luo Fuli ha comenzado un nuevo trabajo, pero la empresa aún no se ha hecho pública.

💰 Lei Jun ofreció a Luo Fuli un puesto en el equipo de Xiaomi con un salario de millones de yuanes.

📈 Luo Fuli calificó el modelo DeepSeek-V2 como el "rey de la relación calidad-precio".

6. ¡Modelos pequeños + modelos grandes en colaboración! La búsqueda de IA de Mita lanza la función de "investigación superficial"

Mita Network Technology Co., Ltd. lanzó el 18 de febrero de 2025 su nueva función, "investigación superficial", cuyo objetivo es utilizar la tecnología de IA para recopilar y analizar información rápidamente, mejorando así la eficiencia de la investigación. Esta función utiliza una arquitectura de colaboración entre modelos pequeños y grandes, capaz de realizar la búsqueda y el análisis de cientos de páginas web en poco tiempo, reduciendo considerablemente el tiempo de investigación. Aunque todavía se encuentra en una fase de investigación superficial, ya puede proporcionar a los usuarios resultados de análisis preliminares, mostrando el enorme potencial de la IA en el procesamiento de información.

image.png

【Resumen de AiBase:】

🧠 Utiliza una arquitectura de colaboración entre modelos pequeños y grandes para mejorar la eficiencia de la investigación.

⏱️ Puede realizar la búsqueda y el análisis de cientos de páginas web en 2 o 3 minutos.

📈 En el futuro, se planea añadir funciones como la ejecución de código y el análisis numérico para profundizar la investigación.

7. Lanzamiento de Supertone Play, la herramienta de voz de IA de HYBE: clonación de voz en 10 segundos

Supertone, de HYBE, ha lanzado Supertone Play, una herramienta de texto a voz que ofrece a los creadores contenido de audio de alta calidad y expresivo. Esta herramienta admite inglés, coreano y japonés, y en el futuro se ampliará a español y chino. Supertone Play cuenta con 150 personajes de voz para diversas necesidades creativas, y tiene una función de clonación de voz que permite a los usuarios crear personajes personalizados basándose en su propia voz y ajustar el tono emocional.

image.png

【Resumen de AiBase:】

🎙️ Supertone Play admite varios idiomas y ofrece 150 personajes de voz para los creadores.

🔒 La herramienta cuenta con medidas de seguridad como códigos de verificación de voz y marcas de agua inaudibles para evitar el mal uso de la tecnología.

🌍 En la fase de prueba, la herramienta se ha utilizado ampliamente en más de 80 países, y los usuarios han descargado activamente el contenido generado.

Enlace de detalles: https://play.supertone.ai/

8. Tencent Electronic Signature lanzará una función de redacción de contratos con IA

La cuenta pública de WeChat de Tencent Electronic Signature anunció recientemente que lanzará próximamente una función de redacción de contratos con IA, utilizando la tecnología de los modelos de lenguaje grandes Hun Yuan y DeepSeek, con el objetivo de ofrecer a los usuarios un servicio cómodo de generación y gestión de contratos. Gracias a la IA, Xiao Wang puede generar fácilmente un contrato de alquiler compartido y añadir las cláusulas necesarias, mientras que Xiao Li puede revisar rápidamente los posibles riesgos en los contratos de los proveedores. El abogado Lao Zhang también puede gestionar los contratos de forma eficiente y evitar la pérdida de información. Esta función mejorará considerablemente la eficiencia y la precisión del procesamiento de contratos.

image.png

【Resumen de AiBase:】

🤖 La IA puede generar contratos con un solo clic, simplificando el proceso de redacción y reduciendo la dificultad de operación para los usuarios.

🔍 La IA, como asistente de análisis de riesgos, puede identificar rápidamente las cláusulas potencialmente desfavorables en los contratos.

📂 La IA permite una gestión inteligente de contratos, ayudando a los usuarios a encontrar rápidamente la información clave y evitando la "desaparición" de los contratos.

9. Shenzhen Futian y Guangzhou lanzan "funcionarios de IA": despliegue del modelo DeepSeek

Los distritos de Futian, Shenzhen y Guangzhou han lanzado sucesivamente "funcionarios de IA" basados en el modelo DeepSeek, lo que representa un importante avance en la construcción de una administración inteligente. El empleado de IA digital lanzado por el distrito de Futian ya cubre 240 escenarios de negocios, mejorando significativamente la eficiencia del servicio administrativo, reduciendo considerablemente el tiempo de generación personalizado y el tiempo de revisión en un 90%. Guangzhou también está impulsando la construcción de un sistema de administración inteligente basado en DeepSeek, mostrando el potencial de la tecnología de IA en la optimización de los servicios administrativos.

【Resumen de AiBase:】

🚀 El distrito de Futian ha lanzado empleados de IA digitales que cubren 240 escenarios de negocios, mejorando la eficiencia del servicio administrativo.

⏱️ El tiempo de generación personalizada se ha reducido de 5 días a minutos, y el tiempo de revisión se ha reducido en un 90%.

🌐 Guangzhou está construyendo un sistema de administración inteligente basado en DeepSeek, impulsando la construcción de un nuevo motor digital.

10. NetEase Youdao lanza SpaceOne, el primer hardware de aprendizaje nativo de IA de China, integrado con DeepSeek-R1

NetEase Youdao lanzó el 18 de febrero un revolucionario hardware de aprendizaje, el bolígrafo diccionario de pantalla completa SpaceOne, convirtiéndose en el primer hardware educativo nativo de IA de China que integra profundamente las capacidades de los grandes modelos de lenguaje. Este producto, basado en la "simulación de razonamiento en papel", supera las limitaciones de las herramientas tradicionales de resolución de problemas, ofreciendo explicaciones profundas para todos los tipos de problemas, cubriendo varias materias como matemáticas, física y química, y mejorando considerablemente la eficiencia del aprendizaje.

image.png

【Resumen de AiBase:】

🖊️ SpaceOne integra el modelo de inferencia DeepSeek-R1, que descompone visualmente los problemas paso a paso, simulando el proceso de pensamiento de un profesor y cubriendo 10 materias principales.

📱 Con una carcasa deslizante y una pantalla completa de 4,4 pulgadas que protege la vista, la eficiencia de visualización vertical aumenta en un 350%, optimizando la experiencia interactiva de aprendizaje.

🌐 Con un diccionario integrado de 78 millones de palabras y un módulo 4G móvil, admite la traducción entre cientos de idiomas, superando las limitaciones de los recursos educativos regionales.

11. La empresa emergente SSI, cofundada por el cofundador de OpenAI, recauda más de 1000 millones de dólares, con una valoración superior a los 30 000 millones de dólares

Ilya Sutskever, cofundador de OpenAI, ha recaudado más de 1000 millones de dólares para su nueva empresa, "Seguridad Superinteligencia" (SSI), con una valoración superior a los 30 000 millones de dólares, convirtiéndola en una de las empresas tecnológicas privadas más valiosas del mundo. SSI se centra en el desarrollo de sistemas de IA seguros y aún no ha generado ingresos. Su primer producto será la superinteligencia segura. Sutskever ha destacado que la empresa se aislará completamente de las presiones externas para evitar participar en complejas competiciones de productos.

【Resumen de AiBase:】

🌟 SSI está recaudando más de 1000 millones de dólares, con una valoración superior a los 30 000 millones de dólares.

🚀 La empresa se centra en el desarrollo de sistemas de IA seguros y aún no ha generado ingresos.

🤖 Sutskever ha afirmado que el primer producto de la empresa será la superinteligencia segura, y que otras actividades se pospondrán temporalmente.

12. OpenAI considera derechos de voto especiales para defenderse de adquisiciones hostiles como la de Musk