Tipo :
- Información de Noticias
- Aplicaciones de Productos
- Casos de Monetización
- Tutoriales de IA
2025-03-06 16:34:57.AIbase.16.0k
腾讯开源全新图像转视频模型HunyuanVideo-I2V
腾讯宣布开源其新研发的图像转视频生成框架——HunyuanVideo-I2V。Este lanzamiento, tras el exitoso lanzamiento de código abierto de HunyuanVideo, representa un avance significativo en el impulso de la exploración dentro de la comunidad de código abierto. HunyuanVideo-I2V integra tecnologías avanzadas de generación de video, capaz de transformar imágenes estáticas en contenido de video dinámico, ofreciendo a los creadores más posibilidades. HunyuanVideo-I2V utiliza un preentrenamiento...

2025-03-04 13:39:41.AIbase.15.9k
智谱发布首个支持生成汉字的开源文生图模型CogView4
Beijing Zhihuazhang Technology Co., Ltd. ha anunciado el lanzamiento de CogView4, el primer modelo de generación de imágenes a partir de texto de código abierto que admite la generación de caracteres chinos. Este modelo ocupa el primer lugar en la clasificación general de las pruebas de referencia DPG-Bench, convirtiéndose en el mejor modelo de generación de imágenes a partir de texto de código abierto (SOTA), y sigue el protocolo Apache2.0, siendo el primer modelo de generación de imágenes que admite este protocolo.

2025-02-25 08:35:54.AIbase.15.7k
Versión preliminar del modelo de inferencia QwQ-Max de Alibaba Tongyi Qianwen disponible en qwen.ai
El 25 de febrero, Alibaba anunció el lanzamiento de QwQ-Max-Preview, un modelo de inferencia basado en Qwen2.5-Max, y planea la publicación de código abierto completa de sus últimos modelos de inferencia QwQ-Max y Qwen2.5-Max. QwQ-Max-Preview es una versión preliminar; Alibaba indicó que la versión oficial se lanzará próximamente y será de código abierto bajo la licencia Apache2.0. A diferencia de versiones anteriores, esta publicación de código abierto incluye no solo el modelo en sí, sino también versiones más pequeñas, como Q...

2025-01-14 15:11:46.AIbase.14.7k
清华、复旦和斯坦福联合开源 “Eko” 框架,实现电脑 Agent 自动化操作
Recientemente, equipos de investigación de la Universidad Tsinghua, la Universidad Fudan y la Universidad de Stanford lanzaron conjuntamente un marco de desarrollo de agentes llamado “Eko”, diseñado para ayudar a los desarrolladores a construir rápidamente “empleados virtuales” listos para producción utilizando código simple y lenguaje natural. Eko puede controlar el ordenador y el navegador del usuario, realizando diversas tareas tediosas en lugar de los humanos. Con Eko, los usuarios pueden automatizar funciones como la recopilación de datos, las pruebas y la gestión de archivos. Por ejemplo, los usuarios pueden configurar Eko para recopilar automáticamente datos de Yahoo Finanzas...
2024-11-05 15:41:18.AIbase.13.0k
腾讯发布开源大型语言模型Hunyuan-large,支持高达256K文本序列
腾讯今日发布了其开源的MOE大型语言模型Hunyuan-large,拥有398B的总参数量和52B的激活参数量。 Los resultados de las evaluaciones públicas muestran que Tencent Hunyuan-Large supera a los modelos de lenguaje grandes de código abierto de primera línea como Llama 3.1 y Mixtral en múltiples conjuntos de evaluación multidisciplinarios como CMMLU, MMLU, CEva-1 y MATH, así como en tareas de PNL en chino e inglés, código y matemáticas en 9 dimensiones. Según se informa, este modelo logra la creación de datos sintéticos de alta calidad a través de la innovación tecnológica, mediante el uso de...

2024-09-29 09:45:18.AIbase.12.1k
阿里妈妈开源全新AI图像修复模型FLUX-Controlnet-Inpainting
FLUX-Controlnet-Inpainting, una herramienta de reparación de imágenes basada en ControlNet y FLUX.1-dev, está redefiniendo nuestra comprensión de la reparación de imágenes. Esta herramienta no solo hereda la capacidad de generación de imágenes de alta calidad del modelo FLUX.1-dev, sino que también integra inteligentemente las ventajas de ControlNet. Puede realizar reparaciones precisas según información como bordes de imagen, bocetos, mapas de profundidad, etc., generando contenido en áreas específicas que armoniza con el entorno circundante, lo que permite la restauración de imágenes dañadas.

2024-08-28 10:20:20.AIbase.11.3k
智谱AI开源新模型,老显卡也能开启视频生成新时代
La empresa de IA Zhipu ha lanzado un modelo de generación de video de código abierto, CogVideoX-5B, que mejora significativamente la calidad, los efectos visuales y el rendimiento de la inferencia de la generación de video. El nuevo modelo es compatible con GPU de baja configuración, como las GTX 1080 Ti antiguas y las RTX 3060 de escritorio. Esta herramienta, basada en el modelo DiT a gran escala, utiliza un autocodificador variacional causal 3D y la tecnología de transformadores expertos. Mediante la codificación de posición 3D-RoPE y el mecanismo de atención completa 3D, logra una generación eficiente de texto a video. Puede encontrar más información y el código en el enlace especificado.

2024-08-06 09:55:50.AIbase.10.8k
智谱AI开源同源视频生成模型「清影」——CogVideoX
智谱AI宣布开源其视频生成模型CogVideoX,旨在促进视频生成技术的快速发展和应用。CogVideoX模型基于先进的大型模型技术,能够满足商业级应用的需求。目前开源的CogVideoX-2B版本在FP-16精度下的推理仅需18GB显存,微调则需要40GB显存,使得单张4090显卡即可进行推理,而单张A6000显卡即可完成微调。

2024-07-25 16:44:09.AIbase.10.6k
智源研究院开源全球首个万亿单体稠密模型Tele-FLM-1T
El Instituto de Investigación de Inteligencia Artificial de Beijing Zhiyuan y el Instituto de Investigación de Inteligencia Artificial de China Telecom se han asociado para lanzar una versión mejorada de la serie de grandes modelos Tele-FLM, que incluye el modelo de instrucciones FLM-2-52B-Instruct y el modelo de billones de parámetros Tele-FLM-1T. FLM-2-52B-Instruct, mediante el ajuste de instrucciones, se centra en mejorar la capacidad de conversación en chino, alcanzando el 90% del nivel de GPT-4. Se basa en el modelo base Tele-FLM-52B y utiliza un conjunto de datos específico y optimización de parámetros. Tele-F

2023-11-10 14:01:01.AIbase.3.1k
网易有道开源语音合成引擎「易魔声」,支持2000多种音色
网易有道推出了「易魔声」开源语音合成引擎,支持中文和英文双语,包含2000多种不同的音色。
该引擎具有独特的情感合成功能,可以合成包含快乐、兴奋、悲伤、愤怒等多种情感的语音。
用户可以在GitHub上免费下载使用,并通过提供的界面和脚本接口实现音色的情感合成和应用。
该项目旨在帮助开发者和内容创作者扩大高质量TTS的应用范围。
网易有道还推出了...
2023-10-20 14:22:29.AIbase.2.3k
智源研究院开源10亿参数三维视觉通用模型Uni3D
El Instituto de Inteligencia Artificial de Beijing (Beijing Academy of Artificial Intelligence, BAAI) ha publicado recientemente el modelo Uni3D, un modelo de visión 3D de propósito general con 1000 millones de parámetros. Este modelo puede procesar datos de nubes de puntos y ha logrado avances significativos en las principales tareas de visión 3D. Uni3D utiliza una arquitectura Transformer unificada e introduce un método de entrenamiento de alineación multimodal. Este modelo ha obtenido resultados de vanguardia en diversas tareas de visión 3D. El Instituto de Inteligencia Artificial de Beijing afirma que la publicación de código abierto de Uni3D allana el camino para futuras investigaciones en visión artificial 3D.
2023-09-28 10:03:16.AIbase.1.8k
智源研究院发布开源 AI 硬件评测引擎 FlagPerf v1.0
El Instituto de Inteligencia Artificial de Beijing (BAAI) lanza FlagPerf v1.0, un motor de evaluación de hardware de IA de código abierto. FlagPerf incluye métricas de evaluación que abarcan la corrección funcional, el rendimiento, el uso de recursos y la adaptación del ecosistema. Admite múltiples frameworks de entrenamiento e inferencia, así como diversos entornos de prueba. Se revisa estrictamente el código presentado para garantizar resultados justos e imparciales. El código de prueba se ha publicado como código abierto, y el proceso de prueba y los datos son reproducibles.
2023-09-25 10:45:59.AIbase.1.6k
LLaMA-2 中文版,开源且可商用,性能媲美主流大模型!
El equipo de Colossal-AI ha construido un modelo LLaMA-2 en chino con un rendimiento excelente a bajo costo. El LLaMA-2 en chino ha obtenido excelentes resultados en varias clasificaciones. Colossal-AI ha abierto completamente el código, los pesos y el proceso de entrenamiento. Colossal-AI proporciona el marco de evaluación ColossalEval. La solución de Colossal-AI se puede utilizar para construir modelos grandes para cualquier sector específico.