Tipo :
- Informação de Notícias
- Aplicações de Produtos
- Casos de Monetização
- Tutoriais de IA
2025-03-06 16:34:57.AIbase.16.0k
腾讯开源全新图像转视频模型HunyuanVideo-I2V
A Tencent anunciou o lançamento de código aberto de sua nova estrutura de geração de vídeo a partir de imagem — HunyuanVideo-I2V. O lançamento deste modelo representa mais um avanço importante após o sucesso do lançamento de código aberto do HunyuanVideo, e visa impulsionar a exploração aprofundada da comunidade de código aberto. O HunyuanVideo-I2V incorpora tecnologias avançadas de geração de vídeo, permitindo a transformação de imagens estáticas em conteúdo de vídeo dinâmico, oferecendo mais possibilidades aos criadores. O HunyuanVideo-I2V utiliza um pré-treinamento...

2024-12-31 09:21:19.AIbase.14.4k
智元机器人开源全球首个百万真机数据集AgiBot World
Recentemente, a startup de robótica de Xangai, Zhiyuan Robotics, em conjunto com o Laboratório de Inteligência Artificial de Xangai, o Centro de Inovação em Robótica Humanoide de Construção Conjunta Estadual e Nacional e a Kuapas de Xangai, lançou oficialmente o conjunto de dados de máquinas reais de um milhão de unidades AgiBot World, com o objetivo de apoiar o treinamento de grandes modelos de robôs generalizados e universais. De acordo com informações, este é o primeiro conjunto de dados de máquinas reais do mundo baseado em cenários reais em todo o domínio, plataforma de hardware onipresente e controle de qualidade em todo o processo. O conjunto de dados AgiBot World nasceu na fábrica de coleta de dados em grande escala e na base de experimentos de aplicativos autoconstruída pela Zhiyuan, com uma área total de espaço

2024-09-29 09:45:18.AIbase.12.1k
阿里妈妈开源全新AI图像修复模型FLUX-Controlnet-Inpainting
FLUX-Controlnet-Inpainting, esta ferramenta de restauração de imagens baseada no ControlNet e FLUX.1-dev, está redefinindo nossa compreensão de restauração de imagens. Esta ferramenta não apenas herda a capacidade de geração de imagens de alta qualidade do modelo FLUX.1-dev, mas também integra inteligentemente as vantagens do ControlNet. Ela pode realizar restaurações precisas com base em informações como bordas, esboços e mapas de profundidade da imagem, gerando conteúdo em áreas especificadas que é harmonioso com o ambiente circundante, para imagens danificadas

2024-09-11 07:46:57.AIbase.11.7k
WechatFerry: Ferramenta开源 para criação de robôs do WeChat
WechatFerry é uma estrutura开源 para o desenvolvimento de robôs do WeChat, projetada para simplificar o processo de desenvolvimento e fornecer um SDK abrangente e um rico ecossistema de plugins. Sua principal vantagem é sua solução eficiente e altamente personalizável, suportando operações completas do WeChat, incluindo monitoramento de mensagens, envio e gerenciamento de grupos. A estrutura inclui vários componentes e módulos, adequados para a implementação de funcionalidades personalizadas em diferentes cenários. O cliente WCF SDK oferece suporte abrangente para operações do WeChat, garantindo eficiência e estabilidade. A biblioteca Agent fornece uma interface simples e fácil de usar.

2024-08-14 14:05:00.AIbase.11.0k
腾讯发布首个开源多模态大型语言模型 VITA: comunicação sem barreiras com os usuários
O Laboratório Tencent Youtu e outras instituições lançaram o VITA, o primeiro modelo de linguagem de grande porte multimodal de código aberto, com o objetivo de preencher a lacuna dos modelos de linguagem de grande porte no processamento de dialetos chineses. Baseado no modelo Mixtral8×7B, o VITA expandiu o vocabulário chinês, passou por ajuste fino de instruções bilíngues e domina inglês e chinês. Seus principais recursos incluem: 1. **Compreensão multimodal:** O VITA pode processar vídeo, imagem, texto e áudio, algo inédito em modelos de código aberto. 2. **Interação natural:** Não requer palavra-chave específica, responde instantaneamente e mantém a cortesia sem interrupções.

2024-08-06 09:55:50.AIbase.10.8k
智谱AI开源同源视频生成模型「清影」——CogVideoX
A 智谱AI anunciou o lançamento de código aberto do seu modelo de geração de vídeo, CogVideoX, com o objetivo de impulsionar o desenvolvimento e a aplicação rápida da tecnologia de geração de vídeo. O modelo CogVideoX é baseado em tecnologia avançada de modelos grandes e atende às necessidades de aplicações comerciais. Atualmente, a versão CogVideoX-2B de código aberto requer apenas 18 GB de memória de vídeo para inferência com precisão FP-16 e 40 GB para ajuste fino, permitindo inferência com uma única GPU 4090 e ajuste fino com uma única GPU A6000.

2024-06-07 14:16:19.AIbase.9.5k
Modelo de IA de código aberto mais poderoso da Alibaba lançado: lançamento do Qwen2 do Tongyi Qianwen
Na madrugada de hoje, a equipe do Tongyi Qianwen da Alibaba lançou a série de modelos de código aberto Qwen2. Esta série inclui cinco modelos de pré-treinamento e ajuste fino de instruções de diferentes tamanhos: Qwen2-0.5B, Qwen2-1.5B, Qwen2-7B, Qwen2-57B-A14B e Qwen2-72B. Informações-chave mostram que esses modelos apresentam um aumento significativo no número de parâmetros e desempenho em comparação com a geração anterior, Qwen1.5.

2023-11-10 14:01:01.AIbase.3.1k
网易有道开源语音合成引擎「易魔声」,支持 2000 多种音色
A NetEase Youdao lançou o motor de síntese de voz de código aberto "YiMoSheng", que suporta chinês e inglês, e inclui mais de 2000 timbres diferentes. Este motor possui uma função de síntese emocional característica, podendo sintetizar vozes com uma ampla gama de emoções, como alegria, entusiasmo, tristeza e raiva. Os usuários podem baixar e usar gratuitamente no GitHub e, através da interface e da interface de script fornecidas, realizar a síntese e aplicação de timbre emocional. Este projeto visa ajudar desenvolvedores e criadores de conteúdo a expandir o escopo de aplicação de TTS de alta qualidade. A NetEase Youdao também lançou...