ChinaZ.com (站长之家) - 21 de junho de 2024: O modelo de geração de imagens de texto do Tencent HunYuan (modelo HunYuan DiT) anunciou a liberação completa do código de treinamento, incluindo os plug-ins LoRA e ControlNet.
LoRA é uma técnica usada para ajustar modelos de linguagem grandes, permitindo o treinamento de modelos com características específicas usando poucos dados, sem modificar o modelo original ou aumentar seu tamanho.
ControlNet é um algoritmo de geração controlável que permite aos usuários controlar melhor a geração de imagens adicionando condições extras. O Tencent HunYuan fornece três modelos ControlNet iniciais que podem extrair e aplicar condições como bordas, profundidade e poses humanas de imagens.
Além disso, o HunYuan DiT lançou uma biblioteca de aceleração exclusiva para melhorar a eficiência de inferência e simplificar o uso. O HunYuan DiT tem sido amplamente utilizado em várias áreas, como criação de materiais, composição de produtos e geração de imagens para jogos, incluindo a plataforma Tencent Advertising Mingshi e várias mídias que usam o modelo HunYuan DiT para geração de conteúdo.
Site oficial:
https://dit.hunyuan.tencent.com/
Código:
https://github.com/Tencent/HunyuanDiT
Modelo:
https://huggingface.co/Tencent-Hunyuan/HunyuanDiT
Artigo científico:
https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdf
Processo de criação de dados:
https://github.com/Tencent/HunyuanDiT/blob/main/IndexKits/docs/MakeDataset.md