ChinaZ.com (站长之家) - 21 de junho de 2024: O modelo de geração de imagens de texto do Tencent HunYuan (modelo HunYuan DiT) anunciou a liberação completa do código de treinamento, incluindo os plug-ins LoRA e ControlNet.

LoRA é uma técnica usada para ajustar modelos de linguagem grandes, permitindo o treinamento de modelos com características específicas usando poucos dados, sem modificar o modelo original ou aumentar seu tamanho.

微信截图_20240621114949.png

ControlNet é um algoritmo de geração controlável que permite aos usuários controlar melhor a geração de imagens adicionando condições extras. O Tencent HunYuan fornece três modelos ControlNet iniciais que podem extrair e aplicar condições como bordas, profundidade e poses humanas de imagens.

Além disso, o HunYuan DiT lançou uma biblioteca de aceleração exclusiva para melhorar a eficiência de inferência e simplificar o uso. O HunYuan DiT tem sido amplamente utilizado em várias áreas, como criação de materiais, composição de produtos e geração de imagens para jogos, incluindo a plataforma Tencent Advertising Mingshi e várias mídias que usam o modelo HunYuan DiT para geração de conteúdo.

Site oficial:

https://dit.hunyuan.tencent.com/

Código:

https://github.com/Tencent/HunyuanDiT

Modelo:

https://huggingface.co/Tencent-Hunyuan/HunyuanDiT

Artigo científico:

https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdf

Processo de criação de dados:

https://github.com/Tencent/HunyuanDiT/blob/main/IndexKits/docs/MakeDataset.md