Recentemente, o modelo de linguagem grande Yi-34B, da empresa Zero One, gerou controvérsia por utilizar a arquitetura LLaMA, mas alterar os nomes dos tensores. A comunidade questionou a alegada propaganda enganosa e a possível violação de licenças. A empresa respondeu que o modelo é baseado na estrutura GPT e que as mudanças de nomes de código foram necessárias devido às demandas de treinamento. A controvérsia gira em torno da questão se o modelo viola os termos da licença de código aberto, dos parâmetros de desempenho e da transparência das modificações de código.
Controvérsia em torno do modelo de linguagem grande Yi-34B da Zero One Wanwu

站长之家
118
© Todos os direitos reservados AIbase Base 2024, clique para ver a fonte - https://www.aibase.com/pt/news/3169