Baichuan lança solução completa para implantação privada de modelos de baixo custo para empresas

AIbase基地

Publicado emNotícias e Informações de IA · 5 minutos de leitura · Oct 31, 2024

160

A Beijing Baichuan Intelligent Technology Co., Ltd. anunciou recentemente o lançamento de sua solução completa, projetada para ajudar as empresas a implementarem modelos de linguagem grandes (LLMs) de forma privada com baixo custo e alta eficiência. Essa solução inclui dados de treinamento gerais de alta qualidade para toda a cadeia, os dois modelos Baichuan4-Turbo e Baichuan4-Air, e uma cadeia de ferramentas de aprimoramento de domínio completa, capaz de atender às necessidades das empresas em diferentes cenários.

Os dois modelos, Baichuan4-Turbo e Baichuan4-Air, alcançaram uma taxa de utilização em múltiplos cenários de até 96% através do ajuste misto com dados proprietários das empresas, uma taxa líder no setor. A solução da Baichuan Intelligent Technology, ao fornecer dados de treinamento gerais de alta qualidade com distribuição altamente consistente com os dados do modelo original, combinada com algoritmos como busca dinâmica de hiperparâmetros e proporção adaptativa, melhora significativamente o desempenho do modelo.

微信截图_20241031144641.png

Em termos de custo, o custo de implantação do Baichuan4-Turbo e o custo de inferência do Baichuan4-Air são os mais baixos da categoria. O Baichuan4-Turbo apresenta melhorias significativas em capacidades essenciais como geração de texto, perguntas e respostas baseadas em conhecimento e processamento de várias línguas, e requer apenas 2 GPUs 4090 para implantação, com custo de inferência de apenas 15% do Baichuan4. Já o custo de inferência do Baichuan4-Air é apenas 1% do Baichuan4, custando apenas 0,98 yuan para um milhão de tokens, reduzindo significativamente os custos operacionais das empresas.

O Baichuan4-Air é o primeiro modelo da Baichuan Intelligent Technology a adotar a arquitetura MoE (Mixture of Experts), com sua estrutura PRI (Pyramid, Residual, Interval) que, mantendo inalteradas as estruturas internas MLP e Attention, otimiza a configuração do número de especialistas e estratégias de ativação, equilibrando a carga de cálculo, reduzindo a quantidade de cálculos e aumentando a velocidade de inferência.

Além disso, a cadeia de ferramentas de aprimoramento de domínio completa fornecida pela Baichuan Intelligent Technology é fácil de usar e abrange todo o processo de implantação do modelo, incluindo ferramentas para coleta, limpeza, aprimoramento, treinamento, avaliação, compressão e implantação de dados, ajudando as empresas a implantar e treinar modelos de forma criptografada de acordo com suas necessidades. A empresa já resolveu problemas de compatibilidade com diferentes hardwares e pode se adaptar de forma eficiente a vários chips principais.

O lançamento desta solução marca um passo importante da Baichuan Intelligent Technology no campo de aplicações de modelos de linguagem grandes, oferecendo às empresas uma opção de implantação de modelos de IA eficiente e de baixo custo.

Endereço: https://platform.baichuan-ai.com/homePage

OpenAI contesta decisão da justiça indiana, recusando-se a remover dados de treinamento do ChatGPT

Recentemente, a empresa americana de inteligência artificial OpenAI contestou a decisão do Tribunal Superior de Delhi, na Índia, argumentando que o tribunal não tem o direito de exigir a remoção dos dados de treinamento do ChatGPT. O caso decorre de um processo movido pela agência de notícias indiana ANI em novembro passado, alegando que a OpenAI usou seu conteúdo publicado sem autorização para treinar o ChatGPT. A ANI solicitou a remoção de seu conteúdo do conjunto de dados de treinamento do modelo e acusou a OpenAI de violação de direitos autorais. Em documento apresentado ao Tribunal Superior de Delhi em 10 de janeiro...

Executivos do Meta obcecados em superar o GPT-4, dados de treinamento enfrentam polêmica de direitos autorais!

Recentemente, com o andamento de um caso de direitos autorais de inteligência artificial – o caso Kadrey vs. Meta – informações internas da empresa Meta foram liberadas pelo tribunal, revelando a obsessão dos executivos da empresa em superar o modelo GPT-4 da OpenAI durante o desenvolvimento do Llama3. Em uma mensagem de outubro de 2023, o vice-presidente de IA generativa da Meta, Ahmad Al-Dahle, mencionou: “Honestamente, nosso objetivo tem que ser o GPT”

Lançado o primeiro modelo global de transparência de dados de treinamento de IA para promover a transparência na indústria de IA

Em um esforço para promover a transparência no campo da inteligência artificial (IA), a Computer & Communications Industry Association (CCIA) anunciou conjuntamente em Bruxelas e Washington uma nova iniciativa inovadora: um modelo global de relatório de transparência da indústria. Este modelo visa aumentar a confiança e a compreensão pública dos dados de treinamento de modelos de inteligência artificial generativa (GPAI). O 'Modelo de Transparência de Dados de Treinamento de IA' lançado exige que as empresas divulguem os tipos de dados usados para treinar modelos GPAI específicos, como podcasts, livros, etc., e também indiquem a principal origem dos dados.

Microsoft lança modelo generativo de IA Phi-4 com aprimoramentos em matemática e qualidade dos dados de treinamento

A Microsoft anunciou o mais novo membro da sua família de modelos generativos de IA Phi: o Phi-4. Em comparação com as versões anteriores, o Phi-4 apresenta melhorias em diversos aspectos, com destaque para a resolução de problemas matemáticos, graças a uma melhoria na qualidade dos dados de treinamento. Até quinta-feira à noite, o acesso ao Phi-4 era relativamente limitado, disponível apenas na plataforma de desenvolvimento Azure AI Foundry da Microsoft, e somente para fins de pesquisa sob contrato de pesquisa da Microsoft. Nota da imagem: Imagem gerada por IA, uso de imagem autorizado.