O Instituto de Inteligência Artificial de Pequim (BAAI), em colaboração com a Tolvers e a China Science Zhigu, construiu o "Corpus da Internet Chinesa" (CCI). Este corpus passou por um rigoroso processo de seleção e limpeza, com a primeira versão disponibilizando 104 GB de dados, cobrindo o período de 2001 a 2023. O BAAI afirmou que continuará expandindo as fontes de dados, aprimorando os processos de tratamento de dados e disponibilizando outros conjuntos de dados chineses de alta qualidade, como WUDAO corpora, COIG e MTP. Essa iniciativa visa fornecer recursos linguísticos seguros e confiáveis para os setores de big data e inteligência artificial.
Instituto de Inteligência Artificial de Pequim (BAAI) colabora na construção do CCI, um corpus da internet chinesa, fornecendo recursos para os setores de big data e inteligência artificial

站长之家
179
© Todos os direitos reservados AIbase Base 2024, clique para ver a fonte - https://www.aibase.com/pt/news/3677