MNBVC

MNBVC est un corpus de langue chinoise extrêmement volumineux, comparable aux 40 To de données utilisées pour l'entraînement de ChatGPT.

Produit OrdinaireOpen SourceTraitement automatique du langage naturelCorpus de langue chinoise

Ouvrir le site Web

MNBVC (Massive Never-ending BT Vast Chinese corpus) est un projet visant à fournir aux IA un corpus riche en données textuelles chinoises. Il inclut non seulement des contenus culturels mainstream, mais aussi des contenus de niche et du langage internet. Le jeu de données comprend des textes de diverses formes : actualités, compositions, romans, livres, magazines, articles scientifiques, dialogues, publications, articles Wikipédia, poésie classique, paroles de chansons, descriptions de produits, blagues, anecdotes, conversations, etc., le tout sous forme de texte brut en chinois.

Best AI Websites & Tools

MNBVC

MNBVC Dernière situation du trafic

MNBVC Tendance des visites

MNBVC Distribution géographique des visites

MNBVC Sources de trafic

MNBVC Alternatives

MNBVC — MNBVC est un corpus de langue chinoise extrêmement volumineux, comparable aux 40 To de données utilisées pour l'entraînement de ChatGPT.

Distil-Whisper — Ensemble de modèles et de jeux de données

Epoch AI — Plateforme de recherche et d'analyse des tendances de l'IA

MiLM-6B — Modèle linguistique de grande taille pré-entraîné développé par Xiaomi, avec 6,4 milliards de paramètres.

Currents AI — Outil de recherche approfondie sur les médias sociaux basé sur l'IA, offrant des informations sur le marché en temps réel et une analyse des sentiments.

Aya Vision — Aya Vision est un modèle de vision multimodale et multilingue lancé par Cohere, visant à améliorer la compréhension visuelle et textuelle dans des scénarios multilingues.

Scira — Scira est un moteur de recherche minimaliste basé sur l'IA, qui aide les utilisateurs à trouver des informations sur Internet.

Modèles de traduction Firefox — Modèle de traduction automatique neuronale accéléré par CPU, optimisé pour la fonction de traduction du navigateur Firefox.

Shandu — Un système de recherche basé sur l'IA, capable d'utiliser plusieurs moteurs de recherche et LLM pour des recherches itératives complètes.

3FS — 3FS est un système de fichiers distribué hautes performances, spécialement conçu pour les charges de travail d'entraînement et d'inférence en IA.

Level-Navi Agent-Recherche — Level-Navi Agent est un framework prêt à l'emploi, sans nécessiter d'entraînement, qui utilise les grands modèles de langage pour une compréhension approfondie des requêtes et une recherche précise.

olmOCR — olmOCR est une boîte à outils permettant de linéariser des PDF pour l'entraînement d'ensembles de données de LLM.

MLGym — MLGym est un nouveau framework et une nouvelle référence pour faire progresser les agents de recherche en IA.

DeepResearch123 — Site de navigation de ressources de recherche sur l'IA, fournissant des ressources, de la documentation et des études de cas sur la recherche en IA.

Nemotron-CC — Convertit Common Crawl en un jeu de données d'entraînement pré-entraîné à long terme et hautement raffiné.

Heck.ai — Service ChatGPT en ligne 100% gratuit, prenant en charge la recherche IA et les discussions sans inscription.

Gemini-Search — Moteur de recherche IA de style Perplexity, basé sur le modèle Gemini 2.0 Flash.

Imitation avant Détection — Une méthode avancée pour détecter les textes modifiés par des machines, améliorant la précision de la détection en imitant le style des machines.

Bakery — Une plateforme en ligne open source d'ajustement fin et de monétisation de modèles d'IA, destinée aux startups d'IA, aux ingénieurs en apprentissage automatique et aux chercheurs.

vectrix-graphs — Une bibliothèque graphique pour les plongements multi-modèles, prenant en charge la visualisation de plusieurs modèles et types de données.

Interface Text-to-CAD — Création de fichiers CAO B-Rep et de maillages à partir d'invites en langage naturel

Zoo.dev — Logiciel de CAO pour la conception de matériel moderne

InternVL2_5-4B-MPO-AWQ — Modèle linguistique de grande taille multi-modal, optimisant les capacités d'interaction entre l'image et le texte.

Smolagents — Bibliothèque légère pour la construction d'agents intelligents performants

Gensmo — Recherche multimodale IA : transformez vos idées en résultats interactifs.

Extension Starfire — Recherche IA, traduction par surlignage, résumé de pages web : améliorez votre efficacité de lecture et de recherche.

Llama-lynx-70b-4bitAWQ — Modèle de génération de texte de 7 milliards de paramètres

Hika IA — Moteur de recherche IA gratuit pour une compréhension approfondie et une cartographie intelligente des connaissances

PromptWizard — Framework d'optimisation de prompts adaptatif aux tâches

Astris AI — Astris AI est une solution d'intelligence artificielle axée sur la sécurité, développée par Lockheed Martin.