TinyLlama

Le projet TinyLlama vise à pré-entraîner un modèle Llama de 1,1 milliard de paramètres sur 3 000 milliards de jetons. Grâce à quelques optimisations appropriées, nous avons pu réaliser cela en seulement 90 jours avec 16 GPU A100-40G. L'entraînement a commencé le 1er septembre 2023.

Produit OrdinaireChatModèle pré-entraînéChat

Ouvrir le site Web

Le projet TinyLlama vise à pré-entraîner un modèle Llama de 1,1 milliard de paramètres sur 3 000 milliards de jetons. Grâce à quelques optimisations appropriées, nous avons pu le faire en seulement 90 jours avec 16 GPU A100-40G. L'entraînement a commencé le 1er septembre 2023. Nous avons utilisé la même architecture et le même tokeniseur que Llama 2. Cela signifie que TinyLlama peut être utilisé dans de nombreux projets open source basés sur Llama. De plus, avec seulement 1,1 milliard de paramètres, sa compacité répond aux besoins de nombreuses applications aux ressources de calcul et de mémoire limitées.

Best AI Websites & Tools

TinyLlama

TinyLlama Dernière situation du trafic

TinyLlama Tendance des visites

TinyLlama Distribution géographique des visites

TinyLlama Sources de trafic

TinyLlama Alternatives

EXAONE-3.5-7.8B-Instruct-AWQ — Modèle de génération bilingue développé par LG AI Research

EXAONE-3.5-2.4B-Instruct-AWQ — Modèle de génération de texte bilingue développé par LG AI Research

Llama-Lynx-70b-4bit-Quantized — Modèle de génération de texte quantifié de 7 milliards de paramètres

Llama-lynx-70b-4bitAWQ — Modèle de génération de texte de 7 milliards de paramètres

EXAONE-3.5-7.8B-Instruct — Modèle de génération multilingue développé par LG AI Research

EXAONE-3.5-2.4B-Instruct — Modèle de génération de texte bilingue développé par LG AI Research

EXAONE-3.5-7.8B-Instruct-GGUF — Modèle de génération bilingue (anglais et coréen) de 7,8 milliards de paramètres de la série EXAONE 3.5

Skywork-o1-Open-Llama-3.1-8B — Modèle d'IA avancé, spécialisé dans le raisonnement et la résolution de problèmes complexes.

QwQ-32B-Preview — Modèle de recherche expérimental développé par l'équipe Qwen, axé sur l'amélioration des capacités de raisonnement de l'IA.

Qwen2.5-Coder-0.5B-Instruct — Modèle de génération de code à 0,5 milliard de paramètres, optimisé par instructions, issu de la série Qwen2.5-Coder

Aya Expanse-8b — Modèle linguistique de grande taille multilingue, prenant en charge 23 langues

Aya Expanse 32B — Modèle linguistique multilingue de grande taille, prenant en charge 23 langues

EXAONE-3.0-7.8B-Instruct — Modèle de génération bilingue de 780 millions de paramètres

Index-1.9B-Pure — Modèle linguistique large léger, axé sur la génération de texte.

Assistant Tencent HunYuan — Un partenaire IA offrant une variété de services intelligents

Mixtral-8x22B — Un grand modèle linguistique basé sur un modèle d'experts clairsemés

Gemma-2b — Modèle linguistique pré-entraîné open source développé par Google

AIssistify — Assistant IA pour les ventes, le marketing et le RevOps

Syncia — Extension de navigateur permettant d'utiliser ChatGPT sur n'importe quel site web.

Rachel - Votre assistante IA ChatGPT — Assistante ChatGPT, répond à vos questions et fonctionne sur l'ensemble du web.

Générateur Firecrawl LLMs.txt — Outil de génération de fichiers texte intégrés à partir de sites Web pour l'entraînement et l'inférence des LLM

Duck.ai — Discutez anonymement avec des modèles d'intelligence artificielle populaires, protégez votre vie privée et prenez en charge plusieurs modèles d'IA.

OpenChat — Une application de chatbot IA full-stack moderne, prenant en charge le Web, les applications mobiles et les applications de bureau

QwQ-32B — QwQ-32B est un puissant modèle d'inférence, conçu pour la résolution de problèmes complexes et la génération de texte, avec des performances exceptionnelles.

Tolan App — Tolan : Alien Best Friend est une application sociale dont les fonctionnalités principales sont la discussion et l'accompagnement émotionnel.

botgroup.chat — Une application de conversation IA multi-utilisateurs basée sur React et Cloudflare Pages, prenant en charge la participation simultanée de plusieurs personnages IA à la conversation.

Monica.cn — Monica est un assistant polyvalent, un partenaire qui vous comprend et fournit un service de conversation intelligent.

olmOCR-7B-0225-preview — olmOCR-7B-0225-preview est un modèle de reconnaissance d'images de documents basé sur Qwen2-VL-7B-Instruct finement ajusté, conçu pour convertir efficacement les documents en texte brut.

Magma-8B — Magma-8B est un modèle d'IA multimodale développé par Microsoft, capable de traiter des entrées image et texte et de générer des sorties textuelles.