TinyLlama

Normales ProduktChattenVortrainiertes ModellChat

Das TinyLlama-Projekt zielt darauf ab, ein 1,1 Milliarden Parameter großes Llama-Modell mit 3 Billionen Tokens zu vortrainieren. Durch gezielte Optimierungen konnten wir dies mit 16 A100-40G GPUs in nur 90 Tagen erreichen. Das Training begann am 01.09.2023. Wir verwenden dieselbe Architektur und denselben Tokenizer wie Llama 2. Dies bedeutet, dass TinyLlama in vielen Open-Source-Projekten eingesetzt werden kann, die auf Llama basieren. Darüber hinaus verfügt TinyLlama nur über 1,1 Milliarden Parameter, seine Kompaktheit macht ihn ideal für Anwendungen mit begrenzten Rechen- und Speicherressourcen.

Best AI Websites & Tools

TinyLlama

TinyLlama Neueste Verkehrssituation

TinyLlama Besuchstrend

TinyLlama Geografische Verteilung der Besuche

TinyLlama Traffic-Quellen

TinyLlama Alternativen

TinyLlama — Das TinyLlama-Projekt zielt darauf ab, ein 1,1 Milliarden Parameter großes Llama-Modell mit 3 Billionen Tokens zu vortrainieren. Durch gezielte Optimierungen konnten wir dies mit 16 A100-40G GPUs in nur 90 Tagen erreichen. Das Training begann am 01.09.2023.

EXAONE-3.5-7.8B-Instruct-AWQ — Von LG AI Research entwickeltes zweisprachiges generatives Modell

EXAONE-3.5-2.4B-Instruct-AWQ — Von LG AI Research entwickeltes zweisprachiges Textgenerierungsmodell

Llama-Lynx-70b-4bit-Quantisiert — Ein quantisiertes Textgenerierungsmodell mit 70 Milliarden Parametern.

Llama-lynx-70b-4bitAWQ — Ein 70 Milliarden Parameter umfassendes Textgenerierungsmodell

EXAONE-3.5-7.8B-Instruct — Von LG AI Research entwickeltes mehrsprachiges generatives Modell

EXAONE-3.5-2.4B-Instruct — Von LG AI Research entwickeltes, zweisprachiges Textgenerierungsmodell

EXAONE-3.5-7.8B-Instruct-GGUF — 7,8B Parameter großes, zweisprachiges (Koreanisch und Englisch) generatives Modell der EXAONE 3.5-Serie.

OLMo-2-1124-13B-SFT — Erweitertes Textgenerierungsmodell

Skywork-o1-Open-Llama-3.1-8B — Hochentwickeltes KI-Modell, spezialisiert auf das Schließen und Lösen komplexer Probleme.

QwQ-32B-Preview — Experimentelles Forschungsmodell des Qwen-Teams, das sich auf die Verbesserung der KI-Schlussfolgerungsfähigkeiten konzentriert.

Llama-3.1-Tulu-3-8B-SFT — Ein hochentwickeltes Textgenerierungsmodell für diverse Aufgaben.

Aya Expanse-8b — Großes, mehrsprachiges Sprachmodell, unterstützt 23 Sprachen

Aya Expanse 32B — Großes, mehrsprachiges Sprachmodell, unterstützt 23 Sprachen

EXAONE-3.0-7.8B-Instruct — 7,8 Milliarden Parameter umfassendes bilinguales Sprachmodell

Index-1.9B-Pure — Leichtgewichtiges großes Sprachmodell, spezialisiert auf Textgenerierung.

Tencent Hun Yuan Assistent — KI-Partner, der diverse intelligente Dienste bietet

Mixtral-8x22B — Ein großes Sprachmodell auf Basis eines sparsamen Expertenmodells

Gemma-2b — Ein von Google herausgegebenes, quelloffenes vortrainiertes Sprachmodell

AIssistify — KI-Assistent für Vertrieb, Marketing und RevOps

Syncia — Browser-Erweiterung zur Nutzung von ChatGPT auf jeder Website

Rachel - Ihr ChatGPT KI-Assistent — ChatGPT-Assistent zur Beantwortung von Fragen und Erstellung von Texten – im gesamten Internet einsetzbar.

Firecrawl LLMs.txt Generator — Tool zur Generierung von Webseiten-zusammengeführten Textdateien für das Training und die Inferenz von LLMs

Duck.ai — Anonymes Chatten mit beliebten KI-Modellen, Datenschutz, Unterstützung mehrerer KI-Modelle.

QwQ-32B — QwQ-32B ist ein leistungsstarkes Inferenzmodell, das speziell für die Lösung komplexer Probleme und die Textgenerierung entwickelt wurde und sich durch hervorragende Leistung auszeichnet.

Tolan App — Tolan: Alien Best Friend ist eine Social-App, deren Kernfunktionen Chat und emotionale Begleitung sind.

botgroup.chat — Eine Multi-User-AI-Chat-Anwendung basierend auf React und Cloudflare Pages, die die gleichzeitige Teilnahme mehrerer AI-Charaktere an Gesprächen unterstützt.

Monica.cn — Monica ist ein Allzweck-Assistent, ein verständnisvoller Partner, der intelligente Dialogdienste bietet.

olmOCR-7B-0225-Vorschau — olmOCR-7B-0225-Vorschau ist ein auf Qwen2-VL-7B-Instruct feingetuntes Modell zur optischen Zeichenerkennung (OCR) von Dokumenten, das die effiziente Umwandlung von Dokumenten in reinen Text ermöglicht.

Magma-8B — Magma-8B ist ein von Microsoft entwickeltes multimodales KI-Modell, das Bild- und Texteingaben verarbeiten und Textausgaben generieren kann.