Qwen1.5-32B

Eine Serie von vorab trainierten Sprachmodellen basierend auf der Transformer-Architektur

Normales ProduktProduktivitätPretrainiertes ModellTransformer

Qwen1.5 ist eine Serie von Decoder-Sprachmodellen, die auf der Transformer-Architektur basieren und verschiedene Modellgrößen umfasst. Es zeichnet sich durch SwiGLU-Aktivierung, QKV-Bias in der Aufmerksamkeit und gruppierte Query-Aufmerksamkeit aus. Es unterstützt mehrere natürliche Sprachen und Code. Eine Weiterentwicklung durch Feinabstimmung (z.B. SFT, RLHF) wird empfohlen. Die Nutzung ist kostenlos.

Best AI Websites & Tools

Qwen1.5-32B

Qwen1.5-32B Neueste Verkehrssituation

Qwen1.5-32B Besuchstrend

Qwen1.5-32B Geografische Verteilung der Besuche

Qwen1.5-32B Traffic-Quellen

Qwen1.5-32B Alternativen

Qwen1.5-32B — Eine Serie von vorab trainierten Sprachmodellen basierend auf der Transformer-Architektur

OLMo 2 13B — Hochleistungsfähiges Sprachmodell für englischsprachige akademische Benchmarks

Lepton-Suche — Lepton ist eine Open-Source-Plattform zur Suche nach Sprachmodellen.

Mistral — Mistral ist ein Open-Source-Modell für die Verarbeitung natürlicher Sprache.

QwQ-32B — QwQ-32B ist ein leistungsstarkes Inferenzmodell, das speziell für die Lösung komplexer Probleme und die Textgenerierung entwickelt wurde und sich durch hervorragende Leistung auszeichnet.

ART — Eine Technik für einen anonymen Bereichstransformator zur Erzeugung variabler, mehrlagiger transparenter Bilder.

MoBA — MoBA ist ein hybrider Block-Aufmerksamkeitsmechanismus für lange Textkontexte, der die Effizienz von großen Sprachmodellen verbessern soll.

MakeAnything — MakeAnything ist ein Diffusions-Transformer-Modell für die programmatische Sequenzgenerierung in verschiedenen Bereichen.

Qwen2.5-1M — Open-Source Qwen-Modell mit Unterstützung für einen Kontext von bis zu 1 Million Tokens, ideal für die Verarbeitung langer Sequenzen.

Janus-Pro-1B — Janus-Pro-1B ist ein einheitliches, multimodales, autoregressives Framework für Verständnis und Generierung.

ViTPose — Sammlung von ViTPose-Modellen, basierend auf der Transformer-Architektur

ModernBERT-large — Hochperformantes bidirektionales Encoder-Transformer-Modell

ModernBERT — ModernBERT ist ein hochperformantes Encoder-Modell der neuen Generation.

Meta Llama 3.3 — Multilinguales großes Sprachmodell mit 70 Milliarden Parametern

Llama-3.3-70B-Instruct — 70 Milliarden Parameter umfassendes multilinguales großes Sprachmodell

Aria-Base-64K — Multimodales, natives Mixture-of-Experts-Modell

OLMo-2-1124-13B-DPO — Hochleistungsfähiges Sprachmodell für Englisch, geeignet für diverse Aufgaben.

Star-Attention — Effiziente Inferenztechnik für große Sprachmodelle mit langen Sequenzen

Qwen2.5-Coder-1.5B — 1,5 Milliarden Parameter großes Codegenerierungsmodell der Qwen2.5-Coder-Serie

Qwen2.5-Coder-3B — Ein 3B-Parameter-Modell der Qwen2.5-Coder-Serie, spezialisiert auf Codegenerierung und -verständnis.

Qwen2.5-Coder Technischer Bericht — Technischer Bericht zur Qwen2.5-Coder-Serie

MobileLLM-1B — Von Meta entwickeltes Sprachmodell mit unter einer Milliarde Parametern, geeignet für die Verwendung auf Geräten.

MobileLLM-600M — Hochoptimiertes Sprachmodell mit 600 Millionen Parametern, speziell für die Verwendung auf Geräten entwickelt.

MobileLLM-350M — Hochoptimiertes Sprachmodell mit weniger als einer Milliarde Parametern, speziell für die Verwendung auf Geräten entwickelt.

Oase — Ein KI-Modell für Echtzeit-Open-World-Umgebungen, basierend auf Transformer-Architektur

SLM_Survey — Untersuchung, Messung und Einblicke in kleine Sprachmodelle

ACE: Allrounder-Creator und -Editor nach Anweisungen via Diffusions-Transformer — Ein vielseitiger Creator und Editor, der Anweisungen über Diffusions-Transformationen befolgt.

Llama-3.2-1B — Multilinguales großes Sprachmodell

OpenCity — Open-Source-Modell für räumlich-zeitliche Grundlagen, angewendet auf Verkehrsvorhersagen

Bailing-TTS — Ein groß angelegtes Text-to-Speech-Modell (TTS) zur Erzeugung hochwertiger chinesischer Dialekt-Sprachausgabe.