LLM-Visualisierung
3D-Visualisierung eines GPT-artigen LLMs
Normales ProduktProduktivität3DGPT
Das LLM-Visualisierungsprojekt zeigt ein 3D-Modell eines GPT-artigen neuronalen Netzes. Das bedeutet die Netzwerktopologie, die in OpenAIs GPT-2, GPT-3 (und möglicherweise GPT-4) verwendet wird. Die erste Visualisierung eines Netzes mit den Arbeitsgewichten zeigt ein kleines Netzwerk, das eine kleine Liste sortiert, die aus den Buchstaben A, B und C besteht. Dies ist ein Beispielmodell aus Andrej Karpathys minGPT-Implementierung. Der Renderer unterstützt auch die Visualisierung von Netzen beliebiger Größe und funktioniert mit kleineren GPT-2-Modellen, obwohl die Gewichte nicht heruntergeladen werden (sie umfassen mehrere hundert MB). Das CPU-Simulations-Projekt führt eine 2D-Prinzip-Digitalstromkreissimulation aus und verfügt über einen vollständigen Editor. Geplant ist die Ergänzung von Tutorials, die zeigen, wie man:
* einen einfachen RISC-V-Prozessor baut;
* die Bestandteile bis hin zur Gatterebene (Instruktion Decode, ALU, Addition etc.) umsetzt;
* fortgeschrittene CPU-Konzepte wie Pipelining auf verschiedenen Ebenen und Caching behandelt.
LLM-Visualisierung Neueste Verkehrssituation
Monatliche Gesamtbesuche
474564576
Absprungrate
36.20%
Durchschnittliche Seiten pro Besuch
6.1
Durchschnittliche Besuchsdauer
00:06:34