TOFU

Der TOFU-Datensatz dient als Benchmark für simulierte Vergessensaufgaben bei großen Sprachmodellen.

Normales ProduktProduktivitätSprachmodellVergessen

Der TOFU-Datensatz enthält Frage-Antwort-Paare, die auf Basis fiktiver, nicht existierender Autoren (200 Stück) generiert wurden. Er dient zur Bewertung der Vergessensleistung großer Sprachmodelle in realen Aufgaben. Ziel ist es, die Vergessenheit von feinabgestimmten Modellen bei unterschiedlichen Anteilen von Vergessenheitsmengen zu messen. Der Datensatz im Frage-Antwort-Format eignet sich besonders gut für gängige Chatbot-Modelle wie Llama2, Mistral oder Qwen. Er kann aber auch für alle anderen großen Sprachmodelle verwendet werden. Die zugehörige Codebasis ist für Llama2 Chat und Phi-1.5 Modelle geschrieben, lässt sich aber problemlos an andere Modelle anpassen.

Best AI Websites & Tools

TOFU

TOFU Neueste Verkehrssituation

TOFU Besuchstrend

TOFU Geografische Verteilung der Besuche

TOFU Traffic-Quellen

TOFU Alternativen

TOFU — Der TOFU-Datensatz dient als Benchmark für simulierte Vergessensaufgaben bei großen Sprachmodellen.

Mit Ihren Dokumenten chatten — Eine Python-Anwendung zur natürlichsprachigen Konversation mit Dokumenten.

Grok-2 — Spitzenmodell für Sprachmodelle mit fortschrittlichen Schlussfolgerungsfähigkeiten.

LMSYS Chatbot Arena — Online-Arena für Chatbots, die die Leistung verschiedener Sprachmodelle vergleicht.

Stable LM 2 1.6B — Stabiles Sprachmodell mit 160 Millionen Parametern

WikiChat — Unterdrückt Halluzinationen von Sprachmodellen mithilfe von Wikipedia-Daten

Starling-7B — Verbesserte Nutzbarkeit und Sicherheit für LLMs

SymeChat — Cloud-basierter KI-Chatbot-Dienst

TalkGPT — Intelligentes Sprachmodell für interaktive Dialoge.

Inception Labs — Inception Labs bringt eine neue Generation diffusionsbasierter Sprachmodelle auf den Markt und bietet extrem schnelle, effiziente und hochwertige Sprachgenerierung.

OpenManus — OpenManus ist ein Open-Source-Projekt für intelligente Agenten, das ohne Einladungscode verwendet werden kann.

Instella — Instella ist ein von AMD entwickeltes, leistungsstarkes Open-Source-Sprachmodell, das speziell für die Beschleunigung der Entwicklung von Open-Source-Sprachmodellen entwickelt wurde.

GPT-4.5 — Das neueste Sprachmodell GPT-4.5 von OpenAI konzentriert sich auf die Verbesserung der Fähigkeiten des unüberwachten Lernens und bietet ein natürlicheres interaktives Erlebnis.

Gemini 2.0 Flash-Lite — Gemini 2.0 Flash-Lite ist ein effizientes Sprachmodell, das speziell für die Verarbeitung langer Texte und verschiedene Anwendungsfälle optimiert wurde.

Phi-4-mini-instruct — Phi-4-mini-instruct ist ein leichtgewichtiges Open-Source-Sprachmodell, das sich auf hochwertige, inferenzintensive Daten konzentriert.

DeepSeek Japanisch — DeepSeek ist ein fortschrittliches KI-Sprachmodell, das sich auf logisches Denken, Mathematik und Programmieraufgaben spezialisiert hat und kostenlos nutzbar ist.

AlphaMaze — AlphaMaze ist ein Decoder-Sprachmodell, das sich auf visuelle Inferenzaufgaben konzentriert und die Schwächen traditioneller Sprachmodelle bei visuellen Aufgaben beheben soll.

Smithery — Erweitert die Fähigkeiten von Sprachmodellen über den Model Context Protocol Server.

Moonlight-16B-A3B — Moonlight-16B-A3B ist ein 16B-Parameter-Mix-Expertenmodell, das mit dem Muon-Optimierer trainiert wurde und für die effiziente Spracherzeugung entwickelt wurde.

DeepHermes-3-Llama-3-8B-Preview — DeepHermes 3 ist ein großes Sprachmodell, das sowohl Inferenz- als auch konventionelle Antwortmodi unterstützt.

Lora — Lora ist ein für mobile Geräte optimiertes lokales Sprachmodell, das iOS und Android unterstützt.

PaliGemma 2 Mix — PaliGemma 2 Mix ist ein vielseitiges visuell-sprachliches Modell für diverse Aufgaben und Bereiche.

Mistral Saba — Mistral Saba ist ein regionsspezifisches Sprachmodell, das speziell für den Nahen Osten und Südasien entwickelt wurde.

Next.js Chatbot-Vorlage — Eine Open-Source-Vorlage für einen KI-Chatbot, erstellt mit Next.js und dem AI SDK von Vercel.

OLMoE App — Ai2 OLMoE ist eine Open-Source-Anwendung für Sprachmodelle, die auf iOS-Geräten läuft.

DeepSeek Projekt — Ein multifunktionales Projekt zur Integration der DeepSeek API, einschließlich eines intelligenten Chatbots, Dateiverarbeitung und Modellbereitstellung.

Zyphra — Zyphra ist ein auf künstliche Intelligenz spezialisiertes Unternehmen, das Chatmodelle und zugehörige Dienste anbietet.

Podscript — Ein Tool zur Erstellung von Transkripten für Podcasts und andere Audiodateien, das verschiedene Sprachmodelle und Spracherkennungs-APIs unterstützt.

Chat Thing — Erstellen Sie mit Ihren Daten einen maßgeschneiderten KI-Chatbot und steigern Sie so die Effizienz Ihres Unternehmens.