MNBVC

MNBVC ist ein extrem umfangreicher chinesischer Korpus, vergleichbar mit den 40 TB Daten, mit denen ChatGPT trainiert wurde.

Normales ProduktOpen SourceVerarbeitung natürlicher SpracheChinesischer Korpus
MNBVC (Massive Never-ending BT Vast Chinese corpus) ist ein Projekt, das darauf abzielt, KI mit umfangreichen chinesischen Sprachdaten zu versorgen. Es umfasst nicht nur Inhalte der Mainstream-Kultur, sondern auch Nischenkultur und Internet-Slang. Der Datensatz beinhaltet verschiedene Formen rein textbasierter chinesischer Daten, darunter Nachrichten, Aufsätze, Romane, Bücher, Zeitschriften, wissenschaftliche Arbeiten, Dialoge, Beiträge, Wiki-Einträge, klassische Gedichte, Liedtexte, Produktbeschreibungen, Witze, peinliche Geschichten und Chatverläufe.
Website öffnen

MNBVC Neueste Verkehrssituation

Monatliche Gesamtbesuche

474564576

Absprungrate

36.20%

Durchschnittliche Seiten pro Besuch

6.1

Durchschnittliche Besuchsdauer

00:06:34

MNBVC Besuchstrend

MNBVC Geografische Verteilung der Besuche

MNBVC Traffic-Quellen

MNBVC Alternativen