MNBVC
MNBVC ist ein extrem umfangreicher chinesischer Korpus, vergleichbar mit den 40 TB Daten, mit denen ChatGPT trainiert wurde.
Normales ProduktOpen SourceVerarbeitung natürlicher SpracheChinesischer Korpus
MNBVC (Massive Never-ending BT Vast Chinese corpus) ist ein Projekt, das darauf abzielt, KI mit umfangreichen chinesischen Sprachdaten zu versorgen. Es umfasst nicht nur Inhalte der Mainstream-Kultur, sondern auch Nischenkultur und Internet-Slang. Der Datensatz beinhaltet verschiedene Formen rein textbasierter chinesischer Daten, darunter Nachrichten, Aufsätze, Romane, Bücher, Zeitschriften, wissenschaftliche Arbeiten, Dialoge, Beiträge, Wiki-Einträge, klassische Gedichte, Liedtexte, Produktbeschreibungen, Witze, peinliche Geschichten und Chatverläufe.
MNBVC Neueste Verkehrssituation
Monatliche Gesamtbesuche
474564576
Absprungrate
36.20%
Durchschnittliche Seiten pro Besuch
6.1
Durchschnittliche Besuchsdauer
00:06:34