Mit dem anhaltenden Hype um große Sprachmodelle wie ChatGPT könnte das Jahr 2026 einen Mangel an hochwertigen Trainingsdaten mit sich bringen. Um das Problem des unzureichenden Trainingsdatenbestands für die Entwicklung von GPT-5 zu lösen, hat OpenAI eine „Datenallianz“ gegründet, um private, sehr lange Texte, Videos und Audiodateien zu sammeln. Studien zeigen, dass hochwertige Trainingsdaten der Schlüssel zur Genauigkeit des Lernprozesses großer Sprachmodelle sind. Ein Mangel daran könnte zu einer Abnahme der Qualität der von der KI generierten Inhalte führen. Bis 2026 könnten die hochwertigen Trainingsdaten erschöpft sein, was die Weiterentwicklung der Funktionen großer Sprachmodelle herausfordern wird.