KI-Nachrichten

Verpassen Sie keinen Moment der globalen KI-Innovation

KI-Tagesübersicht

Tägliche Drei-Minuten-KI-Branchentrends

KI-Zeitleiste

Meilensteine der KI-Industrie

Al hardware

die artillerie der artillerie

KI-Monetarisierungs-Leitfaden

Neueste Fälle

KI-Monetarisierungsfall-Sharing

Bildersammlung

KI-Bilderstellungs-Monetarisierungsfälle

Videosammlung

KI-Videoerstellungs-Monetarisierungsfälle

Audiosammlung

KI-Audioerstellungs-Monetarisierungsfälle

Inhaltssammlung

KI-Content-Writing-Monetarisierungsfälle

KI-Tutorials

Neueste Tutorials

Kostenlose Weitergabe der neuesten KI-Tutorials

KI-Produkt-Rankings

KI-Produkt-Ranking

Zeigt das Ranking der Gesamtbesuche von KI-Websites

KI-Traffic-Wachstumsranking

Verfolgen Sie die am schnellsten wachsenden KI-Websites nach Traffic

KI-Traffic-Rückgangsranking

Konzentrieren Sie sich auf KI-Websites mit signifikanten Traffic-Einbrüchen

KI-Wochenranking

Zeigt das wöchentliche Besuchsranking von KI-Websites

Beliebte Länder-Rankings

Vereinigte Staaten

KI-Websites, die bei US-Nutzern am beliebtesten sind

China

KI-Websites, die bei chinesischen Nutzern am beliebtesten sind

Indien

KI-Websites, die bei indischen Nutzern am beliebtesten sind

Brasilien

KI-Websites, die bei brasilianischen Nutzern am beliebtesten sind

Beliebte Kategorie-Rankings

Bildgenerierung

Ranking der Gesamtbesuche von KI-Bildgenerierungs-Websites

Persönlicher Assistent

Ranking der Gesamtbesuche von KI-Websites für persönliche Assistenten

Charaktergenerierung

Ranking der Gesamtbesuche von KI-Websites zur Charaktergenerierung

Videogenerierung

Ranking der Gesamtbesuche von KI-Videogenerierungs-Websites

Beliebte Open-Source-Datenrankings

KI-Projektranking

GitHub beliebte KI-Projekte nach Gesamt-Stars

KI-Projektwachstumsranking

GitHub beliebte KI-Projekte nach Wachstumsrate

KI-Entwickler-Ranking

GitHub beliebtes KI-Entwickler-Ranking

KI-Organisationsranking

GitHub beliebtes KI-Organisationsranking

Beliebte Open-Source-Kategorien

Deepseek

GitHub beliebte Deepseek Open-Source-Projekte

TTS

GitHub beliebte TTS Open-Source-Projekte

LLM

GitHub beliebte LLM Open-Source-Projekte

ChatGPT

GitHub beliebte ChatGPT Open-Source-Projekte

KI-Open-Source-Projektbibliothek

Überblick

Überblick über GitHub beliebte KI-Open-Source-Projekte

Produktbibliothek Tool Navigation

OpenAI veröffentlicht detaillierten Bericht zum ChatGPT-Ausfall: Verursacht durch eine kleine Änderung

AIbase基地

Veröffentlicht amKI-Nachrichten und -Informationen · 5 Minuten Lesezeit · Dec 16, 2024

597

Am vergangenen Montag (11. Dezember) fielen die OpenAI-Dienste ChatGPT und Sora für 4 Stunden und 10 Minuten aus, was viele Nutzer betraf. Nun hat OpenAI einen detaillierten Bericht zum Ausfall veröffentlicht.

Kurz gesagt: Eine kleine Änderung hatte schwerwiegende Folgen. Die Ingenieure waren in der entscheidenden Phase vom Kontrollsystem ausgeschlossen und konnten das Problem nicht rechtzeitig beheben. Nach dem Auftreten des Problems leiteten die OpenAI-Ingenieure umgehend mehrere Reparaturmaßnahmen ein, darunter die Verkleinerung des Clusters, die Blockierung des Netzwerkzugriffs auf die Kubernetes-Management-API und die Erhöhung der Ressourcen des Kubernetes-API-Servers. Nach mehreren Versuchen erlangten die Ingenieure schließlich wieder Zugriff auf Teile der Kubernetes-Kontrollfläche und leiteten den Datenverkehr auf gesunde Cluster um, wodurch das System vollständig wiederhergestellt werden konnte.

Der Vorfall ereignete sich um 15:12 Uhr Pazifischer Standardzeit. Die Ingenieure hatten einen neuen Telemetrieservice zur Erfassung von Kubernetes (K8S)-Kontrollflächenmetriken bereitgestellt. Die Konfiguration dieses Dienstes war jedoch versehentlich zu weit gefasst, sodass auf jedem Knoten jedes Clusters gleichzeitig ressourcenintensive K8S-API-Operationen ausgeführt wurden. Dies führte schnell zum Absturz der API-Server, wodurch die meisten Cluster ihre K8S-Datenebene verloren.

Es ist erwähnenswert, dass die K8S-Datenebene zwar theoretisch unabhängig von der Kontrollfläche funktionieren kann, die DNS-Funktionalität jedoch von der Kontrollfläche abhängt, wodurch die Kommunikation zwischen den Diensten unterbrochen wurde. Bei Überlastung der API-Operationen wurde der Service-Discovery-Mechanismus beschädigt, was zum vollständigen Ausfall des Dienstes führte. Obwohl das Problem innerhalb von 3 Minuten lokalisiert wurde, führte der fehlende Zugriff der Ingenieure auf die Kontrollfläche zum Rollback des Dienstes zu einer Art „Teufelskreis“. Der Ausfall der Kontrollfläche verhinderte das Löschen des fehlerhaften Dienstes und damit die Wiederherstellung.

Die OpenAI-Ingenieure begannen daraufhin, verschiedene Methoden zur Wiederherstellung des Clusters zu untersuchen. Sie versuchten, die Clustergröße zu reduzieren, um die API-Last von K8S zu verringern, und blockierten den Zugriff auf die K8S-Management-API, damit sich die Server erholen konnten. Darüber hinaus erhöhten sie die Ressourcenzuweisung der K8S-API-Server, um Anfragen besser verarbeiten zu können. Nach einer Reihe von Versuchen erlangten die Ingenieure schließlich wieder die Kontrolle über die K8S-Kontrollfläche, konnten den fehlerhaften Dienst löschen und den Cluster schrittweise wiederherstellen.

In der Zwischenzeit leiteten die Ingenieure den Datenverkehr auf wiederhergestellte oder neu hinzugefügte gesunde Cluster um, um die Last auf anderen Clustern zu reduzieren. Da jedoch viele Dienste gleichzeitig wiederhergestellt werden wollten, führte dies zu einer Sättigung der Ressourcenbeschränkungen. Der Wiederherstellungsprozess erforderte zusätzliche manuelle Eingriffe, und die Wiederherstellung einiger Cluster dauerte länger. Durch diesen Vorfall kann OpenAI hoffentlich Lehren ziehen und vermeiden, in Zukunft wieder „ausgesperrt“ zu werden.

Detaillierter Bericht: https://status.openai.com/incidents/ctrsv3lwd797

Wichtigste Punkte:
🔧 Fehlerursache: Eine kleine Änderung am Telemetrieservice führte zu einer Überlastung der K8S-API und zum Ausfall des Dienstes.
🚪 Problem für die Ingenieure: Der Ausfall der Kontrollfläche verhinderte den Zugriff der Ingenieure und die Fehlerbehebung.
⏳ Wiederherstellungsprozess: Durch die Verkleinerung der Clustergröße und die Erhöhung der Ressourcen wurde der Dienst schließlich wiederhergestellt.

ChatGPT OpenAI Kubernetes Ausfall

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Willkommen im Bereich [KI-Tagesbericht]! Hier ist Ihr Leitfaden, um jeden Tag die Welt der künstlichen Intelligenz zu erkunden. Jeden Tag präsentieren wir Ihnen die Hotspots im KI-Bereich, konzentrieren uns auf Entwickler und helfen Ihnen, technologische Trends zu erkennen und innovative KI-Produktanwendungen zu verstehen.

—— Erstellt von der AIbase-Tagesberichtgruppe

Empfohlene verwandte KI-Nachrichten

Musks xAI veröffentlicht Grok 3 – Kostenlose Nutzung bis zum Serverausfall!

Am 20. Februar (Peking-Zeit) gab xAI, das von Elon Musk gegründete KI-Unternehmen, die kostenlose Freigabe seines neuesten Grok3-Modells bekannt. Nutzer können diese fortschrittliche KI-Technologie ohne Kosten nutzen, bis die Serverkapazität erschöpft ist. Dieser Schritt hat breite Aufmerksamkeit erregt, insbesondere im derzeit wettbewerbsintensiven KI-Markt. Die Einführung von Grok3 markiert einen weiteren wichtigen Fortschritt von xAI im Bereich der KI. Der Zugriff und die Nutzung dieses leistungsstarken KI-Tools ist nach der Anmeldung möglich.

Feb 20, 2025

7.3k

ChatGPT-Serverausfall: OpenAI arbeitet weiterhin an der Reparatur

Die KI-Dienste von OpenAI sind in der Nacht zum 27. Dezember (MEZ) ausgefallen, was sich auf den ChatGPT-Chatbot, das Sora-Videogenerierungsmodell und einige API-Aufrufe auswirkte. Um 6:05 Uhr morgens (MEZ) gab OpenAI bekannt, dass ChatGPT teilweise wieder funktioniert, die Chat-Verlaufsfunktion jedoch weiterhin eingeschränkt ist und der Zeitpunkt der vollständigen Wiederherstellung noch nicht feststeht.

Dec 27, 2024

2.7k

ChatGPT-Großausfall: 19.400 Nutzer betroffen

Am Freitagabend erlebte der beliebte Chatbot ChatGPT von OpenAI einen schwerwiegenden Ausfall, der Tausende von Nutzern betraf. Laut der Website Downdetector.com, die Ausfälle im Internet verfolgt, meldeten bis 19:13 Uhr Eastern Time über 19.400 Nutzer Probleme beim Zugriff auf den beliebten KI-Dienst. OpenAI reagierte schnell mit einer Erklärung, in der das Unternehmen den Ausfall bestätigte und erklärte, die Ursache zu untersuchen. Das Unternehmen gab an, dass...

Nov 9, 2024

2.3k

Diese Plugins machen Ihr ChatGPT 4.0 besser als Plus!

Entdecken Sie ein offizielles ChatGPT-Miniprogramm, mit dem Sie die chinesische Version von ChatGPT auf Ihrem Mobilgerät verwenden können – ohne VPN und ohne Registrierung. Wir empfehlen das KeepChatGPT-Plugin, um Netzwerkfehler und Unterbrechungen zu beheben. Die Plugins GPT-EZ und Voice Control bieten erweiterte Anpassungsmöglichkeiten und Spracherkennung.

Aug 21, 2023

520