Ghostbuster ist ein modellunabhängiger Detektor zum Erkennen von mit künstlicher Intelligenz generierten Texten. Er analysiert Dokumente mithilfe einer Reihe schwächerer Sprachmodelle und führt eine strukturierte Suche nach möglichen Merkmalskombinationen durch. Anschließend trainiert er einen Klassifikator auf den ausgewählten Merkmalen, um zu bestimmen, ob das jeweilige Dokument von einer KI generiert wurde. Die Trainingsdaten von Ghostbuster umfassen Nachrichten, Schüleraufsätze und kreative Texte, repräsentieren jedoch nicht alle Schreibstile oder Themen und bestehen hauptsächlich aus Texten in britischem und amerikanischem Englisch.