先日、FAR AI研究所のチームがGPT-4 APIにセキュリティ上の脆弱性があることを発見し、微調整と検索強化などの手法を用いて、この高度なモデルを「脱獄」することに成功しました。

研究者らは、GPT-4モデルに誤った情報を生成させたり、個人情報を抽出させたり、悪意のあるURLを挿入させたりすることに成功しました。この脆弱性は、API機能の拡張によって新たなセキュリティリスクが生じる可能性を示しており、利用者と研究者は注意深く対処する必要があります。