チューリングテスト

GPT-4はチューリングテストに失敗し、60年前のELIZAがChatGPTを上回りました。テストの結果、人間がチャットボットを正しく識別できたのはわずか63%でした。様々なモデルの性能を検証したこの研究は、チューリングテストの有効性に関する議論を巻き起こしています。