近期报道揭示了OpenAI进行的秘密研究项目Q*,被认为是迈向通用人工智能(AGI)的一大进步。首席科学家Ilya Sutskevar领导的项目引起了广泛关注,但随着进展,人工智能安全性引起担忧。Q*建立在Q-learning原理上,旨在找到最优策略以最大化累积奖励。