亚马逊希望用户能够更好地评估人工智能模型,并鼓励更多人参与这一过程。AWS推出Bedrock上的模型评估,以评估其存储库中的模型。模型评估包括自动评估和人工评估两个部分,可以根据不同指标评估模型性能。AWS还提供人工评估团队与用户合作,检测到自动系统无法检测到的指标。重要的是模型要为客户工作,要知道哪个模型最适合他们,我们正在给他们一种更好地评估这一点的方法。