3,803 讀數

直接偏好优化 (DPO):简化针对人类偏好的 AI 微调

by
2024/03/09
featured image - 直接偏好优化 (DPO):简化针对人类偏好的 AI 微调