人工反馈强化学习

白羽中 2023-09-23 03:46 分享

【人工反馈强化学习(ICML 2023 Tutorial)】《Reinforcement Learning from Human Feedback: A Tutorial * · SlidesLive》Nathan Lambert, Dmitry Ustalov