活动
论文
风云榜
专栏
项目
社交
登录/注册
王维埙
订阅
1
订阅
link
github.com
个人博客
单位:
阿里巴巴 (Alibaba)
职位:
RLer
研究领域:
强化学习 多智能体
报告 220
工作经历
——— 暂无内容 ———
教育经历
——— 暂无内容 ———
个人简介
查看更多
I am currently a reinforcement learning researcher at Alibaba, where I focus on applying RL to enhance LLM reasoning capabilities and develop agentic AI systems. My research explores how reinforcement learning can improve the decision-making and problem-solving abilities of large language models in complex, multi-step tasks.
论文
最热
最热
最新
查看更多
主讲的活动 1
查看更多
报名的活动
查看更多
专栏
查看更多
动态
查看更多
授权同步在 link 的动态
授权