每天 0 点更新数据,热度根据全网互动数计算
最热 · 今天
最新
Igniting Language Intelligence: The Hitchhiker's Guide From Chain-of-Thought Reasoning to Language Agents
Zhuosheng Zhang,
Yao Yao,
Aston Zhang
2023年11月20日
大型语言模型(LLMs)极大地增强了语言智能领域,其在各种复杂推理任务中的强大实证表现证明了这一点。此外,理论证明已经阐明了它们的新兴推理能力,提供了一个令人信服的展示,证明了它们在语言环境中的先进认知能力。在处理复杂推理任务方面,CoT推理技术对于LLMs的显著功效至关重要,因为它们必须制定中间步骤以便推导出答案。CoT推理方法不仅在增强推理性能方面表现出熟练的能力,而且在提高可解释性、可控性和灵活性方面也表现出了优异的能力。鉴于这些优点,最近的研究努力将CoT推理方法扩展到培养自主语言代理的发展,这些代理能够熟练地遵循语言指令并在不同环境中执行动作。本文梳理了一个全面的讨论,深入探讨了重要的研究维度,包括:(i)CoT技术的基础机制,重点阐述其功效的情况和理由;(ii)CoT的范式转变;以及(iii)由CoT方法强化的语言代理的兴起。未来的研究方向包括探索泛化、效率、定制、扩展和安全性。本文适合广泛的受众,包括寻求全面了解CoT推理和语言代理的初学者,以及对基础机制感兴趣并参与最前沿讨论的经验丰富的研究人员。相关论文的存储库可在https://github.com/Zoeyyao27/CoT-Igniting-Agent上找到。
23
热度
NLP
AI
CV
PDF
解读
Toward a Surgeon-in-the-Loop Ophthalmic Robotic Apprentice using Reinforcement and Imitation Learning
Amr Gomaa,
Bilal Mahdy,
Niko Kleer
2023年11月29日
机器人辅助手术系统已经展示了在提高手术精度和减少人为错误方面的显著潜力。然而,现有系统缺乏适应个别外科医生的独特偏好和要求的能力。此外,它们主要关注一般手术(例如腹腔镜手术),不适合高度精密的微创手术,例如眼科手术。因此,我们提出了一种基于仿真的图像引导方法,用于针对眼科白内障手术,能够适应个别外科医生的技能水平和首选手术技术的外科医生中心的自主代理。我们的方法利用模拟环境来训练受图像数据引导的强化和模仿学习代理,执行白内障手术切口阶段的所有任务。通过将外科医生的行动和偏好整合到外科医生参与的培训过程中,我们的方法使机器人能够通过演示隐式学习和适应个别外科医生的独特方法。这为外科医生提供了更直观和个性化的手术体验。同时,它确保了自主机器人学徒的一致性表现。我们使用我们提出的度量定义和评估我们的方法的有效性,并强调通用代理和外科医生中心的适应代理之间的权衡。此外,我们的方法具有扩展到其他眼科手术程序的潜力,为外科医生参与的自主手术机器人的新一代打开了大门。我们提供了一个开源仿真框架,以供未来开发和可重复性使用。
Rob
CV
HCI
PDF
解读