每天 0 点更新数据,热度根据全网互动数计算
最热 · 今天
最新
Game-theoretic LLM: Agent Workflow for Negotiation Games
2024年11月08日
本文研究了大型语言模型(LLMs)在战略决策情境中的理性问题,特别是在博弈论框架下。我们评估了几种最先进的LLM在完全信息和不完全信息游戏中的表现。研究结果表明,随着游戏复杂度的增加(例如更大的收益矩阵或更深的序列树),LLM经常偏离理性策略。 为了解决这些局限性,我们设计了多个博弈论工作流程,以指导LLM的推理和决策过程。这些工作流程旨在提高模型计算纳什均衡和在不确定性及不完全信息条件下做出理性选择的能力。实验结果表明,采用这些工作流程显著提高了LLM在博弈论任务中的理性和稳健性。具体而言,在使用工作流程后,LLM在识别最优策略、实现接近最优的谈判分配以及减少谈判过程中被利用的可能性方面表现出显著改进。此外,我们还探讨了代理是否应采用这些工作流程的元战略考虑,认识到使用或放弃工作流程本身就是一个博弈论问题。 我们的研究加深了对LLM在战略情境中决策能力的理解,并提供了通过结构化工作流程增强其理性的见解。研究结果对于开发更稳健且战略上更为合理的AI代理具有重要意义,这些代理能够应对复杂的互动环境。支持本研究的代码和数据可在以下网址获取:\url{https://github.com/Wenyueh/game_theory}。
422
热度
PDF
解读
Applications of Entropy in Data Analysis and Machine Learning: A Review
2025年03月04日
自19世纪热力学中起源以来,熵的概念也渗透到了物理学和数学的其他领域,例如经典和量子统计力学、信息论、概率论、遍历理论以及动力系统理论。具体来说,我们指的是经典的熵:玻尔兹曼-吉布斯熵、冯·诺依曼熵、香农熵、柯尔莫哥洛夫-辛钦熵和拓扑熵。除了它们共同的名字在历史上有其合理性(我们在本文中简要描述)之外,这些经典熵的另一个共同点是它们在过去和现在在其各自领域及其以外的理论和应用中所发挥的重要作用。因此,随着时间的推移,提出了许多其他形式的广义熵概念,其中大多数是为了特定目的而量身定制的。按照当前的用法,我们将所有这些熵,无论是经典的还是新的,统称为熵。确切地说,本文综述的主题是它们在数据分析和机器学习中的应用。选择这些特定应用的原因在于,熵非常适合表征由有限状态过程或符号化信号生成的概率质量分布。因此,我们将专注于定义为概率质量分布上的正泛函的熵,并提供一个可以追溯到香农和欣钦的公理化特征。鉴于文献中存在大量的熵,我们选择了一组具有代表性的熵,包括经典熵。本文综述总结的应用充分展示了熵在数据分析和机器学习中的强大功能和灵活性。
258
热度
PDF
解读