整理了4篇近期AI领域高质量论文,涵盖语言模型分析、自回归模型优化、在线学习算法及LLM智能体构建,核心内容如下:
1. Mapping 1,000+ Language Models via the Log-Likelihood Vector
- 核心目标:实现大规模自回归语言模型的高效比较
- 关键方法:采用预定义文本集上的对数似然向量作为模型特征,其平方欧几里得距离可近似文本生成概率的Kullback-Leibler散度
- 核心优势:计算成本随模型数量和文本样本线性增长,可扩展性强,且基于交叉熵损失易于实现
- 研究成果:构建了包含1000+模型的"模型地图",为大规模模型分析提供新视角
- 论文链接:https://arxiv.org/abs/2502.16173v1

2. Learning-Order Autoregressive Models with Application to Molecular Graph Generation
- 核心目标:解决非文本数据(如图结构)自回归生成的顺序定义问题
- 关键方法:引入"顺序策略"可训练概率分布,以状态依赖方式动态决定自回归顺序,通过变分下界优化精确对数似然
- 核心优势:能在图像和图生成任务中学习有意义的生成顺序,适配无明确标准顺序的数据类型
- 研究成果:在QM9和ZINC250k分子图生成基准测试中取得SOTA结果(基于FCD指标)
- 论文链接:https://arxiv.org/abs/2503.05979v1

3. Scalable Generalized Bayesian Online Neural Network Training for Sequential Decision Making
- 核心目标:提出适用于顺序决策任务的神经网络参数在线学习算法
- 关键方法:融合频率学派与贝叶斯滤波优势,通过块对角近似实现参数误差协方差的快速低秩更新,定义明确的后验预测分布
- 核心优势:支持全网络参数在线更新,无需回放缓冲区或离线再训练,兼顾速度与准确性
- 研究成果:在非平稳上下文多臂老虎机和贝叶斯优化任务中表现出竞争力
- 论文链接:https://arxiv.org/pdf/2506.11898v2.pdf

4. Fundamentals of Building Autonomous LLM Agents
- 核心目标:探索LLM智能体的架构设计与实现模式,缩小与人类能力的差距
- 关键组件:
- 感知系统:将环境感知转化为有效表示(支持文本、多模态、结构化数据等输入)
- 推理系统:通过思维链、思维树等技术制定计划,结合反思机制优化决策
- 记忆系统:整合短期上下文与长期存储(如RAG、SQL数据库)
- 执行系统:实现工具调用、API集成、多模态动作执行
- 核心优势:模块化设计模拟人类认知过程,提升复杂任务自动化能力与通用性
- 论文链接:https://arxiv.org/pdf/2510.09244v1.pdf

内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢