4篇AI领域前沿论文速览，覆盖语言模型、自回归模型、在线学习与LLM智能体

PDF

新发现

你到这干嘛来了 2025-11-19 10:35 发布

整理了4篇近期AI领域高质量论文，涵盖语言模型分析、自回归模型优化、在线学习算法及LLM智能体构建，核心内容如下：

1. Mapping 1,000+ Language Models via the Log-Likelihood Vector

核心目标：实现大规模自回归语言模型的高效比较
关键方法：采用预定义文本集上的对数似然向量作为模型特征，其平方欧几里得距离可近似文本生成概率的Kullback-Leibler散度
核心优势：计算成本随模型数量和文本样本线性增长，可扩展性强，且基于交叉熵损失易于实现
研究成果：构建了包含1000+模型的"模型地图"，为大规模模型分析提供新视角
论文链接：https://arxiv.org/abs/2502.16173v1

2. Learning-Order Autoregressive Models with Application to Molecular Graph Generation

核心目标：解决非文本数据（如图结构）自回归生成的顺序定义问题
关键方法：引入"顺序策略"可训练概率分布，以状态依赖方式动态决定自回归顺序，通过变分下界优化精确对数似然
核心优势：能在图像和图生成任务中学习有意义的生成顺序，适配无明确标准顺序的数据类型
研究成果：在QM9和ZINC250k分子图生成基准测试中取得SOTA结果（基于FCD指标）
论文链接：https://arxiv.org/abs/2503.05979v1

3. Scalable Generalized Bayesian Online Neural Network Training for Sequential Decision Making

核心目标：提出适用于顺序决策任务的神经网络参数在线学习算法
关键方法：融合频率学派与贝叶斯滤波优势，通过块对角近似实现参数误差协方差的快速低秩更新，定义明确的后验预测分布
核心优势：支持全网络参数在线更新，无需回放缓冲区或离线再训练，兼顾速度与准确性
研究成果：在非平稳上下文多臂老虎机和贝叶斯优化任务中表现出竞争力
论文链接：https://arxiv.org/pdf/2506.11898v2.pdf

4. Fundamentals of Building Autonomous LLM Agents

核心目标：探索LLM智能体的架构设计与实现模式，缩小与人类能力的差距
关键组件：
- 感知系统：将环境感知转化为有效表示（支持文本、多模态、结构化数据等输入）
- 推理系统：通过思维链、思维树等技术制定计划，结合反思机制优化决策
- 记忆系统：整合短期上下文与长期存储（如RAG、SQL数据库）
- 执行系统：实现工具调用、API集成、多模态动作执行
核心优势：模块化设计模拟人类认知过程，提升复杂任务自动化能力与通用性
论文链接：https://arxiv.org/pdf/2510.09244v1.pdf

内容中包含的图片若涉及版权问题，请及时与我们联系删除

点赞收藏评论分享到Link

评论列表

沙发等你来抢

去评论