斯坦福提出FrugalGPT|性能媲美GPT4,成本降低98%
成本和准确性之间的平衡是决策制定的关键因素。从而实现成本和环境上的权衡,最近的一项研究尝试提出解决这一成本问题的方法,该研究概述并讨论了用户可以利用的三种策略来降低使用 LLM 的推理成本。该研究提出了级联 LLM 一个简单而灵活的实例 FrugalGPT。它学习在不同查询中使用哪些 LLM 组合以减少成本并提高准确性,这项研究提出的思想和发现为可持续高效地使用 LLM 奠定了基础。
大模型论文
白羽中
2023-06-05 14:40 分享
36 4 0
马毅团队新工作|突破黑盒,深度网络研究
这是马毅在伯克利的团队在理解深度学习深度网络方面的最新工作”希望这项工作能将深度学习的理论和实践真正结合在一起,由于经验设计的深度网络一直是不透明的黑盒子。我们认为表征学习的目标是压缩和转换数据的分布,使其成为支持在不连贯子空间上的低维高斯分布的混合物,最终表征的质量可以通过一个统一的目标函数来衡量,标准的变压器块可以从这个目标的互补部分的交替优化中得到。
机器学习
白羽中
2023-06-05 14:58 分享
31 1 0
Runway获得1亿美元D轮融资,谷歌领投
生成式AI平台Runway获得1亿美元D轮融资(约7亿元),谷歌投资Runway的最大原因之一是为了争夺云计算客户。Runway曾在4月底与谷歌签订了7500万美元的3年商业协议,同时Runway已从谷歌获得了价值2000万美元的云计算资源用于产品运营和研发。Gen-2是Runway在今年3月最新发布的,可以通过文本、图片、文本+图片直接生成视频,同时支持风格化和渲染添加好莱坞式大片特效。
资讯
白羽中
2023-06-05 16:40 分享
31 1 0
2023-06-05智源社区日报:智源大会多论坛日程公开、斯坦福FrugalGPT、Google Cloud Skills Boost、马毅深度网络研究、DAIR.AI发布提示工程最全列表
AI要事不错过:2023智源大会AI开源论坛https://baai.org/l/eC9xB智源大会多论坛日程公开:成本降低98%https://baai.org/l/27314:Google发布生成式AI教程《Google Cloud Skills Boost》https:马毅团队新工作|突破黑盒深度网络研究httpsDAIR.AI发布提示工程最全列表https
AI日报
智源AI日报
2023-06-05 16:16 分享
27 0 0
深度神经网络的一致收敛性:利普希茨连续激活函数和可变宽度的影响
本文考虑具有Lipschitz连续激活函数和可变宽度的深度神经网络。我们建立了一个统一的收敛分析框架,在其中提供了关于权重矩阵和偏置向量以及Lipschitz常数的充分条件,以确保随着层数趋近于无穷大,深度神经网络一致收敛于有意义的函数。在该框架中,我们提出了关于固定宽度、有界宽度和无界宽度的深度神经网络一致收敛的特殊结果。
论文
热门论文
2023-06-05 16:02 分享
26 0 0
GateON:一种用于大规模持续学习的无监督方法
GateON:一种用于大规模连续学习的无监督方法 马丁·巴里,吉约姆·贝勒克,沃尔弗拉姆·格斯特纳 连续学习(CL)的目标是在不重新对早期任务进行训练的情况下按顺序学习任务。然而,传统神经网络在接受CL时会出现灾难性遗忘和有限的泛化能力。为了解决这些问题,我们引入了一种新方法,称为“门控和障碍网络”(GateON)。GateON结合了可学习的活动门控和参数相关性的在线估计,以保护重要知识不被覆盖。
论文
热门论文
2023-06-05 15:57 分享
25 0 0
直播
查看更多
热门榜单
  • 活动合作
  • 微信社群
社区指南 电话:(010) 6893 3383 © 2022 北京智源人工智能研究院 ICP备案号:京ICP备19012194号