斯坦福大学 | 大模型及其公平使用
【推荐理由】本文阐述了与大模型相关的最新版权、公平使用问题。【摘要】 现有的基础模型是使用受版权保护的材料进行训练的,可以使用受版权保护的内容构建基础模型而不会产生法律责任:公平使用原则可能不再适用于该模型的输出,可能需要额外的工作来确保模型开发和部署完全符合公平使用原则,作者调查了基于受版权保护的内容开发和部署基础模型可能面临的潜在风险,流行的基础模型可以生成与受版权保护的材料相当相似的内容。
大模型论文
苦行僧
2023-03-30 19:05 分享
18 0 0
斯坦福构建大模型生态系统图,用于跟踪大模型的足迹
大模型正在改变社会:包括GPT-4、Claude、PaLM API、Alpaca、Dolly、Jurassic-2、PaLM-E、GPT4All、Cerebras-GPT、OpenFlamingo等。斯坦福大学NLP组建立了生态系统图来跟踪它们的足迹。该系统提供了表格和图两种形式用于观察大模型的发展史。基础模型定义了一个不断壮大的数据集、模型和应用程序的生态系统。它们对社会的影响也在增加。
资源大模型
苦行僧
2023-03-30 16:53 分享
12 0 0
新加坡国立大学提出InceptionNeXt: 当Inception遇见ConvNeXt
加速神经架构设计的研究。【摘要】受到ViT长距离建模能力的启发。大卷积核被广泛研究和采用,以扩大感受野并提高模型性能,例如使用7×7深度卷积的ConvNeXt。虽然这种深度卷积算子只消耗少量的FLOPs,它在强大的计算设备上大大损害了模型效率。ConvNeXt-T在全精度A100 GPU上训练时与ResNet-50具有相似的FLOPs。虽然减小ConvNeXt的卷积核大小可以提高速度。
视觉论文
苦行僧
2023-03-30 15:59 分享
10 0 0
微软提出TaskMatrix.AI:通过连接基础模型和数百万个API来完成任务
允许人们通过其API将基础模型与各种现有系统和模型连接起来,随着基础模型、云服务、机器人和物联网技术和基础设施的快速发展,像ChatGPT这样的高级基础模型可以在广泛的开放领域任务上提供强大的对话、语境中学习和代码生成能力,为特定领域的任务生成高水平的解决方案纲要,也有许多现有的模型和系统(基于符号的或基于神经的)可以很好地完成一些特定领域的任务。能够利用基础模型提出任务解决大纲。
大模型
青石
2023-03-30 09:50 分享
10 2 0
KAUST | 文本引导图像编辑的通用框架
【推荐理由】使用扩散模型生成图像可以通过多种方式进行控制。包括中间潜在变量、条件嵌入、交叉注意力映射、引导和预测噪声。【论文链接】https:【摘要】使用扩散生成图像可以通过多种方式进行控制,作者系统地分析了现代生成扩散网络的方程。来解释适当操作的设计空间。作者确定了5种不同的操作。包括中间潜变量、条件嵌入、交叉注意力图、指导和预测噪声,文章分析了这些操纵的相应参数和操纵时间表。
视觉论文
苦行僧
2023-03-30 15:38 分享
10 0 0
大模型微调指南:当GPU资源不足时的有效解决方案
【推荐理由】本文系统地概述和比较了超过40篇在2019年2月至2023年2月期间发表的参数高效调整方法,是一份详细的微调指南。[UMass Lowell &:【论文链接】https。【摘要】本文系统地概述和比较了超过40篇在2019年2月至2023年2月期间发表的参数高效调整方法。这些方法旨在通过仅训练一小组参数来解决调整大型语言模型的不可行性和不实用性作者提供了一个涵盖广泛方法的分类法
大模型论文
苦行僧
2023-03-30 11:30 分享
9 1 0
直播
查看更多
热门榜单
  • 活动合作
  • 微信社群
社区指南 电话:(010) 6893 3383 © 2022 北京智源人工智能研究院 ICP备案号:京ICP备19012194号