每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣的消息,快来看看吧!🎉😍
时代周刊首次发布全球百大 AI 人物,其中有两位来自 Hugging Face 🤗:
Hugging Face 联合创始人& CEO: Clément Delangue 入选 领导者 Leader; Hugging Face AI 伦理与道德首席科学家: Margaret Mitchell 入选 思想家 Thinker。
为他们感到高兴 👏 也感谢每一位为开源社区做贡献的社区小伙伴,让开源成为全球 AI 领域的重要力量 ❤️
Hugging Face 的 ICCV 2023 专区开通了,专区在 ICCV 的官网同步上线 😎
✨ 参会者记得来专区认领你的论文 ✅ 还可以上传你的模型或者创建 demo,让社区内小伙伴来认识你和你的作品:
✨ ICCV 2023 将在巴黎举办,Hugging Face 会在现场有自己的展台,欢迎社区小伙伴来交流玩耍 🤗
如果你对建设 ICCV 专区有更好的想法💡或者对我们参展有任何建议,欢迎留言告诉我们 👏
为了与更多微博上的 Hugging Face 用户互动和交流,我们正式开通了 Hugging Face 官方微博账号。
欢迎关注并与我们互动:
Code Llama 是为代码类任务而生的一组最先进的、开放的 Llama 2 模型,我们很高兴能将其集成入 Hugging Face 生态系统!Code Llama 使用与 Llama 2 相同的社区许可证,且可商用。
我们很高兴能发布 Hugging Face 对 Code Llama 的全面支持 ,包括:
Hub 上的模型支持,包括模型卡及许可证 Transformers 已集成 Code Llama TGI 已集成 Code Llama,以支持对其进行快速高效的产品级推理 推理终端 (Inference Endpoints) 已集成 Code Llama 对 Code Llama 的代码基准测试结果已发布
代码大语言模型的发展对于软件工程师来说无疑是振奋人心的,因为这意味着他们可以通过 IDE 中的代码补全功能来提高生产力,并利用其来处理重复或烦人的任务,例如为代码编写文档字符串或创建单元测试。
由 TII 训练的开源大模型 Falcon 180B 🦅正式登陆 Hugging Face Hub 🤗
它在我们的开源大模型榜单上评分超过了 Meta 的 LlaMA 2,也因此被认为当前最好的开源大模型 🏅️
✨ 从架构来看,Falcon 180B 可以被看做是 Falcon 40B 的升级版本 🔍 并在其基础上进行了创新,比如利用 multiquery attention 等来提高模型的可扩展性。Falcon 180B 是使用 Amazon SageMaker 在多达 4096 个 GPU 上同时对 3.5 万亿个 token 进行训练,总共花费了约 7,000,000 个 GPU 时,这意味着 Falcon 180B 的规模是 Llama 2 的 2.5 倍,而训练所需的计算量是 Llama 2 的 4 倍。🧮
✨ 从能力来看,Falcon 180B 在 MMLU 上的表现超过了 Llama 2 70B 和 OpenAI 的 GPT-3.5 🚀 在 HellaSwag、LAMBADA、WebQuestions等上与谷歌的 PaLM 2-Large 不相上下 🧐
相关博客,模型和 demo 都已经在 Hub 上线 ⬇️
TII:
RefinedWeb:
模型:
Space 应用地址:
本期内容编辑: Shawn
以上就是本期的 Hugging News,新的一周开始了,我们一起加油!💪🎉
评论
沙发等你来抢