NEW

Apple Intelligence Foundation Language Models

Tom Gunter ,

Zirui Wang ,

Chong Wang ,

Ruoming Pang ,

Andy Narayanan ,

Aonan Zhang ,

Bowen Zhang ,

Chen Chen ,

Chung-Cheng Chiu ,

David Qiu ,

Deepak Gopinath ,

Dian Ang Yap ,

Dong Yin ,

Feng Nan ,

Floris Weers ,

Guoli Yin ,

Haoshuo Huang ,

Jianyu Wang ,

Jiarui Lu ,

John Peebles ,

Ke Ye ,

Mark Lee ,

Nan Du ,

Qibin Chen ,

Quentin Keunebroek ,

Sam Wiseman ,

Syd Evans ,

Tao Lei ,

Vivek Rathod ,

Xiang Kong ,

Xianzhi Du ,

Yanghao Li ,

Yongqiang Wang ,

Yuan Gao ,

Zaid Ahmed ,

Zhaoyang Xu ,

Zhiyun Lu ,

Al Rashid ,

Albin Madappally Jose ,

Alec Doane ,

Alfredo Bencomo ,

Allison Vanderby ,

Andrew Hansen ,

Ankur Jain ,

Anupama Mann Anupama ,

Areeba Kamal ,

Bugu Wu ,

Carolina Brum ,

Charlie Maalouf ,

Chinguun Erdenebileg ,

Chris Dulhanty ,

Dominik Moritz ,

Doug Kang ,

Eduardo Jimenez ,

Evan Ladd ,

Fangping Shi ,

Felix Bai ,

Frank Chu ,

Fred Hohman ,

Hadas Kotek ,

Hannah Gillis Coleman ,

Jane Li ,

Jeffrey Bigham ,

Jeffery Cao ,

Jeff Lai ,

Jessica Cheung ,

Jiulong Shan ,

Joe Zhou ,

John Li ,

Jun Qin ,

Karanjeet Singh ,

Karla Vega ,

Kelvin Zou ,

Laura Heckman ,

Lauren Gardiner ,

Margit Bowler ,

Maria Cordell ,

Meng Cao ,

Nicole Hay ,

Nilesh Shahdadpuri ,

Otto Godwin ,

Pranay Dighe ,

Pushyami Rachapudi ,

Ramsey Tantawi ,

Roman Frigg ,

Sam Davarnia ,

Sanskruti Shah ,

Saptarshi Guha ,

Sasha Sirovica ,

Shen Ma ,

Shuang Ma ,

Simon Wang ,

Sulgi Kim ,

Suma Jayaram ,

Vaishaal Shankar ,

Varsha Paidi ,

Vivek Kumar ,

Xin Wang ,

Xin Zheng ,

Walker Cheng ,

Yael Shrager ,

Yang Ye ,

Yasu Tanaka ,

Yihao Guo ,

Yunsong Meng ,

Zhao Tang Luo ,

Zhi Ouyang ,

Alp Aygar ,

Alvin Wan ,

Andrew Walkingshaw ,

Andy Narayanan ,

Antonie Lin ,

Arsalan Farooq ,

Brent Ramerth ,

Colorado Reed ,

Chris Bartels ,

Chris Chaney ,

David Riazati ,

Eric Liang Yang ,

Erin Feldman ,

Gabriel Hochstrasser ,

Guillaume Seguin ,

Irina Belousova ,

Joris Pelemans ,

Karen Yang ,

Keivan Alizadeh Vahid ,

Liangliang Cao ,

Mahyar Najibi ,

Marco Zuliani ,

Max Horton ,

Minsik Cho ,

Nikhil Bhendawade ,

Patrick Dong ,

Piotr Maj ,

Pulkit Agrawal ,

Qi Shan ,

Qichen Fu ,

Regan Poston ,

Sam Xu ,

Shuangning Liu ,

Sushma Rao ,

Tashweena Heeramun ,

Thomas Merth ,

Uday Rayala ,

Victor Cui ,

Vivek Rangarajan Sridhar ,

Wencong Zhang ,

Wenqi Zhang ,

Wentao Wu ,

Xingyu Zhou ,

Xinwen Liu ,

Yang Zhao ,

Yin Xia ,

Zhile Ren ,

Zhongzheng Ren

2024年07月29日

简介

我们提供了基础语言模型，用于支持苹果智能功能，其中包括一个约30亿参数的模型，旨在在设备上高效运行，以及一个大型基于服务器的语言模型，旨在用于私有云计算。这些模型旨在高效、准确、负责地执行各种任务。本报告描述了模型架构、用于训练模型的数据、训练过程、模型如何针对推理进行优化以及评估结果。我们强调了我们对负责任人工智能的关注，并介绍了这些原则在模型开发中的应用。
作者讲解·2
- 讲解视频
- 相关报道(2)
图表
解决问题

本论文旨在介绍Apple Intelligence功能所采用的基础语言模型，包括一个能在设备上高效运行的约30亿参数模型和一个专为私有云计算而设计的大型服务器语言模型。该论文试图解决如何在设备上高效地执行各种任务的问题。
关键思路

该论文的关键思路是通过开发高效、准确和负责任的语言模型来解决设备上执行各种任务的问题。
其它亮点

该论文介绍了模型的架构、训练数据、训练过程、推理优化以及评估结果。论文强调了负责任人工智能的重要性，并介绍了如何在模型开发过程中应用这些原则。此外，论文还介绍了实验设计、数据集和开源代码等方面的亮点。
相关研究

最近在这个领域中，还有一些相关研究正在进行，例如Google的BERT、OpenAI的GPT等。

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问