Command A: An Enterprise-Ready Large Language Model

Team Cohere ,

Aakanksha ,

Arash Ahmadian ,

Marwan Ahmed ,

Jay Alammar ,

Yazeed Alnumay ,

Sophia Althammer ,

Arkady Arkhangorodsky ,

Viraat Aryabumi ,

Dennis Aumiller ,

Raphaël Avalos ,

Zahara Aviv ,

Sammie Bae ,

Saurabh Baji ,

Alexandre Barbet ,

Max Bartolo ,

Björn Bebensee ,

Neeral Beladia ,

Walter Beller-Morales ,

Alexandre Bérard ,

Andrew Berneshawi ,

Anna Bialas ,

Phil Blunsom ,

Matt Bobkin ,

Adi Bongale ,

Sam Braun ,

Maxime Brunet ,

Samuel Cahyawijaya ,

David Cairuz ,

Jon Ander Campos ,

Cassie Cao ,

Kris Cao ,

Roman Castagné ,

Julián Cendrero ,

Leila Chan Currie ,

Yash Chandak ,

Diane Chang ,

Giannis Chatziveroglou ,

Hongyu Chen ,

Claire Cheng ,

Alexis Chevalier ,

Justin T. Chiu ,

Eugene Cho ,

Eugene Choi ,

Eujeong Choi ,

Tim Chung ,

Volkan Cirik ,

Ana Cismaru ,

Pierre Clavier ,

Henry Conklin ,

Lucas Crawhall-Stein ,

Devon Crouse ,

Andres Felipe Cruz-Salinas ,

Ben Cyrus ,

Daniel D'souza ,

Hugo Dalla-Torre ,

John Dang ,

William Darling ,

Omar Darwiche Domingues ,

Saurabh Dash ,

Antoine Debugne ,

Théo Dehaze ,

Shaan Desai ,

Joan Devassy ,

Rishit Dholakia ,

Kyle Duffy ,

Ali Edalati ,

Ace Eldeib ,

Abdullah Elkady ,

Sarah Elsharkawy ,

Irem Ergün ,

Beyza Ermis ,

Marzieh Fadaee ,

Boyu Fan ,

Lucas Fayoux ,

Yannis Flet-Berliac ,

Nick Frosst ,

Matthias Gallé ,

Wojciech Galuba ,

Utsav Garg ,

Matthieu Geist ,

Mohammad Gheshlaghi Azar ,

Seraphina Goldfarb-Tarrant ,

Tomas Goldsack ,

Aidan Gomez ,

Victor Machado Gonzaga ,

Nithya Govindarajan ,

Manoj Govindassamy ,

Nathan Grinsztajn ,

Nikolas Gritsch ,

Patrick Gu ,

Shangmin Guo ,

Kilian Haefeli ,

Rod Hajjar ,

Tim Hawes ,

Jingyi He ,

Sebastian Hofstätter ,

Sungjin Hong ,

Sara Hooker ,

Tom Hosking ,

Stephanie Howe ,

Eric Hu ,

Renjie Huang ,

Hemant Jain ,

Ritika Jain ,

Nick Jakobi ,

Madeline Jenkins ,

JJ Jordan ,

Dhruti Joshi ,

Jason Jung ,

Trushant Kalyanpur ,

Siddhartha Rao Kamalakara ,

Julia Kedrzycki ,

Gokce Keskin ,

Edward Kim ,

Joon Kim ,

Wei-Yin Ko ,

Tom Kocmi ,

Michael Kozakov ,

Wojciech Kryściński ,

Arnav Kumar Jain ,

Komal Kumar Teru ,

Sander Land ,

Michael Lasby ,

Olivia Lasche ,

Justin Lee ,

Patrick Lewis ,

Jeffrey Li ,

Jonathan Li ,

Hangyu Lin ,

Acyr Locatelli ,

Kevin Luong ,

Raymond Ma ,

Lukas Mach ,

Marina Machado ,

Joanne Magbitang ,

Brenda Malacara Lopez ,

Aryan Mann ,

Kelly Marchisio ,

Olivia Markham ,

Alexandre Matton ,

Alex McKinney ,

Dominic McLoughlin ,

Jozef Mokry ,

Adrien Morisot ,

Autumn Moulder ,

Harry Moynehan ,

Maximilian Mozes ,

Vivek Muppalla ,

Lidiya Murakhovska ,

Hemangani Nagarajan ,

Alekhya Nandula ,

Hisham Nasir ,

Shauna Nehra ,

Josh Netto-Rosen ,

Daniel Ohashi ,

James Owers-Bardsley ,

Jason Ozuzu ,

Dennis Padilla ,

Gloria Park ,

Sam Passaglia ,

Jeremy Pekmez ,

Laura Penstone ,

Aleksandra Piktus ,

Case Ploeg ,

Andrew Poulton ,

Youran Qi ,

Shubha Raghvendra ,

Miguel Ramos ,

Ekagra Ranjan ,

Pierre Richemond ,

Cécile Robert-Michon ,

Aurélien Rodriguez ,

Sudip Roy ,

Laura Ruis ,

Louise Rust ,

Anubhav Sachan ,

Alejandro Salamanca ,

Kailash Karthik Saravanakumar ,

Isha Satyakam ,

Alice Schoenauer Sebag ,

Priyanka Sen ,

Sholeh Sepehri ,

Preethi Seshadri ,

Ye Shen ,

Tom Sherborne ,

Sylvie Chang Shi ,

Sanal Shivaprasad ,

Vladyslav Shmyhlo ,

Anirudh Shrinivason ,

Inna Shteinbuk ,

Amir Shukayev ,

Mathieu Simard ,

Ella Snyder ,

Ava Spataru ,

Victoria Spooner ,

Trisha Starostina ,

Florian Strub ,

Yixuan Su ,

Jimin Sun ,

Dwarak Talupuru ,

Eugene Tarassov ,

Elena Tommasone ,

Jennifer Tracey ,

Billy Trend ,

Evren Tumer ,

Ahmet Üstün ,

Bharat Venkitesh ,

David Venuto ,

Pat Verga ,

Maxime Voisin ,

Alex Wang ,

Donglu Wang ,

Shijian Wang ,

Edmond Wen ,

Naomi White ,

Jesse Willman ,

Marysia Winkels ,

Chen Xia ,

Jessica Xie ,

Minjie Xu ,

Bowen Yang ,

Tan Yi-Chern ,

Ivan Zhang ,

Zhenyu Zhao ,

Zhoujie Zhao

热度 308

2025年04月01日

简介

在本报告中，我们介绍了Command A的开发过程，这是一种功能强大的大型语言模型，专为在实际企业应用场景中表现出色而设计。Command A 是一种针对代理任务优化且支持多语言的模型，涵盖23种全球商务语言，并采用了一种创新的混合架构，在效率和顶级性能之间实现了平衡。它提供了业界领先的基于检索的生成（RAG）能力，结合了接地技术和工具使用功能，能够自动化复杂的业务流程。这些能力是通过一种去中心化的训练方法实现的，其中包括自精化算法和模型融合技术。此外，我们还展示了与Command A在能力和架构上相似的Command R7B的相关结果。为了研究目的，这两种模型的权重均已公开发布。本技术报告详细描述了我们原创的训练管道，并对我们的模型在一系列与企业相关任务及公共基准测试中的表现进行了广泛评估，证明了其卓越的性能和效率。
图表
解决问题

该论文试图开发一个专为实际企业应用场景设计的强大语言模型Command A，以解决现有模型在多语言支持、效率与性能平衡以及复杂业务流程自动化方面的不足。这是一个具有实际应用价值的新问题，特别是在全球化和企业数字化转型的大背景下。
关键思路

论文的关键思路在于引入了一种混合架构，结合了高效性和顶级性能，并通过去中心化的训练方法（如自优化算法和模型合并技术）提升模型能力。此外，Command A集成了最佳的检索增强生成（RAG）功能，支持工具使用和多语言处理（23种全球商业语言）。相比当前研究，这种混合架构和去中心化训练方法是创新点，能够更好地适应企业需求。
其它亮点

论文展示了Command A及其相似模型Command R7B在一系列企业相关任务和公开基准测试中的卓越表现。实验设计涵盖了多种场景，包括自动化业务流程、多语言支持和工具集成等。模型权重已开源，供研究者进一步探索。未来值得深入研究的方向包括改进模型的自优化算法、扩展支持的语言种类以及探索更多实际业务场景的应用。
相关研究

近期相关研究包括：1)《Retrieval-Augmented Generation for Code Completion》探讨了RAG在代码补全中的应用；2)《Multilingual Language Models for Global Business》研究了多语言模型在商业环境中的表现；3)《Decentralized Training Strategies for Large Language Models》提出了大型语言模型的去中心化训练策略；4)《Efficient Architectures for Enterprise AI》讨论了适用于企业AI的高效架构设计。

PDF

原文

点赞收藏评论分享到Link

沙发等你来抢

去评论