本文介绍了一种名为APIGen的自动数据生成流水线,旨在为函数调用应用程序合成可验证的高质量数据集。我们利用APIGen和21个不同类别的3,673个可执行API来以可扩展和结构化的方式生成多样化的函数调用数据集。我们的数据集中的每个数据都经过了三个层次的验证:格式检查、实际函数执行和语义验证,确保其可靠性和正确性。我们展示了使用我们精心策划的数据集训练的模型,即使只有7B个参数,也可以在Berkeley Function-Calling Benchmark上实现最先进的性能,优于多个GPT-4模型。此外,我们的1B模型表现出色,超越了GPT-3.5-Turbo和Claude-3 Haiku。我们发布了一个包含60,000个高质量条目的数据集,旨在推动函数调用代理领域的发展。该数据集可在Huggingface上获得:https://huggingface.co/datasets/Salesforce/xlam-function-calling-60k,以及项目主页:https://apigen-pipeline.github.io/。