Model Agnostic Hybrid Sharding For Heterogeneous Distributed Inference

2024年07月29日
  • 简介
    大规模人工智能模型的快速增长,特别是大型语言模型,给数据隐私、计算资源和可访问性带来了重大挑战。传统的集中式架构通常难以满足所需的数据安全性和可扩展性需求,这阻碍了人工智能系统的民主化。Nesa引入了一个模型无关的分片框架,专为去中心化的人工智能推理设计。我们的框架使用基于区块链的顺序深度神经网络分片,根据个性化的启发式和路由机制,在各种节点的多样化网络上分配计算任务。这使得即使在消费级硬件上,最近的大规模模型也能进行高效的分布式训练和推理。我们使用压缩技术,如动态分块量化和混合矩阵分解,来减少数据传输和内存需求。我们还集成了强大的安全措施,包括基于硬件的可信执行环境,以确保数据的完整性和保密性。在各种自然语言处理和视觉任务中评估我们的系统表明,这些压缩策略不会影响模型的准确性。我们的结果突显了通过在去中心化网络上实现安全高效的推理,民主化接触尖端人工智能技术的潜力。
  • 图表
  • 解决问题
    解决问题:如何在分布式网络上进行安全高效的人工智能推理?
  • 关键思路
    关键思路:使用基于区块链的神经网络分片技术来实现分布式推理,并采用压缩技术和安全措施来提高效率和数据安全性。
  • 其它亮点
    亮点:实验结果表明,该系统可以在分布式网络上高效地进行人工智能推理,并且压缩技术不会影响模型的准确性。同时,该系统采用了硬件信任执行环境等安全措施来确保数据的完整性和保密性。
  • 相关研究
    相关研究:最近的相关研究包括基于区块链的分布式机器学习、分布式神经网络、模型压缩和安全推理等方向。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论