本文记录了组装深度学习工作站过程中的超详细操作流程,文章分为硬件、系统、DL开发环境配置以及工作站的维护,可供有类似需求的同学作为参考。
工作原因一直想配置一台自己的深度学习工作站服务器,之前自己看完paper想做一些实验或者复现模型的时候只能用自己的日常PC来跑很麻烦...一方面电脑得装双系统,干活的时候就不能用作其他用途了;另一方面,即使是没有使用流程的问题,GTX1080的性能也还是弱了一些,更何况我用的是一个A4迷你机箱,长时间高负载的训练任务也不太可靠。
以前在公司的时候还可以用公司的DGX训练集群做一些实验,但是我现在的开发环境已经切换到了昇腾的NPU架构芯片之上了,昇腾平台算力方面虽然是比肩甚至可以超越英伟达,但是目前暂时很多学术界的生态都还是基于GPU服务器的(主要是指开源代码),且我们这儿昇腾服务器对个人也不好买(且买不起),所以有一台这样的GPU工作站还是会方便一些。
那么本文是我在组装工作站过程中记录的详细操作流程,供有类似需求的同学参考~
查看原文请戳【原文链接】
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢