AI for EDA是未来的发展趋势,国内外都处于研究起步阶段。由于训练机器学习模型需要大量数据,而在EDA领域中缺乏针对AI for EDA任务的开源数据集,导致大多数研究都只能制作小规模内部数据集来完成对方法的验证,难以充分验证机器学习模型的泛化能力,也无法充分利用不同数据集之间的知识迁移能力。

 

针对上述问题,北京大学黄如院士团队的林亦波研究员、王润声教授等创建了首个致力于芯片设计AI for EDA应用的开源数据集——CircuitNet,包含1万以上的数据样本,涵盖从实际制造工艺PDK下数字设计流程不同阶段中提取到的各类特征。

 

CircuitNet主要包含以下特性:

  • 大规模:包含1万以上的数据样本,每一份样本都来自于实际工艺PDK(目前是28nm工艺,未来将增加14nm工艺)一次完整的商业EDA工具设计流程(RTL-GDS)。

  • 多样性:在设计流程中引入了多组不同的参数设置,以覆盖实际设计中的不同情况与需求。

  • 多任务:数据集目前已支持3个预测任务,即绕线拥塞预测、设计规则违例预测和电压降预测,并通过复现近期的论文进行了验证。

  • 标准化:数据经过预处理和脱敏,保存为Numpy数组,可通过Python脚本直接加载。

 

以上数据主要来源于6个开源RISC-V芯片设计。整体流程和特征提取环节如下图所示。

数据集链接:https://circuitnet.github.io

内容中包含的图片若涉及版权问题,请及时与我们联系删除