- 简介准确预测组件故障发生的时间在维护计划中非常重要,而通过建模这些故障时间的分布,生存模型在这个领域中已经被证明特别有用。所提出的方法基于基于传统神经网络的生存模型,这些模型使用在特定时间连续收集和存储的数据进行训练,称为快照。这种类型的训练数据的一个重要特性是它可以包含来自特定个体的多个快照,这导致标准的最大似然训练不能直接应用,因为数据不是独立的。然而,论文表明,如果数据以特定格式呈现,即所有个体的所有快照时间相同,称为均匀采样,则可以应用最大似然训练并产生理想的结果。在许多情况下,数据并不是均匀采样的,在这种情况下,建议重新采样数据以使其均匀采样。数据集的密集程度是一个重要参数;它应该被选择足够大以产生良好的结果,但这也会增加数据集的大小,使训练变慢。为了减少训练中所需的样本数量,论文还提出了一种技术,即在训练开始时不是重新采样数据集一次,而是在每个时期开始时随机重新采样数据集。所提出的方法在模拟数据集和起动电池故障的实验数据集上进行评估。结果表明,如果数据是均匀采样的,该方法按预期工作并产生准确的生存模型。结果还表明,随机重新采样数据集是减少训练数据大小的有效方法。
- 图表
- 解决问题如何使用神经网络建立生存模型来预测组件失效时间?如何处理数据中的多个快照和非均匀采样问题?
- 关键思路使用神经网络建立生存模型,通过对数据进行重新采样或随机采样,解决多个快照和非均匀采样问题,从而使得最大似然估计可以应用于训练。
- 其它亮点论文提出的方法在模拟数据集和实验数据集上均取得了良好的效果。论文还提出了随机采样的方法来减少训练数据的大小。实验中使用了起动电池失效数据集,并开源了代码。
- 在生存分析领域,已有一些基于神经网络的方法,如DeepSurv和Cox-nnet。还有一些研究探索如何处理多个快照和非均匀采样问题,如Multi-Snapshot Cox Model和Non-Homogeneous Hidden Markov Model。
沙发等你来抢
去评论
评论
沙发等你来抢