用于健康和生物医学领域的机器学习的数据集通常是有噪声的,采样不规律,只有稀疏的标记,相对于数据和任务的维度都很小。这些问题推动了表示学习在这个领域的应用,它包含了各种技术,旨在产生适合下游建模任务的数据集表示。该领域的表示学习还可以利用生物医学领域的重要外部知识。在本文中,我将探索新的生物医学数据预训练和表示学习策略,这些策略利用外部结构或知识来为局部和全局尺度的学习提供信息。这些技术将在四章中进行探讨: (1)利用未标记数据来推断半监督学习环境中的分布约束; (2)在基因-基因共同调控网络上使用图卷积神经网络改进基因表达数据的建模; (3)将自然语言处理的预训练前技术应用于电子健康记录数据,并表明电子健康记录时序数据需要新的方法; (4)通过结构诱导的预训练前应用来断言预训练前应用的全局结构。
论文地址:https://dspace.mit.edu/handle/1721.1/144655
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢