CMOSS: A Reliable, Motif-based Columnar Molecular Storage System

2024年05月27日
  • 简介
    需求成本效益高、耐久性强的长期存档介质的激增,再加上当代磁介质的密度限制,导致合成DNA成为一种有前途的新型替代品。尽管其有益之处,但将数据存储在DNA上也面临着一些挑战,因为用于读写数据和在DNA上实现随机访问的技术极易出错。为了应对这些错误,设计高效的流水线以谨慎地使用冗余来掩盖错误而不会增加总成本非常重要。在本文中,我们提出了一种新颖的端到端DNA存储流水线Columnar MOlecular Storage System(CMOSS),它可以提供低读写成本的容错数据存储。CMOSS在三个方面与SOTA不同:(i)基于模体的垂直布局,与SOTA使用的基于核苷酸的水平布局相反;(ii)由垂直布局实现的合并共识调用和解码;(iii)基于固定大小的块的数据组织,以实现对DNA存储的随机访问,与SOTA使用的基于对象的可变大小访问相反。通过模拟研究和真实湿实验的深入评估,我们展示了各种CMOSS设计选择的好处。我们将整个流水线以及读取数据集向社区公开,以进行忠实的复制和进一步的研究。
  • 作者讲解
  • 图表
  • 解决问题
    如何在DNA上实现低读写成本的容错数据存储?
  • 关键思路
    通过采用基于模体的纵向布局、合并一致性调用和解码以及固定大小的块状数据组织来设计一种新的DNA存储管道,即Columnar MOlecular Storage System (CMOSS),以实现低读写成本的容错数据存储。
  • 其它亮点
    CMOSS与当前最先进的DNA存储技术相比,具有三个不同之处:(i) 采用基于模体的纵向布局,而不是SOTA使用的基于核苷酸的横向布局;(ii) 通过纵向布局实现合并一致性调用和解码;(iii) 采用灵活的、固定大小的块状数据组织,以实现DNA存储的随机访问。
  • 相关研究
    近年来,DNA存储技术得到了广泛关注。相关研究包括:(i) DNA Fountain;(ii) DNA Sudoku;(iii) DNA Sticker;(iv) DNA Fountain Codes。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问