- 简介人工智能仅通过气味感知和识别各种物质的能力,可能对过敏原检测(例如,嗅出蛋糕中的麸质或花生)、监控制造过程以及感知反映情绪状态、压力水平和疾病的激素产生深远影响。然而,尽管这些应用具有广泛的影响,目前几乎不存在大规模的基准数据集,因此在训练和评估人工智能系统在现实世界中“嗅觉”能力方面的进展非常有限。在本文中,我们使用便携式气体和化学传感器创建了 SmellNet,这是第一个大规模数据库,数字化了自然界中多样化的气味。SmellNet 包含约 18 万个时间步长的数据,涵盖了 50 种物质(包括坚果、香料、草药、水果和蔬菜),总时长达 50 小时。利用 SmellNet,我们训练了人工智能模型,以实现实时基于气味的物质分类。我们的最佳方法结合了序列模型、对比学习技术,将高分辨率的气相色谱-质谱分子数据集成到模型中,并提出了一种新的时间差分方法,用于识别传感器读数中的剧烈变化。我们的最佳模型在预录数据上达到了最高 65.35% 的准确率,并在具有挑战性的 50 类在线分类任务中,分别在坚果和香料的现实条件下实现了 10.71% 和 25.38% 的准确率。尽管取得了这些令人鼓舞的结果,SmellNet 仍揭示了构建气味人工智能所面临的许多技术挑战,包括更丰富的特征学习、边缘设备上的气味模型开发,以及对环境变化的鲁棒性提升。
-
- 图表
- 解决问题该论文试图解决如何训练和评估AI系统在真实世界中通过气味识别物质的问题。这是一个新问题,因为尽管AI在视觉和听觉领域取得了显著进展,但在嗅觉领域的研究仍处于早期阶段,缺乏大规模基准数据集。
- 关键思路论文的关键思路是创建SmellNet——首个大规模的气味数据库,包含50种物质(如坚果、香料、水果等)的18万时间步数据。基于此数据集,论文提出结合序列模型、对比学习以及一种新的时间差分方法来捕捉传感器读数中的快速变化。这种方法不仅利用了高分辨率的气相色谱-质谱(GC-MS)分子数据,还尝试实现实时分类任务。
- 其它亮点论文设计了一个复杂的实验框架,包括离线分类任务(65.35%准确率)和在线分类任务(10.71%-25.38%准确率)。此外,SmellNet数据集为未来的研究提供了宝贵的资源,并开源了部分代码和数据。值得进一步研究的方向包括提高模型对环境变化的鲁棒性、开发适合边缘设备的轻量化模型以及探索更深层次的特征学习方法。
- 近期相关研究包括:1)《DeepScent: Learning to Predict Human Perceived Odor Intensity and Pleasantness》探讨了人类感知气味强度的预测;2)《Odor Classification Using Deep Learning with Electronic Nose Data》利用电子鼻数据进行气味分类;3)《Molecular Fingerprints Meet Machine Learning for Odor Prediction》结合分子指纹与机器学习预测气味特性。这些研究共同推动了AI嗅觉技术的发展,但SmellNet的独特之处在于其规模和多样性。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流