
随着飓风菲奥娜于 2022 年 9 月 18 日在波多黎各登陆,成为 1 级风暴,该岛的一些地区被近 30 英寸的降雨淹没,数十万户家庭的电力中断。仅 10 天后,4 级风暴、有记录以来最强和最具破坏性的风暴之一伊恩飓风登陆佛罗里达州李县,将房屋夷为平地,淹没城市,然后沿海岸移动并再次以 1 级风暴登陆在南卡罗来纳州。
极端天气和自然灾害在美国及其领土上越来越频繁地发生。准确而详细的地图对于应急响应和恢复至关重要。
甚至在飓风登陆之前,联邦紧急事务管理局就与能源部橡树岭国家实验室的研究员 Lexie Yang 和她的团队合作,使用 USA Structures 预测潜在损害并加速现场响应,这是一个庞大的数据集。建筑轮廓和属性涵盖超过 1.25 亿个结构。
在过去的七年里,ORNL 地理空间科学和人类安全部门的研究人员绘制了美国及其领土内的所有结构图并对其进行了描述,以帮助 FEMA 应对灾害。该数据集提供了对人们居住和工作的建筑物的一致的、全国性的核算。
在 Fiona 登陆的同一天,该机构要求数据提供两个新属性:入住类型和地址,以及加快向家庭和企业提供联邦紧急资金的关键信息。
“我们在添加新数据时遇到了一些语言障碍。我们可用的有限信息是西班牙语。此外,记录波多黎各地址的方式有很多种。必须统一这些数据并验证归因信息对我们来说是一个独特的挑战,”杨说。
即使面临这样的挑战,Yang 的团队也能够在大约 50 小时内将新属性转换、验证和合并到 USA Structures 数据中。这是经过多年努力建立的可扩展信息管道和数据库的结果。 FEMA 开始使用可能受到影响的地区的基线 USA Structures 地图来规划其响应。随着灾难的展开,FEMA 工作人员添加了数据层,使该机构能够优先考虑对受灾最严重的地区做出响应。
“FEMA 拥有 GIS [地理信息系统] 分析师,他们获取我们的数据并将其与灾后卫星图像、航空图像和急救人员在现场收集的信息相结合,”ORNL 的人类动力学部门负责人 Carter Christopher 说地理空间科学和人类安全司。
现有的数据集与实时影响信息相结合,可以通过支持业主需要的损害评估来加速恢复,以便在几天而不是几周或几个月内获得重建资金。
“我们的团队非常自豪能够参与这个项目,”杨说。 “我们看到我们的技术能力和知识如何改变 FEMA 和当地利益相关者使用的数据集。”
USA Structures 始于 2015 年,当时 ORNL 前研究人员 Mark Tuttle 和 Melanie Laverdiere 正在开展 FEMA 项目,以绘制美国移动房屋公园的地图-风险结构。
该团队使用深度学习(机器学习的一个子集)来处理图像和编译数据。机器学习使用计算机检测大量数据中的模式,然后根据计算机从这些模式中学到的内容进行预测。在深度学习中,计算系统创建自己的算法,而不是使用人类开发和输入的算法。
国家移动房屋公园数据库编制完成后,FEMA 要求建立更全面的结构数据库。
该过程始于来自商业卫星图像提供商的高分辨率图像流和一些预处理。原始图像需要与实际的地形变化相匹配——一个称为正射校正的过程——并进行锐化以提高分辨率。该过程将图像从 2 到 3 米的空间分辨率提高到特征提取所需的 0.3 米。
空间分辨率与谷歌地图上的相似;几米大小的物品是人眼可以识别的。一旦准备好,图像就会进入由 ORNL 的科学计算和数据环境 (CADES) 中的 GPU 集群托管的特征提取管道,该管道为实验室范围内的研究人员提供高性能数据服务。
为了启动深度学习模型,科学家们为系统提供了一系列标记图像或训练数据来研究。作为一个深度神经网络,机器学习模型训练自己分析相似的输入。
迄今为止,超过 59,000 个代表广泛而多样的地理特征的训练示例已被纳入美国结构模型。随着团队开始研究一个新状态,除了之前状态的累积训练数据外,他们还使用新的、特定于区域的示例来准备训练集。
过去几年产量的增长来自于 ORNL 不断改进的硬件和计算能力、深度学习的进步以及为基于人工智能的模型提供信息的越来越多的训练数据。随着项目的推进,地图变得更加准确,需要的人工干预更少,处理图像所需的时间也越来越短。
卷积神经网络将人工需要多年的过程压缩到几分钟。迄今为止,该团队已经处理了 1.1 PB 的图像——拼接并描述了相当于 10 亿张数码照片的图像。
特征提取完成后,研究人员从商业地块数据供应商处获取信息,将土地利用信息直接与 USA Structures 建筑特征相结合。
“如果有这些额外的信息,可以使结构数据更加强大。那个广场是房子、仓库还是教堂?每一个对灾难都有不同的影响,”克里斯托弗说。
如果没有可靠的土地使用数据,该团队使用单独的机器学习模型来区分住宅和非住宅结构。结构还使用其他属性进行描述,例如唯一的建筑物标识符、平方英尺、经度和纬度。
“我们花了很多时间来验证我们交给 FEMA 的任何东西都是我们可以提供的最高质量,”杨说。
这个强大的开源数据集可从美国政府的 GeoPlatform 公开获得。此外,美国地质调查局已将数据添加到国家地图中,这是美国机构和合作伙伴之间的合作努力,以提供地形信息。 ORNL 团队希望对数据的开放访问将有助于学术机构的研究和小型市政机构的风险规划。
“许多农村县和小辖区可能没有预算来收集或购买此类数据,”克里斯托弗说。 “它可以被急救人员或基本服务提供商使用。它也可以应用于县级城镇规划或财产评估的需求。”
该项目的 ORNL 研究人员包括 Taylor Hauser、Benjamin Swan、Andrew Reith、Matthew Whitehead、Jessica Moehl、Erik Schmidt 和 贝内特莫里斯。其他贡献者包括 Brad Miller、Matthew Crockett 和 Katie Heying。
在项目的下一阶段,该团队希望为其他州填充两个关键属性——占用类型和地址,并处理洪水建模所需的高度和海拔信息。
建立一个可持续的流程来检测和整合随时间的变化将是延长数据集生命周期的关键。此外,这个强大的模型可用于世界各地的类似目的,用于灾害规划和响应,或与其他传感技术配对以提取其他有用信息。
杨在 FEMA 的项目合作伙伴 Chris Vaughan 一直是 USA Structures 的热心倡导者,推广其使用并宣传数据的一致方案和可访问性。
“灾难行动需要标准化且可访问的结构数据集,以帮助简化对幸存者的援助。 ORNL 在美国结构方面的工作帮助我们以前所未有的方式与我们的跨机构合作伙伴共享事件数据,”Vaughan 说。 “此外,他们正在帮助我们弥合与弱势群体相关的长期数据缺口,这是我们团队的首要任务。”
Yang 发现联邦机构、研究组织、地方政府和从业人员不仅对使用数据集,而且对贡献和整合来自较小地方项目的数据越来越感兴趣。
“这个项目仍在不断发展,我们预计将继续对当前数据进行重大更新,”她说。 “我们希望更多的社区能够使用这些数据。通过 FEMA 的工作已经证明它是有价值的,但可能还有其他更具影响力的应用程序。”
UT-Battelle 为能源部科学办公室管理 ORNL,该办公室是美国物理科学基础研究的最大支持者。科学办公室正在努力解决我们这个时代最紧迫的一些挑战
内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢